Stratégies de reconnaissance des noms propres dans le PnL
je suis intéressé à en apprendre davantage sur Traitement Du Langage Naturel (NLP) et suis curieux s'il y a actuellement des stratégies pour reconnaître les noms propres dans un texte qui ne sont pas basés sur la reconnaissance de dictionnaires? De plus, est-ce que quelqu'un pourrait expliquer ou créer un lien vers des ressources qui expliquent les méthodes actuelles basées sur des dictionnaires? Qui sont les experts faisant autorité en matière de NLP ou quelles sont les ressources définitives en la matière?
8 réponses
La tâche de déterminer la bonne partie du discours d'un mot dans un texte est appelé Partie du Discours de Marquage. Brill tagger, par exemple, utilise un mélange de mots dictionnaires(vocabulaire) et de règles contextuelles. Je crois que certains des premiers mots importants du dictionnaire pour cette tâche sont les mots d'arrêt. Une fois que vous avez (la plupart du temps correct) les parties de la parole pour vos mots, vous pouvez commencer à construire de plus grandes structures. Cette industrie orientée livre faire la différence entre reconnaître les phrases substantives (NPs) et reconnaître les entités nommées. Sur les manuels: la compréhension du langage naturel D'Allen est un bon, mais un peu daté, livre. fondements du traitement statistique du langage naturel est une bonne introduction à la NLP statistique. traitement de la parole et du langage c'est un peu plus rigoureux et peut-être plus d'autorité. the Association for Computational Linguistics