Questions sur nlp

18
réponses

Comment ça, "Google"?"L'algorithme fonctionne?

j'ai développé un site Web interne pour un outil de gestion de portefeuille. Il y a beaucoup de données textuelles, d ... frappe pour chaque terme "connu" ou "correct" et effectuer des recherches? une autre méthode plus élégante?
demandé sur 2008-11-21 02:34:51
7
réponses

Similitude entre deux documents textuels

j'envisage de travailler sur un projet NLP, dans n'importe quelle langue (bien que Python sera ma préférence). ... éférences (sites Web, manuels, articles de journaux) qui couvrent ce sujet et qui pourraient m'aider? Merci
nlp
demandé sur 2012-01-17 19:51:09
15
réponses

Détection de syllabes dans un mot

je dois trouver un moyen assez efficace de détecter les syllabes dans un mot. Par exemple, Invisible -> en-vi ... je travaille en Java, mais n'importe quel conseil en C/C++, C#, Python, Perl... pourrait fonctionner pour moi.
demandé sur 2009-01-01 20:08:41
17
réponses

Comment mettre en œuvre un"vous vouliez dire"? [dupliquer]

possibilité de dupliquer: comment ça, "Google"?"L'algorithme fonctionne? supp ... e le "vous voulez dire: <spell_checked_word> " comme Google fait dans certains requêtes de recherche ?
nlp
demandé sur 2008-09-03 14:36:13
2
réponses

Java ou Python pour le traitement du langage naturel [fermé]

j'aimerais savoir quel langage de programmation est le meilleur pour le traitement du langage naturel. Java ou ... différentes formes de publicité sur les mobiles ou Ordinateurs portables avec la langue anglaise pas très standard)
demandé sur 2014-04-07 09:08:47
20
réponses

Comment puis-je procéder à un écaillage de mots ou à une lemmatisation?

J'ai essayé PorterStemmer et boule de neige, mais les deux ne fonctionnent pas sur tous les mots, manquant certains tr ... e de bourrage qui produit des mots réels Découlant des exemples de code ou de projets open source?
demandé sur 2009-04-21 14:07:03
23
réponses

Comment puis-je préfixer correctement un mot avec "a" et "an"?

j'ai une application .NET où, avec un nom, je veux qu'il préfixe correctement ce mot avec" a "ou"an". Comment dois-je p ... e voyelle, considérez des phrases comme: une erreur de bonne foi "151950920 une" voiture d'occasion
demandé sur 2009-08-17 18:34:06
3
réponses

Est-il un bon traitement de la langue naturelle de la bibliothèque [fermé]

j'ai besoin de mettre en place une NLP dans mon module actuel. Je cherche une bonne bibliothèque qui pourrait m'aider ... n 151960920" s'il vous Plaît ne pas envoyer avant le mercredi ajouter 10 autres unités de XYZ à l'ordre
demandé sur 2009-05-15 23:39:21
17
réponses

Stanford Parser et NLTK

Est-il possible d'utiliser Stanford Parser en NLTK? (Je ne parle pas de Stanford POS.)
demandé sur 2012-12-14 21:12:20
11
réponses

Où puis-je en savoir plus sur L'algorithme de recherche Google "did you mean"? [dupliquer]

possibilité de dupliquer: comment mettre en œuvre un"vous vouliez dire"? j'éc ... e source disponible pour une telle chose ou Où puis-je trouver des articles qui m'aideraient à construire les miens?
demandé sur 2010-09-21 23:15:19
3
réponses

Stemmers vs Lemmatizers

Traitement du Langage Naturel (NLP), en particulier pour l'anglais, a évolué dans la scène où découlant de devenir arc ... ait-elle être facilement adaptée à d'autres langues qui ont des structures morphologiques similaires à l'anglais?
demandé sur 2013-06-26 14:19:01
4
réponses

Comment extraire des phrases communes / significatives d'une série d'entrées textuelles

j'ai une série d'éléments de texte - HTML brut à partir d'une base de données MySQL. Je veux trouver les phrases les p ... a semble être un problème assez commun et je n'ai pas été en mesure de trouver une solution simple en cherchant ici.
demandé sur 2010-03-16 11:42:38
4
réponses

Calculer la similarité cosinus à l'aide de 2 chaînes de phrases

à Partir de Python: tf-idf-cosinus: trouver de la ressemblance du document , il est possible de calculer la ress ... 1, s3) # Shouldn't give high cosine similarity value cosine_sim(s2, s3) # Shouldn't give high cosine similarity value
demandé sur 2013-03-02 14:06:29
10
réponses

comment vérifier si une chaîne, randomisée, ou d'origine humaine et pronouncable?

dans le but d'identifier les noms d'utilisateur générés par bot. supposons que vous ayez un nom d'utilisateur ... nçables à l'intérieur une chaîne comme celle-ci? Solutions applicables en PHP / MySQL les plus appréciées.
demandé sur 2009-07-22 13:48:14
6
réponses

Les données de formation pour l'analyse des sentiments [fermé]

Où puis-je obtenir un corpus de documents qui ont déjà été classés comme positifs/négatifs pour le sentiment dans le d ... corpus pour le domaine des affaires comprenant des revues d'entreprises, qui correspondent au langage des affaires?
demandé sur 2011-09-26 10:18:54
5
réponses

Comment une phrase ou un document peut-il être converti en vecteur?

nous avons des modèles pour convertir des mots en vecteurs (par exemple le modèle word2vec). Existe-t-il des modèles simil ... i convertissent des phrases/documents en vecteurs, en utilisant peut-être les vecteurs appris pour les mots individuels?
demandé sur 2015-06-12 08:36:56
2
réponses

Recherche sémantique avec NLP et elasticsearch

j'expérimente avec elasticsearch comme serveur de recherche et ma tâche est de construire une fonctionnalité de recherche ... de mon tâche à accomplir, classification des textes? Si le texte est très court car il est une expression de recherche.
demandé sur 2012-01-08 00:08:53
1
réponses

Quelles sont les principales différences et quels sont les avantages des algorithmes de bourrage de Porter et de Lancaster? [fermé]

je travaille sur des tâches de classification de documents en java. les deux algorithmes ont été fortement recommandés, ... s de chacun et qui est le plus couramment utilisé dans la littérature pour les tâches de traitement du langage naturel?
demandé sur 2012-05-11 19:10:15
4
réponses

Extraction/reconnaissance d'entités à l'aide d'outils gratuits lors de l'alimentation de L'Index de Lucène

je suis en train d'étudier les options pour extraire les noms de personnes, les emplacements, les mots techniques et l ... connaissance des entités Nommées Bibliothèques Java la reconnaissance des entités Nommées avec Java
demandé sur 2011-09-17 17:42:53
4
réponses

génération d'étiquettes à partir d'un contenu texte

je suis curieux de savoir s'il existe un algorithme/une méthode pour générer des mots-clés/Étiquettes à partir d'un te ... je vous serais reconnaissant si vous pointez une solution / bibliothèque basée sur Python pour cela. Merci
demandé sur 2010-04-18 13:39:23
4
réponses

Sélection et réduction des fonctions pour la Classification des textes

je suis actuellement en train de travailler sur un projet, un simple sentiment de l'analyseur tel qu'il y aura 2 et 3 clas ... modèles sphériques caractéristique réduction de la dimension spatiale méthodes (LDA, LSI, moVMF etc.) et clustering méthodes
demandé sur 2012-11-28 15:21:59
9
réponses

Apprentissage automatique et traitement du langage naturel [fermé]

supposons que vous connaissez un étudiant qui veut étudier L'apprentissage automatique et le traitement du langage nat ... ations de programme correction et raisonnement automatique. Introduction aux structures algébriques en informatique.
demandé sur 2010-02-10 02:54:05
10
réponses

Quels sont les bons points de départ pour quelqu'un qui s'intéresse au traitement du langage naturel? [fermé]

Question donc j'ai récemment proposé quelques nouveaux projets possibles qui devraient traiter de dériver le ... sur ici par moi, qui liste des tonnes de Données libres et ouvertes . Merci stackoverflow community!
demandé sur 2008-10-17 17:52:51
5
réponses

Algorithmes pour détecter des phrases et des mots-clés à partir de textes

j'ai environ 100 mégaoctets de texte, sans aucun balisage, divisé à environ 10.000 entrées. Je voudrais générer automa ... ite les informations relatives aux phrases de 2 et 3 mots sont présentes, mais comment puis-je extraire ces données?
demandé sur 2009-10-29 16:11:07
7
réponses

Analyse Non Supervisée Des Sentiments

j'ai lu beaucoup d'articles qui expliquent la nécessité d'un premier ensemble de textes qui sont classés comme étant s ... ureux" comme positif? Si oui, existe-il des articles qui traitent juste pourquoi ce la stratégie n'est pas réaliste?
demandé sur 2010-10-13 08:25:42
1
réponses

Qu'est-ce que le format de données CoNLL?

je suis nouveau dans l'exploration de texte. J'utilise un jar open source (Mate Parser) qui me donne la sortie dans un fo ... Est-ce que quelqu'un peut m'aider à comprendre le format des données de CoNLL?? Tout type de pointeurs serait appréciée.
demandé sur 2014-12-11 08:45:51
5
réponses

Quelle est la différence entre le marquage POS et L'analyse superficielle?

je suis actuellement en train de suivre un cours de traitement du langage naturel à mon université et je suis encore conf ... arquage POS? Est-ce que le parsing superficiel est souvent aussi appelé le Parsing sémantique superficiel? Merci avant.
demandé sur 2012-01-25 11:07:11
1
réponses

Comment connecter les commandes Cortana aux scripts personnalisés?

c'est peut-être un peu tôt pour poser cette question, mais je lance Windows 10 Technical Preview Build 10122. J'aimerais c ... était au-delà de mon entendement, alors j'ai décidé de la détailler un peu plus pour les futurs utilisateurs comme moi.
demandé sur 0000-00-00 00:00:00
8
réponses

Comment partager plusieurs mots joints?

j'ai un tableau de 1000 entrées, avec des exemples ci-dessous: wickedweather liquidweather driveourtrucks gocompact slimp ... re fait à la main, mais pourquoi - quand il peut être fait avec code! =) Mais ce qui a déconcerté les moi. Des idées?
demandé sur 2008-10-12 06:37:19
22
réponses

Code Golf: nombre de mots

la série de golf de code semble être assez populaire. J'ai trouvé un code qui convertit un nombre en ses mots. Quelq ... l'algorithme est la bienvenue. Il suffit de commenter avec le langage de programmation quant à la méthode utilisée.
demandé sur 2008-11-21 22:25:39