Questions sur nlp

18
réponses

Comment ça, "Google"?"L'algorithme fonctionne?

j'ai développé un site Web interne pour un outil de gestion de portefeuille. Il y a beaucoup de données textuelles, d ... frappe pour chaque terme "connu" ou "correct" et effectuer des recherches? une autre méthode plus élégante?
demandé sur 2008-11-21 02:34:51
7
réponses

Similitude entre deux documents textuels

j'envisage de travailler sur un projet NLP, dans n'importe quelle langue (bien que Python sera ma préférence). ... éférences (sites Web, manuels, articles de journaux) qui couvrent ce sujet et qui pourraient m'aider? Merci
nlp
demandé sur 2012-01-17 19:51:09
15
réponses

Détection de syllabes dans un mot

je dois trouver un moyen assez efficace de détecter les syllabes dans un mot. Par exemple, Invisible -> en-vi ... je travaille en Java, mais n'importe quel conseil en C/C++, C#, Python, Perl... pourrait fonctionner pour moi.
demandé sur 2009-01-01 20:08:41
17
réponses

Comment mettre en œuvre un"vous vouliez dire"? [dupliquer]

possibilité de dupliquer: comment ça, "Google"?"L'algorithme fonctionne? supp ... e le "vous voulez dire: <spell_checked_word> " comme Google fait dans certains requêtes de recherche ?
nlp
demandé sur 2008-09-03 14:36:13
2
réponses

Java ou Python pour le traitement du langage naturel [fermé]

j'aimerais savoir quel langage de programmation est le meilleur pour le traitement du langage naturel. Java ou ... différentes formes de publicité sur les mobiles ou Ordinateurs portables avec la langue anglaise pas très standard)
demandé sur 2014-04-07 09:08:47
20
réponses

Comment puis-je procéder à un écaillage de mots ou à une lemmatisation?

J'ai essayé PorterStemmer et boule de neige, mais les deux ne fonctionnent pas sur tous les mots, manquant certains tr ... e de bourrage qui produit des mots réels Découlant des exemples de code ou de projets open source?
demandé sur 2009-04-21 14:07:03
23
réponses

Comment puis-je préfixer correctement un mot avec "a" et "an"?

j'ai une application .NET où, avec un nom, je veux qu'il préfixe correctement ce mot avec" a "ou"an". Comment dois-je p ... e voyelle, considérez des phrases comme: une erreur de bonne foi "151950920 une" voiture d'occasion
demandé sur 2009-08-17 18:34:06
3
réponses

Est-il un bon traitement de la langue naturelle de la bibliothèque [fermé]

j'ai besoin de mettre en place une NLP dans mon module actuel. Je cherche une bonne bibliothèque qui pourrait m'aider ... n 151960920" s'il vous Plaît ne pas envoyer avant le mercredi ajouter 10 autres unités de XYZ à l'ordre
demandé sur 2009-05-15 23:39:21
17
réponses

Stanford Parser et NLTK

Est-il possible d'utiliser Stanford Parser en NLTK? (Je ne parle pas de Stanford POS.)
demandé sur 2012-12-14 21:12:20
11
réponses

Où puis-je en savoir plus sur L'algorithme de recherche Google "did you mean"? [dupliquer]

possibilité de dupliquer: comment mettre en œuvre un"vous vouliez dire"? j'éc ... e source disponible pour une telle chose ou Où puis-je trouver des articles qui m'aideraient à construire les miens?
demandé sur 2010-09-21 23:15:19
3
réponses

Stemmers vs Lemmatizers

Traitement du Langage Naturel (NLP), en particulier pour l'anglais, a évolué dans la scène où découlant de devenir arc ... ait-elle être facilement adaptée à d'autres langues qui ont des structures morphologiques similaires à l'anglais?
demandé sur 2013-06-26 14:19:01
4
réponses

Comment extraire des phrases communes / significatives d'une série d'entrées textuelles

j'ai une série d'éléments de texte - HTML brut à partir d'une base de données MySQL. Je veux trouver les phrases les p ... a semble être un problème assez commun et je n'ai pas été en mesure de trouver une solution simple en cherchant ici.
demandé sur 2010-03-16 11:42:38
4
réponses

Calculer la similarité cosinus à l'aide de 2 chaînes de phrases

à Partir de Python: tf-idf-cosinus: trouver de la ressemblance du document , il est possible de calculer la ress ... 1, s3) # Shouldn't give high cosine similarity value cosine_sim(s2, s3) # Shouldn't give high cosine similarity value
demandé sur 2013-03-02 14:06:29
10
réponses

comment vérifier si une chaîne, randomisée, ou d'origine humaine et pronouncable?

dans le but d'identifier les noms d'utilisateur générés par bot. supposons que vous ayez un nom d'utilisateur ... nçables à l'intérieur une chaîne comme celle-ci? Solutions applicables en PHP / MySQL les plus appréciées.
demandé sur 2009-07-22 13:48:14
6
réponses

Les données de formation pour l'analyse des sentiments [fermé]

Où puis-je obtenir un corpus de documents qui ont déjà été classés comme positifs/négatifs pour le sentiment dans le d ... corpus pour le domaine des affaires comprenant des revues d'entreprises, qui correspondent au langage des affaires?
demandé sur 2011-09-26 10:18:54
4
réponses

génération d'étiquettes à partir d'un contenu texte

je suis curieux de savoir s'il existe un algorithme/une méthode pour générer des mots-clés/Étiquettes à partir d'un te ... je vous serais reconnaissant si vous pointez une solution / bibliothèque basée sur Python pour cela. Merci
demandé sur 2010-04-18 13:39:23
4
réponses

Extraction/reconnaissance d'entités à l'aide d'outils gratuits lors de l'alimentation de L'Index de Lucène

je suis en train d'étudier les options pour extraire les noms de personnes, les emplacements, les mots techniques et l ... connaissance des entités Nommées Bibliothèques Java la reconnaissance des entités Nommées avec Java
demandé sur 2011-09-17 17:42:53
5
réponses

Algorithmes pour détecter des phrases et des mots-clés à partir de textes

j'ai environ 100 mégaoctets de texte, sans aucun balisage, divisé à environ 10.000 entrées. Je voudrais générer automa ... ite les informations relatives aux phrases de 2 et 3 mots sont présentes, mais comment puis-je extraire ces données?
demandé sur 2009-10-29 16:11:07
9
réponses

Apprentissage automatique et traitement du langage naturel [fermé]

supposons que vous connaissez un étudiant qui veut étudier L'apprentissage automatique et le traitement du langage nat ... ations de programme correction et raisonnement automatique. Introduction aux structures algébriques en informatique.
demandé sur 2010-02-10 02:54:05
10
réponses

Quels sont les bons points de départ pour quelqu'un qui s'intéresse au traitement du langage naturel? [fermé]

Question donc j'ai récemment proposé quelques nouveaux projets possibles qui devraient traiter de dériver le ... sur ici par moi, qui liste des tonnes de Données libres et ouvertes . Merci stackoverflow community!
demandé sur 2008-10-17 17:52:51
7
réponses

Analyse Non Supervisée Des Sentiments

j'ai lu beaucoup d'articles qui expliquent la nécessité d'un premier ensemble de textes qui sont classés comme étant s ... ureux" comme positif? Si oui, existe-il des articles qui traitent juste pourquoi ce la stratégie n'est pas réaliste?
demandé sur 2010-10-13 08:25:42
22
réponses

Code Golf: nombre de mots

la série de golf de code semble être assez populaire. J'ai trouvé un code qui convertit un nombre en ses mots. Quelq ... l'algorithme est la bienvenue. Il suffit de commenter avec le langage de programmation quant à la méthode utilisée.
demandé sur 2008-11-21 22:25:39
7
réponses

Comment détecter la langue du texte saisi par l'utilisateur? [fermé]

il s'agit d'une application qui accepte les entrées de l'utilisateur dans différentes langues (actuellement 3 langues ... r SI (et quelques autres): comment détecter la langue comment détecter la langue du texte?
demandé sur 2010-07-12 14:07:28
17
réponses

Remplacement des nombres ordinaux

je cherche actuellement le moyen de remplacer des mots comme premier, deuxième, troisième,...avec une représentation o ... lors y en a-t-il ou devrais-je écrire quelques expressions régulières manuellement? Merci pour tout conseil
demandé sur 2012-03-10 18:27:49
3
réponses

Un algorithme de bourrage qui produit des mots réels

je dois prendre un paragraphe de texte et en extraire une liste de"tags". La plupart de ces éléments sont assez simple ... pour éviter les doublons et puis choisir le mot le plus court que je rencontre pour être le mot réel à afficher.
demandé sur 2008-10-10 14:43:29
12
réponses

Un algorithme existent pour aider à détecter le "sujet principal" d'une phrase anglaise?

j'essaie de savoir si il existe un algorithme connu qui permet de détecter le "concept clé" d'une phrase. le ... ui va m'aider à identifier le thème principal d'une phrase... Laissez-moi savoir si vous êtes au courant de tout!!!
demandé sur 2011-04-05 01:19:15
6
réponses

Qu'est-ce qu'une bonne bibliothèque de filtres de profanation Python? [fermé]

Like https://stackoverflow.com/questions/1521646/best-profanity-filter , mais pour Python - et je suis à la reche ... iter les questions de contenu. J'aimerais juste trouver une bonne bibliothèque, et voir à quoi je peux m'en servir.)
demandé sur 2010-08-20 18:20:37
3
réponses

Qu'est-ce qu'une bonne bibliothèque Java pour le marquage des parties de la Parole? [fermé]

je suis à la recherche d'un bon open source POS Tagger en Java. Voici ce que j'ai mis au point jusqu'à présent. ... LingPipe Stanford LBJ FastTag Quelqu'un a des recommandations?
demandé sur 2010-02-19 05:08:41
5
réponses

Qu'est-ce que NLTK tagger POS me demande de télécharger?

je viens de commencer à utiliser un tagger de la partie de la parole, et je suis confronté à de nombreux problèmes. ... tings\Administrator\Application Data\nltk_data' j'ai utilisé nltk.download() mais cela n'a pas fonctionné.
demandé sur 2011-12-21 17:14:02
7
réponses

Algorithme des questions relatives au débordement de la pile

les questions connexes qui apparaissent après avoir entré le titre, et celles qui sont dans la barre latérale droite e ... t la recherche sur les mots-clés ou la recherche sur les étiquettes et ces questions avec beaucoup de votes en haut?
demandé sur 2009-05-21 11:26:47