preguntar acerca de text-processing

21
réponses

Comment puis-je extraire une plage prédéterminée de lignes d’un fichier texte sous Unix?

J'ai un vidage SQL de ligne ~ 23000 contenant plusieurs bases de données d'une valeur de données. J'ai besoin d'extraire une partie de ce fichier (c'est à dire les données d'une base de données unique) et le placer dans un nouveau fichier. Je connais …
demandé sur 1970-01-01 00:33:28
9
réponses

Ajouter un préfixe au début de chaque ligne

J'ai un fichier comme ci-dessous: line1 line2 line3 Et je veux obtenir: prefixline1 prefixline2 prefixline3 , je pourrais écrire un script Ruby, mais c'est mieux si je n'avez pas besoin. prefix contiendra /. C'est un chemin, /opt/workdir/, par …
demandé sur 1970-01-01 00:33:30
6
réponses

Algorithme pour la négation des phrases

je me demandais si quelqu'un connaissait les tentatives de négation de phrases algorithmiques. par exemple, si l'on donne une phrase comme "ce livre est bon", fournir un certain nombre de phrases alternatives qui signifient le contraire comme "ce li …
demandé sur 1970-01-01 00:33:30
2
réponses

Sélectionner des lignes aléatoires à partir d’un fichier dans bash [dupliquer]

cette question a déjà une réponse ici: Quelle est la meilleure façon de lire une ligne aléatoire à partir d'un fichier dans la ligne de commande Unix? 13 Réponses …
demandé sur 1970-01-01 00:33:32
14
réponses

Comment remplacer ${} emplacements dans un fichier texte?

je veux Piper la sortie d'un fichier" template "dans MySQL, le fichier ayant des variables comme ${dbName} intercalé. Quel est l'utilitaire en ligne de commande pour remplacer ces instances et transférer la sortie à la sortie standard? ... …
demandé sur 1970-01-01 00:33:29
6
réponses

Expansion des contractions de la langue anglaise en Python

La langue anglaise est un couple de contractions . Par exemple: you've -> you have he's -> he is ceux-ci peuvent parfois causer des maux de tête lorsque vous faites le traitement du langage naturel. Y a-t-il une bibliothèqu …
demandé sur 1970-01-01 00:33:33
7
réponses

Comment sélectionner plusieurs lignes à partir d’un fichier ou d’un tuyau dans un script?

j'aimerais avoir un script, appelé lines.sh que je peux tuyau de données pour sélectionner une série de lignes. Par exemple, si j'avais le fichier suivant: .txt a b c d alors je pourrais courir: cat tes …
demandé sur 1970-01-01 00:33:34
5
réponses

Algorithmes pour détecter des phrases et des mots-clés à partir de textes

j'ai environ 100 mégaoctets de texte, sans aucun balisage, divisé à environ 10.000 entrées. Je voudrais générer automatiquement une liste de' tags'. Le problème est qu'il y a des groupes de mots (c.-à-d. des phrases) qui n'ont de sens que lorsqu'ils …
demandé sur 1970-01-01 00:33:29