Lot pour trier un fichier en supprimant la ligne des doublons?
Si j'ai un fichier texte, je peux le trier par commande sort input.txt output.txt
. Puis-je également supprimer des lignes en double du fichier texte. (Idéalement, je voudrais une solution qui peut être faite dans un fichier batch sous Windows.)
C'est fondamentalement la même chose que de demander comment supprimer les doublons d'un fichier texte. (Car évidemment, je peux trier d'abord, puis utiliser un lot pour supprimer les doublons.) La raison pour laquelle j'ai également mentionné le tri est que je suppose qu'il est plus facile à supprimer doublons si nous savons que ce fichier est trié et qu'ils ne peuvent apparaître que sur des lignes consécutives. Je suppose donc qu'il est plus probable qu'il existe un moyen de supprimer les doublons avec le tri. (Et aux fins où je veux utiliser cet id n'a pas d'importance si l'ordre des lignes dans le fichier est modifié, tant que les lignes répétées sont supprimées.)
Par exemple à partir du fichier ressemblant à ceci :
100
100
100
100
101
101
102
Je voudrais obtenir
100
101
102