Existe-t-il des services connus pour valider un fichier CSV?

il y a aucune bonne sites / services pour valider la cohérence du fichier CSV ?

de La même façon que validateur W3C mais pour CSV?

27
demandé sur Ambo100 2011-07-19 00:27:15

5 réponses

Je suis tombé récemment sur Google Raffine - ce n'est pas un service pour valider les fichiers CSV, c'est un outil que vous téléchargez localement, mais il fournit beaucoup d'outils pour travailler avec les données et détecter les anomalies.

http://code.google.com/p/google-refine/

comme mentionné dans une réponse, "CSV" est devenu un terme mal défini, principalement parce que les gens ne suivent pas la seule vraie voie en utilisant le délimiteur séparé données

http://www.catb.org/~esr/writings/taoup/html/ch05s02.html

EDIT / UPDATE (2016-08-09):

CSV est en train de devenir un terme bien défini par le groupe de travail CSV du W3C

19
répondu Adrian 2016-08-09 14:35:11

L'Open Data Institute développe un service de validation CSV qui permettra aux utilisateurs de vérifier la structure de leurs données et de la valider par rapport à un schéma simple.

Le service est encore en alpha mais peut être trouvé ici:

http://csvlint.io/

le code de l'application et la bibliothèque sous-jacente sont tous les deux ouverts source:

https://github.com/theodi/csvlint

https://github.com/theodi/csvlint.rb

le README dans la bibliothèque fournit un résumé des erreurs et des avertissements qui peuvent être générés. Les types d'erreur suivants peuvent être signalés:

  • :wrong_content_type -- type de contenu n'est pas du texte/csv
  • :ragged_rows -- ligne a un nombre différent de colonnes de la première ligne dans le fichier)
  • :blank_rows -- ligne complètement vide, p. ex. ligne vide ou une ligne où toutes les valeurs de la colonne sont vides
  • :invalid_encoding -- erreur d'encodage lors de l'analyse de la ligne, p.ex. à cause de caractères invalides
  • :not_found -- erreur HTTP 404 lors de la récupération des données
  • :quoting -- problème avec le citer, par exemple, manquant ou errants, devis, unclosed cité de champ
  • :whitespace -- une colonne Citée est en tête ou en queue les espaces

les types d'avertissement suivants peuvent être signalés:

  • :no_encoding -- L'en-tête Content-Type retourné dans la requête HTTP N'a pas de paramètre charset
  • :encoding -- le jeu de caractères n'est pas de l'UTF-8
  • :no_content_type -- fichier est servi sans-tête Content-Type
  • :excel -- no-tête Content-Type et l'extension du fichier est .xls
  • :check_options -- le fichier CSV semble contenir une seule colonne
  • :inconsistent_values -- incompatible valeurs dans la même colonne. Déclaré Si < 90% des valeurs semblent avoir le même type de données (soit numériques ou alphanumériques incluant la ponctuation)
8
répondu ldodds 2014-02-11 17:55:42

pour valider un fichier CSV j'utilise l'extension RAINBOW CSV dans Visual Studio Code et j'ouvre aussi le fichier CSV dans Excel.

1
répondu mruanova 2018-02-15 16:18:56

les Archives nationales ont développé un langage de schéma CSV et validateur CSV, logiciel écrit en Java. Il est open source.

0
répondu Milos 2016-08-07 12:05:13