Quels sont les caractères de contrôle du séparateur de fichier/groupe/enregistrement/unité et son utilisation?

Unicode définit plusieurs caractères de contrôle de ASCII. http://www.unicode.org/charts/PDF/U0000.pdf

je vois que de nombreux caractères de contrôle sont largement utilisés, mais je ne vois vraiment pas où les "séparateurs d'information" sont utilisés. (U+001C~U+001F)

Quels sont-ils? Quelle est l'histoire? Où ont-ils utilisé?

28
demandé sur Eonil 2012-01-01 23:50:27

2 réponses

Lammert Bies explique à la fois leur utilisation et l'histoire derrière.

28 – FS – séparateur de fichier le fichier séparateur FS est un contrôle intéressant code, car il nous donne un aperçu dans le la façon dont la technologie informatique était organisé dans les années soixante. Nous sommes maintenant utilisé pour les médias d'accès aléatoire comme la RAM et des disques magnétiques, mais quand les ASCII la norme a été définie, la plupart des données ont été série. Je ne parle pas seulement d' les communications en série, mais aussi sur stockage en série comme cartes perforées, Papier et de bande magnétique. Dans un tel situation, il est clairement efficace pour avoir un seul code de contrôle pour signaler la séparation de deux dossiers. Le FS a été défini à cet effet.

29 – GS – séparateur de groupe Le stockage de données était un parmi les principales raisons d'un certain contrôle codes pour entrer dans la définition ASCII. Les bases de données sont la plupart du temps d'installation avec des tables, contenant des enregistrements. Tout les enregistrements dans un tableau ont le même type, mais enregistrements de différentes tables peuvent être différentes. Le séparateur de groupe Le SG est défini pour séparer les tableaux dans un de série système de stockage de données. Notez que la table des mots n'a pas été utilisée. le moment et le peuple ASCII l'ont appelé groupe.

30 – RS – séparateur D'enregistrement Au sein d'un groupe (ou un tableau) les dossiers sont séparés avec RS ou record séparateur.

31 – séparateur D'unités – É. - U. Les plus petits éléments de données à stocker dans une base de données sont appelés les unités dans le Définition ASCII. Nous les appellerions le terrain maintenant. Le séparateur d'unité sépare ces champs dans une série environnement de stockage de données. Le plus courant base de données des implémentations exiger que les champs de la plupart des types ont un fixe longueur. Assez d'espace dans le dossier est allouée pour stocker le plus grand membre de chaque champ, même si ce n'est pas nécessaire dans la plupart des cas. Cela coûte une grande quantité d'espace dans beaucoup de situations. Le code de contrôle américain permet à tous les champs d'avoir variable longueur. Si l'espace de stockage de données est limitée-comme dans les années soixante-c'est un bon moyen de préserver un espace précieux. Sur l'autre main de série est le stockage beaucoup moins efficace que la table les implémentations de la mémoire vive et du disque à l'époque moderne. Je ne peux pas imaginer un situation où les bases de données SQL modernes sont exécutés avec les données stockées sur le papier bande ou bobines magnétiques...

un séparateur D'unité pourrait fournir essentiellement le même but qu'une virgule dans un fichier CSV ou un onglet dans un fichier délimité par des tabulations.

38
répondu Jonas Elfström 2014-04-08 19:32:14

Avez-vous dire que la plupart d'entre eux sont généralement pas utilisés de nos jours? Les caractères de contrôle se rapportent principalement aux fonctions de contrôle du périphérique, mais certains d'entre eux peuvent avoir été utilisés comme séparateurs dans les fichiers texte. Pour une référence rapide, vérifier mon tableau de C0 Contrôles.

les séparateurs d'information ont été utilisés pour grouper les données d'une manière simple, mais de nos jours, les formats binaires ou XML sont utilisés pour l'organisation des données. Il y a encore des curiosités, comme L'utilisation interne de U+001E et U+001F dans Microsoft Word pour mettre en œuvre la propre idée du programme de "trait d'Union Non révolutionnaire" et "trait d'Union optionnel" (à l'opposé des caractères Unicode pour des buts similaires). Cela montre principalement que les programmes peuvent utiliser des caractères de contrôle de manière étrange. Des problèmes surgissent bien sûr si les caractères sont inclus dans le texte transmis à d'autres programmes.

7
répondu Jukka K. Korpela 2012-01-01 20:11:54