Comment créer un ensemble de données similaire à cifar-10
je veux créer un ensemble de données qui a le même format que l'ensemble de données cifar-10 à utiliser avec Tensorflow. Il devrait avoir des images et des étiquettes. En gros, j'aimerais pouvoir prendre le code cifar-10 mais des images et des étiquettes différentes, et lancer ce code. Je n'ai trouvé aucune information sur la façon de faire cela en ligne, et je suis complètement nouveau à l'apprentissage machine.
3 réponses
j'ai réussi à lancer le code CIFAR10 sur quelques-uns de mes propres ensembles de données. Je pense que je devrais pouvoir vous donner une bonne réponse.
avant de faire cela cependant, nous devons comprendre le format dans lequel l'ensemble de données CIFAR10 est. Si nous nous référons à: https://www.cs.toronto.edu/~kriz/cifar.html, et plus précisément, la Version Binaire section, nous voyons ceci:
En d'autres termes, le premier octet est le nom de la première image, qui c'est un nombre dans la gamme de 0 à 9. Les 3072 octets suivants sont les valeurs de les pixels de l'image. Les premiers 1024 octets sont le canal rouge valeurs, le prochain 1024 le vert, et le dernier 1024 le bleu. Le les valeurs sont stockées en ligne ordre majeur, de sorte que les 32 premiers octets sont les canal rouge les valeurs de la première ligne de l'image.
Intuitivement, nous avons besoin de stocker les données dans ce format. Ce que vous pouvez faire ensuite comme une sorte d'expérience de base d'abord, est d'obtenir des images qui sont exactement les mêmes taille et même nombre de classes que CIFAR10 et mettez-les dans ce format. Cela signifie que vos images devraient avoir une taille de 32x32x3 et avoir 10 classes. Si vous pouvez l'exécuter avec succès, alors vous pouvez aller plus loin dans les cas de facteurs comme les canaux simples, les entrées de taille différente, et les différentes classes. Cela signifie que vous devez changer de nombreuses variables dans les autres parties du code. Vous devez travailler lentement votre chemin à travers.
je suis en train d'élaborer un module général. Mon code for this is in https://github.com/jkschin/svhn