Comment fonctionne Shazam ou Sound Hound? [fermé]
je développe un iOS application SDK pour iOS 5.0 et Xcode 4.2.
je veux développer une application qui reconnaisse les sons. Je vois qu'il y a une application appelée Son Chien qui reconnaissent la musique et raconte l'artiste et le titre.
Comment puis-je faire quelque chose de similaire? Je veux comparer un son à une base de données sonore existante. Comment puis-je le faire?
Peut-être que je peux utiliser Transformée De Fourier. Je ne savent pas comment traiter les sons. Ou ça pourrait être similaire à la reconnaissance vocale, n'est-ce pas?
3 réponses
bonne liens sur la page wikipedia inclure: http://www.soyoucode.com/2011/how-does-shazam-recognize-song et le papier http://www.ee.columbia.edu/~dpwe/documents/Wang03-shazam.pdf Sub_stantial noté plus haut
Shazam Application est l'un des meilleurs exemples pour L'Application dans les données ouvertes liées il prend la musique d'échantillon courte de l'utilisateur final et identifie la chanson des ensembles de données ainsi que le lien pour acheter l'album.
l'utilisateur marque une chanson pendant 10 secondes et l'application crée une empreinte audio basée sur certains des ancrages du spectrogramme simplifié et la zone cible entre eux.
Pour chaque point de la zone cible, ils créent une valeur de hachage c'est la combinaison de la fréquence à laquelle le point d'ancrage est situé, la fréquence à laquelle le point dans la zone cible est situé, et la différence de temps entre le point dans la zone cible et lorsque le point d'ancrage est situé dans la chanson.
une fois l'empreinte digitale de l'audio créée, Shazam commence la recherche de correspondances dans la base de données. S'il y a correspondance, l'information est retournée à l'utilisateur; sinon, elle renvoie un dialogue "song not known".