Byothe.frLogicielComment fonctionnent les appli d'identification de musique comme Shazam ou Soundhound ?

Comment fonctionnent les appli d’identification de musique comme Shazam ou Soundhound ?

Apparues quasiment dès le début de l’App Store d’Apple, les applications d’identification de musiques sont vraiment bluffantes… comment en quelques secondes, peut-elle reconnaître une chanson grâce au micro de votre téléphone ?

Sous le capot de ses applications se cachent des algorithmes sophistiqués qui permettant de trouver des chansons en un instant. Voici comment cela fonctionne !

La magie des applications d’identification de musique

Si vous utilisez ce type d’appli, vous vous reconnaîtrez certainement dans cette situation. Vous êtes en train de rouler en voiture ou en train de dîner dans un bon resto, quand vous entendez soudain une chanson qui vous plaît bien et que vous souhaiteriez réécouter plus tard. Alors, vous sortez votre téléphone, vous ouvrez Shazam et vous tendez votre appareil vers la source sonore. En un clin d’œil, l’application retrouve le nom de la chanson, son artiste et sur quelle plateforme vous pouvez la retrouver.

Ce type d’application est rapide, remarquablement précis et peut identifier même les chansons les plus obscures. Pour faire court, l’application fonctionne en isolant la chanson pour la rechercher dans une vaste base de données de morceaux. Mais la technologie sur laquelle ces applications s’appuient pour faire cela est assez complexe et impressionnante.

Le plus étonnant c’est que Shazam est sortie en 2002, et que le système était aussi précis et rapide à l’époque qu’il l’est aujourd’hui. Tout cela grâce à un algorithme unique qui allait révolutionner le monde de la musique.

À première vue, les applications d’identification de musique comme Shazam peuvent sembler simples. Vous pourriez penser qu’elles se contentent d’écouter les paroles, comme n’importe quel assistant vocal, et de les rechercher dans une base de données de paroles de chansons pour vous dire quelle est la chanson que vous êtes en train d’écouter.

Mais ce n’est pas si simple. La plupart des applications d’identification de musique sont capables d’identifier les chansons instrumentales et de trouver le chanteur des reprises. En effet, au lieu d’analyser les paroles de la chanson, elles identifient des « empreintes » propres à chaque chanson avant de les comparer avec ce qu’elles ont dans leur énorme base de données.

Identifier l’empreinte d’une chanson

Vous avez probablement des appareils qui peuvent être déverrouillés à l’aide de votre empreinte digitale. Celle-ci est constituée de petites lignes qui vous sont propres. Shazam fonctionne un peu sur le même principe. Les morceaux sont transformés en un modèle de données que Shazam ou une autre application peut consulter dans sa base de données.

À première vue, cette méthode semble sujette à plusieurs problèmes. La plupart du temps, lorsque vous entendez de la musique en public, il y a des bruits de fond et des distorsions causées par les haut-parleurs, ce qui peut rendre les chansons non identifiables ou entraîner des correspondances inexactes. De plus, il y a beaucoup de données capturées dans un morceau de musique, même bref, ce qui peut ralentir la recherche de ces modèles dans une base de données de millions de chansons.

Dans une interview accordée à Scientific American en 2003, Avery Li-Chun Wang, le responsable des données et co-fondateur de Shazam, avait expliqué comment leur algorithme parvenait à résoudre ces problèmes. Les informations d’un échantillon audio peuvent être visualisées à l’aide d’un graphique en 3D appelé spectrogramme, qui représente les changements de fréquences sur une période de temps et peut également afficher le niveau sonore (amplitude).

spectrogramme musique shazam - identification de musique

De la même manière que les humains ne peuvent pas percevoir que les sons appartenant à un spectre de fréquence particulier, au lieu de prendre en compte l’intégralité d’une chanson lors d’une recherche, Shazam ne prend en compte que les « pics » de fréquences. Ainsi, les empreintes digitales qu’il capture ne prennent en compte que les points de fréquence les plus élevés dans un laps de temps donné, puis les points d’amplitude de crête dans ces fréquences.

Dans un document de recherche pour l’université de Columbia, Wang indique que la méthode permettait d’éliminer la plupart des parties inutiles d’un extrait audio, comme le bruit de fond, et de supprimer la distorsion. Elle rend également la taille des empreintes suffisamment petite pour qu’il suffise de quelques millisecondes seulement pour identifier une chanson parmi leur vaste base de données.

Depuis l’apparition du précurseur Shazam, une poignée de concurrents ont également surgi. C’est le cas de Soundhound qui se targue de pouvoir identifier une chanson simplement en la chantant ou en la fredonnant… avec des résultats mitigés. Il existe également un identificateur de chanson intégré à des applications vocales telles que Google Assistant, qui fonctionnent de manière très similaire au système de Shazam.

Article mis à jour le 13 septembre 2023 par Byothe

Byothe
Byothehttps://byothe.fr
Papa quadra fasciné par le web, je passe une grande partie de mon temps à faire de la veille pour vous dégoter les meilleures actus. Trucs et astuces, humour, sites web et high-tech constituent l’essentiel des sujets que je souhaite traiter ici… mais je ne manquerai pas de vous proposer des bons plans glanés çà et là sur la toile…

Articles similaires

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici

Discord

Envie d'échanger en direct ? Venez nous retrouver sur le serveur Discord de Byothe.fr

Newsletter

Abonnez-vous, et recevez chaque lundi un résumé de l’actu du web

Dernières news

Au hasard