De manière générale, les algorithmes n’arrivent pas à percevoir les attentes des utilisateurs qui ont des goûts éclectiques, dits multi-genres, ou ceux qui évoluent constamment. Ainsi, on peut vouloir écouter telle musique, du hip-hop par exemple, le matin au réveil, mais préférer la pop au travail, la salsa au volant d’une voiture et finalement du «smooth jazz» en se couchant –autant de situations, de sensibilités et d’humeurs que l’algorithme ne sait guère anticiper.
Le cas de la musique classique est plus révélateur encore. Spotify et Deezer sont d’abord critiqués pour leur présentation chaotique des titres: il est en effet très difficile d’écouter les morceaux d’un opéra dans le bon ordre, ou les symphonies de Beethoven les unes après les autres.
Quant à choisir son interprétation, son soliste ou son chef d’orchestre –Martha Argerich ou Sviatoslav Richter au piano, Furtwängler ou Karajan pour diriger Wagner–, c’est une gageure. La faute aux métadonnées, souvent présentées de manière très insuffisantes, mais également aux algorithmes qui ne savent pas encore bien classer la musique classique ou l’évaluer.
(...)
On retrouve ces distorsions de recommandations avec Netflix et Amazon. Même quand les critères sont affinés, que la technique s’améliore et que les algorithmes se mettent à «apprendre», les résultats restent plus quantitatifs que qualitatifs, et finalement très impersonnels. Ils produisent ce qu’on appelle dans le jargon du «bruit», c’est-à-dire des données et des contenus non pertinents.
Pour une part, cela vient du fait que le «data mining» –ou l’art de la collecte des données– fonctionne sur la base d’échantillons, faute de la puissance de calcul nécessaire pour traiter toutes les données collectées.