Sans surprise, le streaming de musique s’avère être l’application phare de ces appareils. NPR et Edison rapportent que 60 % des utilisateurs interrogés ont demandé à leurs enceintes intelligentes de « jouer de la musique » tout en passant du temps avec les autres, ce qui en fait de loin la fonction la plus populaire, avant de répondre à des questions générales (mentionnées par 30 % des personnes interrogées) et d’obtenir la météo. (28 pour cent). L’écoute n’est pas non plus purement aléatoire : un rapport récent indique que près de la moitié des propriétaires d’enceintes intelligentes paient pour un abonnement mensuel en streaming, un chiffre qui devrait augmenter. Lors d’une récente réunion de l’industrie musicale britannique, les haut-parleurs intelligents ont été comparés aux lancements d’iPod et d’App Store d’Apple en termes de leurs effets possibles sur plusieurs industries. Trois des entreprises technologiques les plus importantes au monde déploient des haut-parleurs interactifs pour attirer les auditeurs vers leurs plateformes musicales de marque : la prochaine bataille dans la guerre de la musique en streaming au sein des entreprises sera menée avec la voix.
Le haut-parleur intelligent est le produit de décennies d’expérimentation en matière de reconnaissance vocale et de réseautage domestique, rendues possibles, comme de nombreuses innovations récentes, par de grandes entreprises disposant d’une puissance de calcul incroyable. Alexa, Siri et les autres robots-agents domestiques artificiellement intelligents et à reconnaissance vocale (et toujours des femmes) ont leurs racines dans les expériences naissantes des Bell Labs dans les années 1950 avec « Audrey », mais leur capacité à reconnaître les schémas de conversation et à interagir avec leurs propriétaires dans une manière naturaliste les situe dans l’évolution continue de l’IA interactive, qui nous terrifiait autrefois mais qui nous excite désormais. Le rôle de ces appareils dans l’organisation des tâches quotidiennes de la vie domestique fait partie d’une campagne beaucoup plus vaste visant à connecter l’ensemble de la maison en un tout fonctionnant sans problème et riche en données : Echo peut régler le thermostat de votre maison et verrouiller vos portes, tout comme Google Home le fait. dans son système Nest et le HomePod d’Apple dialogue avec son HomeKit. La musique numérique librement accessible a été comparée à un service domestique – comme l’eau du robinet, toujours disponible – depuis des années, et grâce aux haut-parleurs intelligents, elle est désormais contrôlable par le même appareil qui atténue vos lumières.
Les fichiers de musique numérique eux-mêmes ont été transformés en objets « intelligents » au cours des dernières années – « intelligent » étant le dernier mot à la mode incontournable pour décrire les technologies qui promettent d’améliorer l’expérience grâce à une surveillance légère. En regroupant les fichiers sur des plateformes, Spotify, Apple Music, Tidal et leurs semblables ont transformé le simple fait de cliquer sur Play en une activité génératrice de valeur. Les chansons en streaming ne sont pas des produits échangeables comme elles le sont sur CD, vinyle ou même MP3 ; il s’agit plutôt de logiciels espions agréables, qui rapportent de grandes quantités de données exclusives sur les auditeurs (qui, comme le promettent les entreprises, sont ensuite réacheminées vers une expérience utilisateur toujours plus personnalisée et agréable). Lorsque Daniel Ek, PDG de Spotify, a déclaré au New Yorker que son entreprise n’évoluait pas dans l’espace de la musique, mais dans celui du moment, il sous-entendait que l’expérience est la marchandise : non pas la musique, mais les activités quotidiennes adaptées aux algorithmes de Spotify et aux listes de lecture organisées. Les enceintes intelligentes s’intègrent parfaitement dans un paysage musical numérique colonisé par les plateformes de streaming, pour mieux organiser chaque activité comme un moment sonore significatif.
Les concepteurs et ingénieurs technologiques considèrent le monde comme un ensemble de problèmes à résoudre efficacement, voire astucieusement. Dans certains recoins de l’espace musical numérique, ces problèmes se manifestent comme des obstacles à une expérience d’écoute fluide – à l’expérience de la musique en streaming comme un bourdonnement atmosphérique capable de s’adapter instantanément à n’importe quelle humeur, activité ou sentiment nostalgique. C’est ce que veut dire le directeur d’Amazon Music, Ryan Redington, lorsqu’il me dit que « la voix supprime presque complètement les frictions pour obtenir la musique rapidement ». À titre d’exemple, Redington décrit comment il utilise la musique pour passer en mode domestique après le travail. « J’avais l’habitude de rentrer chez moi, de sortir mon téléphone, de le déverrouiller, de trouver Amazon Music, de trouver une playlist que je souhaite écouter, de me connecter au Bluetooth ou à un récepteur dans ma maison, puis de commencer à écouter de la musique », explique-t-il. Avec un haut-parleur intelligent, affirme-t-il, toutes ces frictions technologiques disparaissent. « Maintenant, je peux simplement entrer dans ma maison et dire : « Alexa, joue » ce que je veux écouter, et ça marche. »
L’Echo n’a pas été conçu explicitement pour la musique, mais ce n’est pas une coïncidence si Amazon a lancé Prime Music, son service gratuit pour les membres Amazon Prime, quelques mois avant que l’Echo ne soit présenté au monde. (Amazon Music Unlimited, qui propose des millions de titres supplémentaires et a été lancé comme concurrent direct de Spotify et Apple Music, a fait ses débuts en 2016.) « Je n’irais pas jusqu’à dire que [Echo et Amazon Prime Music] étaient « Nous avons développé ensemble », me dit Redington, « mais nous savions certainement que cet appareil était en cours de développement, [et avons construit] notre service de musique pour nous assurer qu’il était très vocal. » Alors que Spotify se distingue par des listes de lecture personnalisées et que Tidal et Apple Music proposent des exclusivités d’artistes sur leurs plateformes, Amazon Music espère se démarquer avec la voix.
Même si ses concurrents rattraperont sans aucun doute leur retard rapidement, jusqu’à présent, Amazon a fait bien plus pour intégrer la musique en streaming aux commandes vocales. Il s’agit d’un domaine qui, pour le dire à la légère, peut différer radicalement du processus plus familier consistant à saisir une question dans une interface visuelle. «Nous sommes très en difficulté pour comprendre exactement quels mots les clients utilisent lorsqu’ils demandent quelque chose», explique Alex Luke, responsable mondial de la programmation et de la stratégie de contenu chez Amazon. « Que répond Alexa en réponse à cette déclaration, et quelle musique délivrons-nous après qu’Alexa ait dit sa réponse ? »
En effet, l’un des problèmes les plus importants que doivent résoudre les ingénieurs en enceintes intelligentes est ce que l’on pourrait appeler le problème de la réponse unique. « En ce qui concerne la voix », explique Redington, « vous n’avez pas le luxe de donner beaucoup de résultats aux clients : vous devez commencer à jouer quelque chose. » Contrairement à une interface visuelle qui peut fournir un écran rempli de réponses triées à une question parmi lesquelles l’utilisateur peut choisir, Alexa ne peut fournir qu’une seule réponse à la fois, sinon il y a des frictions. Dans le monde des enceintes intelligentes, il est essentiel d’obtenir d’abord la bonne réponse. Comme le dit Redington : « Lorsque vous demandez quelque chose et que cela fonctionne, c’est vraiment là que la magie opère. »
Comme pour toute musique en streaming, la « magie » émerge des métadonnées. Dans un environnement musical sur plateforme, chaque morceau individuel est accompagné de nombreuses informations numériques qui déterminent où et comment il doit circuler, depuis les codes qui suivent les ventes et les flux jusqu’aux informations musicales et d’activité. Bien que tout utilisateur de plateforme de streaming soit profondément familier avec les listes de lecture axées sur l’humeur et l’activité, le paysage domestique fluide des haut-parleurs à commande vocale a conduit à une augmentation de ces demandes. « Quand les gens disent : « Alexa, mets-moi de la musique joyeuse », c’est quelque chose que nous n’avons jamais vu taper dans notre application, mais nous commençons à voir beaucoup de choses se produire à travers l’environnement vocal », explique Redington.
Alors que toutes les plateformes disposent d’équipes qui créent des tonnes de métadonnées grâce à des techniques d’apprentissage automatique et à une sélection humaine qui peuvent déterminer si une chanson est « heureuse », les maisons de disques veulent naturellement aussi avoir leur mot à dire. Will Slattery est le directeur mondial des ventes numériques de Ninja Tune, un label électronique qui, traduit en langage streaming, propose de nombreuses musiques sans paroles qui se prêtent à des ambiances et à des activités spécifiques. « Lorsque les gens commenceront à interagir avec des haut-parleurs intelligents, ils voudront dire : « Alexa, mets de la musique relaxante » ou « mets de la musique pour le dîner » », prédit Slattery. « Et c’est là qu’un label pourrait intervenir et fournir aux sociétés [de streaming] ces métadonnées, comme : ‘Ce serait une bonne chanson pour ces ambiances spécifiques.' » L’artiste Ninja Tune Bonobo, note Slattery, est très populaire dans les études et des playlists de concentration, ce que le producteur ne prend pas en compte lorsqu’il compose sa musique, mais qu’il ne peut nier une fois qu’elle est en circulation. « Il est étrange d’imaginer un artiste espérant qu’un jour sa musique figurera sur des listes de lecture de fitness », au lieu d’obtenir une critique élogieuse ou une machine à sous Coachella, me dit un propriétaire d’un label indépendant. « Mais cela va changer rapidement. Ce qui semble être une manière un peu absurde d’aborder la musique aujourd’hui deviendra monnaie courante demain. »
Les enceintes intelligentes font déjà leur apparition dans le mode d’écoute le plus courant actuellement : la diffusion radio. De Pandora à Beats 1, la courte histoire des plateformes de streaming a été marquée par le mimétisme du mode de circulation musicale libre et passif de la radio. Luke d’Amazon a commencé sa carrière en tant que directeur de programmes radio pour des stations de rock massives comme Q101 de Chicago et The Edge de Dallas, et ses premières initiatives de programmation pour Echo étaient clairement tirées de cette expérience. En novembre dernier, les propriétaires d’Echo qui ont dit : « Alexa, joue à U2 Experience » ont été diffusés en direct qui mélangeait des morceaux de Songs of Experience 2017 avec des interviews du groupe. U2 l’a décrit sur son site Internet comme un « nouveau type de radio ». Demander à Alexa de « jouer à The Soundboard » plus tôt cette année a donné lieu à un programme en direct d’Elton John couvrant toute sa carrière. Des programmes quotidiens comme « Today in Music » et « Song of the Day », lancés avec leurs propres commandes vocales spécifiques, suggèrent également la forte influence de la vivacité des programmes radiodiffusés.
Tout cela rend l’industrie de la radio nerveuse, et pour cause. L’étude NPR/Edison rapporte que 39 % des utilisateurs d’enceintes intelligentes passent désormais du temps à écouter ces appareils plutôt qu’à diffuser la radio. Lorsqu’Amazon ne reproduit pas la programmation radio et ne simule pas son expérience, l’entreprise s’appuie sur son rôle dans l’écosystème promotionnel pour répondre aux demandes vocales spécifiques. Lorsque Redington a remarqué que les utilisateurs d’Echo demandaient « la dernière chanson » d’un artiste, il s’est rendu compte que de simples métadonnées sur la date de sortie n’étaient pas suffisantes pour fournir le bon résultat. « Nous devions en fait comprendre quelle chanson était diffusée à la radio, donc la date d’impact radio est devenue très importante pour nous. »
Lorsque la rockeuse indépendante australienne Courtney Barnett a été présentée dans l’émission « Today in Music » d’Amazon, Jessica Page, directrice du numérique chez Mom + Pop, le label de Barnett, a déclaré que les ventes et les flux de Barnett ont immédiatement augmenté. L’audience intégrée d’Amazon est importante : une société de recherche a estimé le nombre d’abonnements à Amazon Music à 16 millions en octobre dernier, ce qui est suffisant pour la troisième place derrière Spotify et Apple, et une source a déclaré à Variety en mars que ces chiffres augmentaient régulièrement et de plus en plus dépendants. sur l’intégration d’Echo. Page note qu’il est trop tôt pour dire si ce type de placement peut générer le même type de visibilité ou d’engagement que, par exemple, une place en haut d’une playlist Spotify de prestige. Mais jusqu’à ce qu’Apple, Google et d’autres lancent leurs propres initiatives de programmation spécifiques pour la voix, Amazon est, selon les mots de Page, « une autre, faute d’un meilleur terme, une case que vous pouvez cocher pour plus de visibilité ».
Pour Page, comme pour d’autres stratèges numériques de maisons de disques, le monde des enceintes intelligentes a été construit indépendamment de leurs souhaits, et c’est à eux de le faire fonctionner pour leur liste. Cette stratégie implique de plus en plus l’incorporation de paroles en tant que métadonnées. À l’ère numérique, les paroles de chansons sont réapparues comme une marchandise à part entière. La plateforme participative Genius s’est intégrée à Spotify et Google Home, tandis que LyricFind, basée à Toronto, qui se présente comme « le leader mondial des solutions légales de paroles », opère sur le backend, en octroyant des licences aux paroles des éditeurs de musique pour qu’elles fonctionnent avec Pandora, Deezer et Plateformes Microsoft, entre autres. Il semble que de nombreux utilisateurs d’enceintes intelligentes demandent des chansons via des bribes de paroles entendues, ce qui nécessite un nouveau niveau de spécificité des métadonnées. Les droits d’auteur sur les paroles appartiennent généralement aux éditeurs de musique, et les labels ne gagnent généralement pas d’argent grâce aux licences de paroles. Mais la promesse de l’intégration de haut-parleurs intelligents, affirme Darryl Ballantyne, fondateur de LyricFind, a déclenché un changement : tout élément de métadonnées qui pourrait aider leur musique à dépasser le vacarme numérique est utile. « Même si les labels ne sont pas payés par nous, le fait d’avoir les paroles disponibles leur permet d’être mieux payés par d’autres personnes », explique Ballantyne. Page est d’accord : « La possibilité de trouver des paroles et de les associer à une chanson entraînera davantage de flux et plus de ventes. »
Tandis que les labels rattrapent leur retard sur les paroles en tant que métadonnées de streaming, les entreprises technologiques présentent leurs produits au type de fan de musique qui demanderait « la chanson hipster avec le sifflement ». Amazon, Apple et Google ne vont pas vendre des millions d’enceintes intelligentes en orientant leurs produits vers les obsédés de la musique, surtout lorsque les fans occasionnels sont beaucoup plus réceptifs à la programmation algorithmique. Cela soulève cependant de vieux problèmes pour les petits acteurs de l’industrie musicale. « Pour un label indépendant, la question est toujours : comment allez-vous convertir les auditeurs qui vont simplement dire « joue de la musique » et les amener à écouter de la musique qu’ils n’ont jamais entendue auparavant ? dit Slattery de Ninja Tune. La réponse qu’il propose – encore plus de « découvertes » algorithmiques conçues par les plateformes elles-mêmes – n’est pas la plus apaisante. « En tant que label, vous êtes à la merci des infrastructures créées par les entreprises technologiques », confesse-t-il.
En effet, bon nombre des problèmes les plus urgents de l’économie de la musique en streaming (rémunération des artistes, transparence statistique, sexisme) restent intacts, voire approfondis, par la montée en puissance des haut-parleurs intelligents. De plus, alors qu’Amazon, Apple et Google continuent de se tailler une place sur le marché de la voix, les consommateurs de musique et les musiciens continueront de lutter contre l’approche d’exclusivité privilégiée par les entreprises. Et bien qu’il n’y ait aucune véritable raison de sympathiser avec Tidal ou Spotify, l’idée que l’industrie des enceintes intelligentes pourrait devenir l’apanage exclusif de grandes entreprises disposant de suffisamment de capital pour expérimenter (et d’énormes publics captifs à utiliser comme cobayes) est une raison importante de faire une pause. peu importe à quel point on est peu intéressé à posséder les appareils. Un monde dans lequel trois des « cinq effrayants » de la technologie deviennent l’équivalent des grands labels, avec des participations exclusives dans le matériel et les logiciels, et de nombreuses incitations à verrouiller les produits et les contenus des concurrents hors de leurs systèmes, est une idée effrayante, et non aussi farfelu que cela puisse paraître.
La plupart des amateurs de musique ne souhaitent pas automatiquement utiliser un haut-parleur intelligent pour écouter de la musique. Ils doivent être formés à interagir avec des assistants virtuels, de la même manière qu’ils ont dû apprendre à glisser au lieu de taper. La liste d’exemples de questions et de commandes fournie avec chaque haut-parleur intelligent ne vous indique pas simplement comment utiliser l’objet, mais également comment interagir avec lui, en utilisant quelque chose de proche du langage naturel. Depuis des années, les chercheurs en reconnaissance vocale ont compris que parler à une interface vocale nécessite les mêmes ressources psychologiques et sociales que les autres formes de parole. Ce sont également des voix uniformément féminines, ce qui active le trope des femmes soumises qui est bien antérieur à la musique enregistrée.
Au-delà des interfaces vocales encombrantes qui ne pouvaient comprendre les déclarations robotiques qu’il y a quelques années, les haut-parleurs intelligents facilitent un niveau d’interaction homme-machine plus informel, voire humoristique. Comme le « Que se passe-t-il ? » sur Twitter ou sur « Qu’est-ce que tu penses ? » sur Facebook, ce type d’intimité réalisée adoucit le projet plus vaste de collecte continue de données ambiantes. Les haut-parleurs intelligents révolutionnent peut-être ou non l’industrie de la musique enregistrée, mais ces gadgets personnels semblent conçus pour un projet beaucoup plus vaste, pour lequel la musique pourrait simplement constituer un point d’entrée agréable : générer de la bonne volonté non pas envers des sociétés sans visage, mais envers la voix douce du monde vivant. salle promettant un monde de consommation constante, sans friction et surveillée