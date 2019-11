ON DÉCRYPTE

"Alexa, achète le prix Goncourt", "Dis Siri, j’ai faim, trouve-moi un restaurant", "Ok Google, quel film je pourrais aller voir au cinéma ce soir ?"… En quelques années, les assistants vocaux se sont fait une place dans nos vies. D’abord sur les téléphones, où Apple a été précurseur avec Siri, et plus récemment via les enceintes connectées d’Amazon, Google, Apple, Sonos, etc. On peut désormais faire énormément de choses simplement avec sa voix. De quoi envoyer tous nos écrans à la casse ?

La voix, outil simple et accessible à tous

À première vue, les assistants vocaux semblent bel et bien ringardiser les écrans, aussi plats et lumineux soient-ils. Qui a besoin de taper du texte sur un clavier puis de chercher soi-même la réponse à sa question quand tout cela peut désormais être fait à l’oral ? Résultat, un internaute sur dix passe aujourd’hui par une enceinte connectée. "Il y a une démocratisation, c’est vrai. Mais les usages restent relativement simples : radio, musique, météo, minuteur…", souligne Jérôme Grondin, analyste spécialiste des nouvelles technologies au sein du cabinet de conseil Niji.

Les usages plus complexes de la commande vocale prennent plus de temps à être acceptés par le grand public mais ils arrivent : 30% des recherches sur le web se feront vocalement en 2020. Selon une étude du Capgemini Research Institute, publiée en septembre, un utilisateur d’enceinte connectée sur deux a déjà fait des achats en ligne par ce biais. Des tâches jusqu’ici accomplies sur un écran, de smartphone ou d’ordinateur.

"La commande vocale peut être envisagée comme un nouveau paradigme de la relation entre l’homme et les machines. Il y a eu un premier saut en avant avec l’apparition de la souris sur les ordinateurs, puis un second avec l’avènement des écrans tactiles. Les assistants vocaux ont le potentiel, eux aussi, de changer notre façon d’utiliser la technologie", estime Jérôme Grondin.

De fait, là où l’écran est une barrière pour certains technophobes, la commande vocale est accessible à tous. "On n’a pas besoin d’apprendre à utiliser l’outil : on maîtrise déjà la parole. En cela, la commande vocale rend la technologie accessible à des gens qui en étaient jusqu’ici exclus, que ce soit les enfants en bas âge, les personnes âgées ou les personnes frappées d’illectronisme", souligne Jérôme Grondin.

L’écran reste un support souvent indispensable

Cela ne veut pas dire que les assistants vocaux vont mettre les écrans au rebut pour autant. D’abord, car, en l’état, la commande vocale reste un outil limité. "La première contrainte, c’est la compréhension du contexte de la demande. Si vous demandez à votre assistant vocal de trouver un restaurant pour la Saint-Valentin, il risque de vous proposer n’importe quoi car il ne va pas saisir l’aspect romantique de la requête", explique Jérôme Grondin. Il faudra donc continuer de passer par un écran pour affiner sa recherche. Un obstacle qui sera peut-être abattu dans les années à venir avec les progrès de l’intelligence artificielle.

" Les assistants restent bien souvent utilisés dans un cadre privé "

Autre élément qui joue en faveur des écrans : l’être humain mémorise plus facilement quand il y a un support visuel. "C’est plus simple d’analyser 40 réponses sur Google quand on les a en face de soi que de retenir 40 réponses énoncées à l’oral les unes à la suite des autres", selon l’analyste du cabinet Niji. Dans le même registre, les assistants vocaux sont conçus pour des dialogues très brefs : au-delà de trois échanges sur le même sujet, l’utilisateur est perdu.

Enfin, l’usage des assistants vocaux reste bridé par le regard des autres : les gens n’assument pas de parler à un robot en public. "La conséquence, c’est que les assistants vocaux sont encore quasiment exclusivement utilisés dans un cadre privé, chez soi, et souvent quand on est seul. Au travail, dans la rue ou dans un lieu public, on continue de passer par son téléphone ou son ordinateur, en tapant sa recherche", rappelle Jérôme Grondin.

Le mariage de la voix et de l’écran

En réalité, la commande vocale est complémentaire des écrans. Sur les téléphones, elle sert à faciliter les recherches dans les applications ou sur Internet, mais elle ne fait pas tout. Quant aux enceintes connectées, si les premiers modèles se reposaient uniquement sur la commande vocale, les plus récents intègrent à leur tour… un écran. Croisement entre une tablette tactile et une enceinte connectée, les Google Nest Hub Max, Facebook Portal et Amazon Echo Show misent sur l’intégration d’un écran pour enrichir la réponse à la demande formulée vocalement.

L’analyste estime toutefois que la commande vocale, si elle ne tuera pas les écrans, peut contribuer au renouveau de certains formats audio. "Il y a une montée en puissance des livres audio, des podcasts et même des séries audio, comme Calls sur Canal+. Et les assistants vocaux sont un moyen de diffuser ces nouveaux formats sans image", estime Jérôme Grondin. Pas forcément moins d’écran, mais plus d’audio : voilà (peut-être) ce que nous réserve la commande vocale dans les années à venir.