Journal de la Voix
Accueil » Autres IA & Assistants » Vivoka : « Nous pouvons faire l’assistant vocal de demain »

Vivoka : « Nous pouvons faire l’assistant vocal de demain »

Le business de la reconnaissance vocale pèse plus de 2 milliards de dollars aujourd’hui. Et il représentera plus de 40 milliards de dollars en 2022. C’est à dire demain. Dans le même temps un recherche sur deux sera effectuée par la voix en 2022 selon le cabinet Comscore.

Actuellement, ce marché est largement dominé par les GAFA, notamment Amazon et Google. Pourtant, en France, des entreprises, des start-up, lancent des projets ambitieux dans le domaine de la reconnaissance vocale.

Après Digital Airways et son Homekeeper à destination du grand public, nous vous proposons de découvrir Vivoka, une société lorraine, qui propose des solutions vocales adaptées aux entreprises. William Simonin, CEO de Vivoka explique la philosophie de son entreprise.

william simonin vivoka
William Simonin, CEO de Vivoka

William Simonin : A l’origine, notre activité est de créer des assistants vocaux sur mesure. Par exemple dans le domaine de la promotion immobilière ou de l’hôtellerie, nous proposons nos propres assistants vocaux que l’on a spécialisés pour ces secteurs. Ils sont assez “similaires”, avec des gros guillemets à Google Assistant ou Amazon Alexa sur certains fonctionnalités, en revanche, il y a deux grosses différences :

  • L’enjeu sur les données. On ne fait pas de business sur les données personnelles des clients.
  • La seconde est la spécialisation sur certains secteurs d’activités.

Les intelligences artificielles de Google et Amazon sont énormissimes. Par contre elles vont toucher plusieurs secteurs, énormément de secteurs, mais pas en profondeur. Par exemple, créer des scénarios complets à la voix sur Google ou Amazon, ce n’est pas possible et ce n’est pas leur objectif. On peut donc faire beaucoup de choses mais pas en profondeur. Cela reste de très bonnes enceintes connectées.

Nous avons pris le parti de dire, on ne veut pas faire autant de choses avec nos assistants mais on veut le faire très bien. C’est aussi notre grosse différence.

« On voulait avoir notre Jarvis »

Journal de la Voix : Avant de voir les différents secteurs dans lesquels vous intervenez, expliquez nous les débuts de Vivoka.

WS : L’aventure Vivoka a commencé en 2014 avec deux amis étudiants à l’école d’ingénieur EPITECH. On a découvert Jarvis dans le film Iron Man. On a trouvé ça génial et on s’est dit qu’on voulait avoir un Jarvis.

vivokaOn a donc commencé à chercher, fouiller sur internet pour voir les systèmes existants pour faire les équipements et les appareils et on s’est vite rendu compte que, malgré la technologie existante, les produits, on était loin de ce qu’on avait vu dans le film. Nous avons donc décidé de créer notre propre solution basée sur la reconnaissance vocale.

En 2014, nous avons travaillé sur la première version qui était essentiellement axée domotique et capable de gérer par la voix tous les équipement d’une maison. Mettre de la musique, monter le chauffage, gérer les lumières, les stores voire créer des scénarios à la voix.

Par exemple on pouvait dire “Je veux tous les matins un réveil à huit heures, avec la dernier morceau de Rihanna, l’ouverture des volets tout en allumant la télé”. Et petit à petit nous nous sommes développés dans le domaine de la reconnaissance vocale en améliorant notre intelligence artificielle et nos algorithmes.

Au début de l’année dernière, les GAFA ont commencé à parler de leur technologie de reconnaissance vocale et de l’interaction Homme-Machine de demain. Du coup les demandes sont devenues de plus en plus nombreuses dans différents secteurs : le retail, l’hôtellerie haut de gamme, les sites internet, les applications mobiles, les bornes d’accueil… Tout le monde semblait vouloir de la voix.

Notre chance est d’avoir fait le pari de cette technologie très tôt, nous avions donc une avance dans ce domaine, en tout cas en France. Et nous avons pris la décision de nous ouvrir à de nouveaux horizons pour devenir des experts de la reconnaissance vocale en France, en Europe avec l’ambition de nous étendre au monde entier.

vivokaVivoka aujourd’hui, c’est une vingtaine de collaborateurs et notre objectif est vraiment d’apporter des solutions spécialisées pour répondre à des usages nouveaux. Nous sommes persuadés que l’interaction Homme-Machine de demain ne sera plus tactile ou au clavier, mais ce sera la voix. Il y a déjà une recherche sur cinq qui se fait aujourd’hui par la voix et on sera à une sur deux en 2022. C’est en train d’arriver dans tous les domaines.

Changer l’interaction Homme-Machine

JDV : Vous parlez beaucoup d’interaction Homme-Machine. Pourriez vous expliquer ce que cela signifie ?

WS : Quand on parle d’interaction Homme-Machine, on parle vraiment de moyens de communiquer, de donner un ordre, de déplacer une intention avec un système. De la même manière que sur une application mobile on va naviguer en appuyant sur un menu, puis un sous-menu, puis en sélectionnant un item dans le cadre d’une application pour faire ses courses. On utilise le tactile pour interagir avec l’application. Maintenant, la voix est la nouvelle façon d’interagir avec les systèmes en général.

Dans l’exemple de l’application pour faire ses courses, grâce à l’interaction par la voix, on aura juste à dire “Ajoute à mon panier tout ce qu’il faut pour faire des crêpes”. En une phrase, on aura économisé tout le temps de recherche de recette, des clics etc.

On sait qu’aujourd’hui, il y a des intelligences artificielles qui sont très très puissantes mais qui sont aussi très complexes. Cette complexité est un frein pour l’utilisateur, pour aller dans les paramètres et utiliser l’intégralité de son potentiel. Alors que la voix pour un humain c’est ludique. Naturellement, on va écouter ce qui se passe autour de nous et on va parler pour donner une information, pour demander une information, pour donner un ordre. Il est donc naturel que les assistants de demain puissent se contrôler à la voix.

Un assistant qui vous guide dans la grande surface

JDV : Vous intervenez principalement dans 4 domaines. L’e-commerce, la promotion immobilière, l’hôtellerie et la smarthome.

WS : Notre technologie va bien au delà de ces quatre secteurs d’activité. Mais pour developper des solutions pertinentes pour l’utilisateur, nous avons voulu nous concentrer, prioriser ces 4 activités.

JDV : Commençons par le e-commerce. Que proposez vous ?

WS : Nous abordons le e-commerce de plusieurs manières. Aujourd’hui, on a des applications qui permettent grosso-modo de se faire livrer une liste de courses. L’idée est qu’en ajoutant un assistant vocal à cette application, on va créer de nouveaux usages. Dans l’exemple précédent, “Ajoute à mon panier tout ce qu’il faut pour faire des crêpes pour six”, l’assistant va aller chercher la bonne recette, l’adapter à vos goûts, créer la liste et même remplacer le lait par du lait de soja si vous avez des allergies.

Donc cela va être un véritable gain de temps, on va avoir des réponses sur des produits plus pertinentes et même obtenir des conseils. Par exemple, on pourra dire à l’application “Ajoute une bouteille de vin qui irait bien avec une raclette”. C’est quelque chose qu’on peut faire à la voix mais que personne n’ira écrire dans un champs de recherche.

JDV : Vous avez des exemples concrets d’enseignes avec lesquelles vous travaillez ?

WS : Oui mais je ne peux pas donner le nom pour le moment. Mais je peux donner un autre exemple de projet sur lequel on travail. Le client entre dans une grande surface, il scanne un QR code qui va lui ouvrir une caméra et un micro sur son smartphone. Pendant tout son parcours, il va discuter avec l’assistant vocal. Il va pouvoir demander où se trouvent les produits Nutella et l’assistant lui dira que c’est au fond, à gauche du rayon frais. Une fois sur place, il va demander la pâte à tartiner la moins chère et l’assistant va lui montrer l’étiquette du produit correspondant. C’est un exemple, mais cela va révolutionner le parcours client.

JDV : Comme un GPS pour grande surface ?

WS : Comme un GPS dans un super marché. Mais on le présente plus comme un assistant qui va répondre aux questions. Quand on arrive au rayon gâteaux, on pourra demander des gâteaux sans sucre. C’est comme si nous avions quelqu’un qui nous accompagne en permanence tout au long de nos courses.

JDV : Et cela sera disponible quand ?

WS : Nous allons annoncer nos partenaires au CES 2019 à Las Vegas et les solutions seront disponibles en pilote pour certains magasins dès le premier trimestre 2019.

Dans les hôtels, l’assistant devient hologramme

JDV : Un autre secteur d’activité, c’est la promotion immobilière ?

WS : Et l’hôtellerie ! Parce que ce sont les mêmes services que nous proposons dans ce cadre précis. Notre coeur de métier est d’intégrer les assistants vocaux dans tout support, donc plutôt sur l’aspect logiciel. Pour ces deux secteurs on a créé des produits physiques. On a matérialisé l’assistant sous la forme d’un hologramme qui fait apparaitre un majordome.

L’idée de personnaliser l’assistant était pour améliorer le côté intuitif et l’interaction Homme-Machine. toujours.

zak vivoka

JDV : Et c’est pour l’hôtellerie que vous aviez créé ZAC, le raton laveur majordome ?

WS : En fait cette personnalisation est très importante parce que l’être humain n’est pas prêt à dialoguer avec un objet physique. On ne parle pas avec un cube, on ne parle pas à sa tasse à café ou à un cylindre. Mais on va parler à son chien qui ne comprend rien. Il était donc important que l’assistant ait une apparence vivante. C’est pour cela qu’au départ, on a créé ZAC.

Maintenant nous proposons aux sociétés de donner vie à leur mascotte en la mettant à l’intérieur du produit et en ajoutant un mot clé pour la déclencher, en lui attribuant sa propre voix, pour créer un produit qui va parfaitement marqueter l’entreprise.

JDV : Dans le cadre de l’hôtellerie, à quoi vont servir ces assistants ?

WS : Ils vont permettre d’avoir trois actions. Fournir au client le moyen de gérer les équipements de sa chambre, c’est la partie domotique classique. Offrir un accès simplifié aux services de l’hôtel : code wifi, heure des repas, heure du check out etc. Des questions que l’on pose souvent quand on arrive dans sa chambre, tout cela peut être automatisé. Le client pourra également passer des commandes au room service ou demander de ne pas être déranger avant une certaine heure. Enfin un service de conciergerie et d’accès aux services extérieurs. Réserver un taxi, demander à l’assistant de réserver une table dans un restaurant particulier, demander des informations sur les points d’intérêt à proximité. Tout cela en restant dans sa chambre et surtout le plus important, dans sa langue natale.

JDV : Un des gros enjeux des hôtels est aussi de fidéliser les clients…

WS : Prenez par exemple un client qui viendrait de Chine et qui ne parlerait ni français ni anglais. Dans sa chambre, il va parler directement en chinois à l’assistant vocal qui va le comprendre et répondre à ses questions. L’assistant vocal va être son concierge personnel et ce client va partager ses intérêts et ses goûts.

Quand deux mois plus tard, ce même client va se retrouver dans une autre chambre de la même chaîne d’hôtel, équipé de nos assistants, l’assistant va se souvenir des goûts du client pour mieux le conseiller. Et cela est très important, c’est une grosse plus value.

JDV : Il y a quelques semaines, le patron de la chaîne Best Western disait ne pas vouloir mettre d’assistant vocal dans ses chambres parce que le premier geste des clients était de le couper, de peur d’être écouter. Que lui répondez vous ?

WS : C’est un point très important, mais il existe différents types d’assistants. Quand on fait appel à Google Assistant ou à Alexa d’Amazon, on sait que pour les GAFA, l’enjeu c’est la data. Avec notre système, nous n’avons aucun enjeu sur la data, nous n’écoutons pas les clients. Les données des clients appartiennent à nos clients. Tout ce que l’on va utiliser dans le traitement de la voix, c’est uniquement pour comprendre des habitudes et proposer des fonctionnalités que le client aura demandées. On est en total respect des normes et il n’y a pas d’écoute active de nos assistants.

JDV : Comme les GAFA vous enregistrez quand même des informations personnelles pour, dans votre cas, répondre aux demandes des clients ?

WS : Il y a bien sûr du profiling qui est fait en fonction de l’interaction avec l’assistant. Ce sont des informations qui ne sont pas stockées chez nous mais dans le système des assistants vocaux au sein de l’hôtel. A l’inverse de Google ou Amazon qui utilisent les informations sur les utilisateurs pour leurs propres publicités.

Chez nous, la collecte des informations se fait par défaut, mais à la première utilisation par le client, l’assistant va lui demander de choisir pour quel service il va autoriser un enregistrement et pour quel autre il va refuser. Il va également définir le niveau de proactivité du système.

Je vais prendre un exemple très simple qui est celui de Siri que j’utilise. Ce qui est dommage c’est que Siri ne fait rien d’autre qu’attendre qu’on lui demande quelque chose pour exécuter un ordre. Pour moi l’assistant de demain, c’est l’assistant qui va m’accompagner au quotidien et qui, par exemple sait que je suis fan de foot. Quand je rentre le soir chez moi, il pourra me dire, d’allumer telle chaîne de télé parce qu’il s’est passé un événement important et que je peux avoir plus d’informations maintenant. C’est vraiment là qu’on pourra créer un lien entre l’assistant vocal et l’utilisateur. Mais ça doit toujours être l’utilisateur qui fait la demande d’une telle interaction.

JDV : Dernier secteur, la Smarthome, là c’est le retour à vos débuts et la domotique…

WS : En fait la Smarthome, c’est quand l’intelligence artificielle et l’assistant vocal sont capables de répondre à toutes les questions liées à la domotique. Et dans ce domaine, nous avons eu beaucoup de demandes.
On a donc pris cette partie qui est totalement dématérialisée, on l’a isolée des assistants vocaux et on l’a mise à disposition sur une plateforme de chargement pour que d’autres systèmes de domotique y aient accès.

Aujourd’hui si une marque est intéressée par ajouter de la voix à son système de domotique, elle pourra tout simplement venir la prendre sur la plateforme. C’est vraiment à destination des professionnels, des concepteurs de solutions domotique qui veulent ajouter une interface vocale.

Un tour de table à un million d’euros

JDV : Vivoka en terme d’investissements, de chiffres d’affaires et même de partenaires, c’est qui, c’est combien ?

WS : En février dernier, nous avons levé un millions d’euros et c’est le seul chiffre sur lequel on communique. Dans ce tour de table, on a fait entrer certains acteurs du privé très intéressants pour le développement stratégique de la société comme Eric Denoyer, ancien PDG de SFR et créateur de Numéricable, des spécialiste de l’immobilier comme Etchart Group, Eliacin, MCH Management ou Adista.

Même si nous sommes motivés, nous sommes encore jeunes, la moyenne d’âge chez Vivoka, c’est 25 ans. Avec ces partenaires, au delà de l’aspect financier, on peut non seulement accélérer notre croissance mais développer les aspects relations, conseils et stratégies.

Dans le domaine de la voix, nous sommes à peine aux prémices de ce qu’on verra d’ici cinq ou dix ans. Il y a encore tout à faire, tout à construire et nos partenaires nous évitent aussi de nous éparpiller. C’est aussi pour cela qu’on a décidé de segmenter notre activité pour nous concentrer sur des assistants qui soient les plus performants possibles

Je ne peux pas en dire beaucoup plus sur l’aspect économique. On va profiter du CES 2019 pour faire plusieurs grosses annonces et commencer à jauger l’attraction de notre technologie à l’international.

JDV : C’est cela l’objectif de votre participation aux Consumer Electronic Show (CES) de Las Vegas ?

WS : Le CES de Las Vegas, c’est vraiment l’endroit où il faut être. En janvier dernier, pendant les quatre jours que cela a duré, nous avons établi plus de contacts qu’au cours de l’année passée. On a même pu rencontrer des personnes avec lesquelles cela avait été impossible en France. Donc pour notre prochaine participation, on s’est organisé, on a fixé des rendez-vous à l’avance. Comme notre application est disponible en anglais, nous allons chercher les bons partenaires pour imaginer, pourquoi pas, l’ouverture d’une antenne Vivoka aux Etats-Unis.

En développant 3 points : la proactivité, la reconnaissance des émotions et l’identification vocales, nous pensons vraiment pouvoir faire l’assistant vocal de demain. Savoir avec qui nous allons le faire et comment est très important pour nous.

Une proximité avec les clients

JDV : Qu’est ce qui pourrait justifier qu’une entreprise fasse appel à Vivoka pour son application vocale plutôt qu’une autre ?

WS : En fait nous ne vendons pas un produit, nous concevons, avec le client, une solution adaptée à ses besoins. A la différences d’autres solutions qui seraient faciles à intégrer. Ce que j’appelle les solutions Ikea. Il y a trois tables mais au final tout le monde à la même.

Nous faisons du sur mesure en fonction des données et des besoins des clients. Ce qui nous oblige à une proximité avec nos clients, toujours dans l’objectif de faire le produit le plus parfait et le plus impactant possible. A la différence par exemple des GAFA qui font un produit standard qu’ils diffusent partout, que ce soit utile ou pas.

JDV : Les GAFA sont vos principaux concurrents ?

WS : Nous avons deux types de concurrents. D’abord les GAFA bien sûr, même si les discours qu’ils portent sont plus bénéfiques pour nous que l’inverse. Ils communiquent et confirment que la technologie sur laquelle on misait est la bonne.

Dans le même temps, ils ont des outils, des petites briques logicielles, comme par exemple la synthèse vocale, qu’ils mettent à disposition des développeurs. Même si nous travaillons avec un large éventail de partenaires, il nous arrive de travailler avec les GAFA pour optimiser une partie du process, en fonction de la demande de nos clients.

Pour les autres concurrents, on voit de nombreuses sociétés arriver sur ce secteur. Ce qui est une bonne chose. La concurrence confirme qu’il y a un vrai marché. Mais cela nous oblige à aller vite, voire très vite.

Aujourd’hui, nous avons un vraie longueur d’avance sur nos concurrents mais le marché est tellement énorme qu’il y a vraiment de la place pour tout le monde.

Quel impact sur l’emploi de demain ?

JDV : Quand vous expliquez ce que votre assistant vocal va changer notamment dans le domaine du commerce ou de l’hôtellerie, est ce qu’il n’y a pas un risque pour un grand nombre d’emplois ?

WS : Comme dans toute révolution technologique, il va y avoir des emplois qui vont malheureusement être supprimés. Nous fournissons des outils mais on ne peut pas savoir comment ils vont être utilisés derrière. Je pense que cette nouvelle technologie va aussi créer de nouveaux produits, répondre à de nouvelles problématiques qui vont créer des emplois. D’ailleurs nous connaissons une vraie pénurie de recrutement dans notre secteur, par exemple si on recherche des développeurs. Et puis quand on conçoit des produits, il faudra aussi trouver des personnes capables de former d’autres personnes pour l’utilisation des produits.

Pour prendre le secteur de l’hôtellerie, la réponse sur la suppression d’emplois est clairement non. Parce que l’hôtellerie qu’on vise est l’hôtellerie haut de gamme et c’est très important pour le client d’avoir une relation avec des personnes réelles. Notre produit va soutenir le personnel sur plusieurs points. Limiter les appels pour des questions basiques qui auront leurs réponses via l’assistant vocal. Pour les femmes de ménages, elles pourront utiliser l’assistant vocal pour dire s’il manque quelque chose dans la chambre. Sans avoir besoin de faire des aller-retour incessants.

Selon moi, c’est un outil qui va et qui doit aider et faciliter le travail des personnes au quotidien plutôt que de les remplacer. C’est pour ce type de projets pour lesquels nous avons une appétence qu’on développe cette technologie. Ce sera ensuite de la responsabilité de chacun de savoir comment il veut construire le monde de demain avec les outils dont il dispose.

Ces articles peuvent vous intéresser :

Sonos se lance contre Amazon, Google, Apple…etc.

Alexis

Fernand l’assistant vocal destiné aux agriculteurs

Antoine

Huawei développe un assistant vocal anti-Amazon/Google

Antoine

Zoe l’assistant vocal qui vous accompagne en croisière

Antoine

Homekeeper l’assistant vocal d’aide à la personne 100% made in Normandie

Antoine

Présentation de Bixby : l’assistant vocal de Samsung

Alexis

Laisser un commentaire