Google lance Gemini, son nouveau modèle d'IA pour rivaliser avec ChatGPT

gemini
© JAKUB PORZYCKI / NURPHOTO / NURPHOTO VIA AFP
  • Copié
avec AFP
Un peu plus d'un an après le lancement de ChatGPT, Google commence à déployer mercredi Gemini. Ce nouveau modèle d'intelligence artificielle, doit permettre notamment de renforcer Bard, le système conversationnel de Google. Parmi les particularités, de ce nouveau modèle, on note sa capacité de commenter à l'oral ce qu'il "voit".

Google va commencer mercredi à déployer Gemini, son nouveau modèle d'intelligence artificielle (IA) censé lui permettre de mieux rivaliser avec OpenAI (le créateur de ChatGPT) et Microsoft, des applications pour le grand public aux capacités informatiques pour les entreprises. "C'est notre modèle d'IA le plus conséquent, le plus doué et aussi le plus général", a assuré Eli Collins, un vice-président de Google DeepMind, le laboratoire de recherche en IA du groupe californien, lors d'une présentation à la presse.

Gemini peut "voir"

Il a ensuite diffusé une vidéo où un utilisateur montre des objets, des dessins et des vidéos à Gemini. Le système d'IA commente à l'oral ce qu'il "voit", identifie les objets, joue de la musique et répond à des questions requérant un certain degré d'analyse, en justifiant son "raisonnement". Le nouveau modèle est "multimédia dès sa création, il a des capacités de raisonnement sophistiquées et il peut coder à un niveau avancé", a détaillé Eli Collins.

Depuis le lancement de ChatGPT il y a un an, les géants de la Silicon Valley se livrent une course effrénée à l'IA dite générative, qui permet d'obtenir des textes, images ou lignes de code d'un niveau équivalent à ceux produits par des humains, sur simple requête en langage courant. 

Google, leader de l'IA mais pris de court par le succès phénoménal de ChatGPT, a répondu notamment avec son propre chatbot, Bard. Cependant, tout se joue au niveau des modèles, les systèmes informatiques qui sous-tendent ces applications. Gemini, "c'est une étape de plus vers notre vision : vous amener le meilleur collaborateur d'IA au monde", a de son côté souligné mercredi Sissie Hsiao, vice-présidente de Google chargée de Bard.

Bard doit gagner en capacités dès mercredi

Bard doit gagner en capacités dès mercredi, mais toujours avec des requêtes rédigées, et seulement en anglais. Il faudra attendre 2024 pour les autres fonctions et formats, comme l'aide avancée à la résolution de problèmes de maths. Moins connu que ChatGPT, Bard a l'occasion d'essayer de regagner du terrain sur son rival, victime de son succès : mi-novembre, débordé par la demande, OpenAI a en effet mis sur pause les abonnements à la version payante.

Google va aussi donner accès le 13 décembre à une première version de Gemini à ses clients dans le cloud (informatique à distance). Sur ce terrain, le géant d'internet est en concurrence directe avec Microsoft, principal investisseur d'OpenAI et numéro 2 mondial du cloud, derrière Amazon. Les deux groupes américains ont passé l'année à ajouter des outils d'IA générative à leurs logiciels respectifs (moteur de recherche, logiciels de bureautique et productivité, plateforme de cloud, etc.).