Gemini de Google : l’IA révolutionnaire qui comprend le monde

Google a récemment lancé Gemini, un modèle d’intelligence artificielle générative, dans le but de rivaliser avec le célèbre ChatGPT d’OpenAI. Ce nouvel assistant représente un tournant majeur dans le domaine de l’IA, promettant une compréhension du monde qui l’entoure et des capacités de raisonnement exceptionnelles.

Gemini, le dernier-né de Google, a été présenté comme le modèle d’IA le plus ambitieux de l’entreprise. Eli Collins, vice-président de Google DeepMind, a souligné lors d’une conférence de presse que c’est le premier modèle à surpasser les experts humains dans le test industriel standard MMLU, évaluant les capacités de raisonnement dans des domaines variés, de mathématiques à l’histoire et au droit.

La vidéo de démonstration de Gemini a captivé l’audience en montrant comment cet assistant peut comprendre des objets, des dessins et des vidéos. La capacité de Gemini à commenter à l’oral ce qu’il “voit”, à identifier des objets, à jouer de la musique et à répondre à des questions complexes démontre un niveau avancé de compréhension multimodale.

La course à l’IA générative entre les géants de la Silicon Valley s’est intensifiée depuis le lancement de ChatGPT il y a un an. Google, déterminé à rester compétitif, a également introduit son propre chatbot, Bard. Cependant, Gemini représente une avancée significative, avec des capacités de raisonnement sophistiquées et une compétence exceptionnelle dans le domaine multimédia.

Sissie Hsiao, vice-présidente de Google chargée de Bard, a souligné que l’intégration de Gemini à l’outil d’IA conversationnelle de Google marque une étape majeure vers la réalisation de leur vision d’offrir le “meilleur collaborateur d’IA au monde”. Cette intégration devrait renforcer les capacités de Bard, bien que certaines fonctionnalités avancées ne soient disponibles qu’en 2024.

Gemini ne se limite pas à la conversation textuelle, car il peut également analyser en temps réel du texte ou des vidéos et résoudre des problèmes mathématiques avancés. Cette capacité, dévoilée dans une démonstration de cinq minutes, place Gemini en tête de la course à l’IA générale, avec des compétences dépassant celles de l’humain dans le test MMLU.

Google compte également résoudre les défis liés à la faible perception du monde réel par les machines en intégrant Gemini à des robots dotés de capacités sensorielles avancées, y compris le sens du toucher. Avec une version allégée déjà intégrée à Bard et au smartphone Pixel 8 Pro, et une version ultra puissante prévue pour début 2025, Gemini promet de redéfinir les normes de l’intelligence artificielle.