ChatGPT a désormais une voix et des yeux

La dernière version du célèbre chatbot intègre le dialogue au son ainsi que la possibilité d’interpréter des images. Une nouvelle façon de rendre cet outil dopé à l’intelligence artificielle plus facile à utiliser, selon l’entreprise conceptrice.

ChatGPT parle. Ce n’est pas une blague, mais une réalité dévoilée par OpenAI, la firme technologique à l’origine du plus illustre des agents conversationnels. L’entreprise basée à San Francisco a annoncé, le 25 octobre dernier, l’arrivée d’une nouvelle version de son logiciel capable d’interagir avec l’utilisateur vocalement.

Autant dire à la façon de Siri, l’assistant vocal d’Apple ou encore d’Alexa, créé par Amazon. À une différence près – et pas des moindres – que le nouveau ChatGPT promet de faire beaucoup mieux. A commencer par les voix – l’utilisateur en a cinq au choix – autrement plus réalistes que celles des autres assistants vocaux présents sur le marché.

OpenAI dit avoir collaboré avec « des comédiens professionnels pour créer chacune des voix ». Son modèle Whisper acoustique d’apprentissage a également été mis à contribution.

Des capacités décuplées

Les capacités vocales du nouveau chatbot sont par ailleurs plus étendues. Alors que Siri ou Alexa sont prévus pour exécuter des tâches prédéfinies, ChatGPT agit de façon plus intuitive, plus réactive. Il est ainsi susceptible de rattraper le coup quand une erreur lui est notifiée.

L’autre grande innovation annoncée par OpenAI concerne les échanges par image. Autrement dit, la possibilité pour l’agent conversationnel d’interpréter une image, voire de lui fournir tout le contexte adéquat. Une des façons d’avoir recours à cette fonctionnalité est de prendre une photo avec le téléphone puis de la soumettre au chatbot avec des questions.

« Quel repas suis-je en mesure de faire avec les ingrédients ci-après ? » ou encore « de quelle nature est la tache présente sur la photo ? ». Telles sont autant de possibilités de converser avec ChatGPT.

Rétrécissement des frontières

Alors que les agents conversationnels se multiplient, ChatGPT témoigne à travers cette mise à jour de sa capacité à intégrer plus rapidement les innovations.

La nouvelle version disponible sur les appareils iOS (iPhone, iPad, et autres) et Android au cours des deux prochaines semaines rend par ailleurs encore plus ténue la frontière la réalité et l’intelligence artificielle.

De quoi reléguer Alexa, Siri et les autres au rang de simples gadgets obsolètes. Il sera d’ailleurs à voir comment Apple et Amazon entendent répondre à cette course effrénée vers l’IA.

Laisser un commentaire