Brainy Sunday #5 - What a week, huh ?
Synthèse d'une semaine pleine de nouveautés et de bons liens IA
Après une semaine bien chargée et pleine de news, j’ai consacré l’essentiel de mon week-end… à refaire mon bureau. C’est donc dans l’odeur de peinture fraîche que je rédige cette nouvelle édition de Brainy Sunday.
Faisons le point ensemble sur les nombreuses (grosses) annonces de la semaine avant de passer en revue les meilleurs outils IA qui sont passés devant mes yeux ces derniers jours.
🗞️ Debrief de la semaine
Comme attendu, la semaine écoulée a été marquée par une avalanche de nouvelles et d'annonces concernant l'intelligence artificielle. Revenons sur les principaux évènements des derniers jours pour voir ce qu’il faut en retenir :
1. La Grande Nouvelle : GTP-4 est arrivé !
La semaine a commencé (très) fort avec l’annonce de GPT-4 par OpenAI. On s’attendait à ce que cette annonce ait lieu le jeudi 16 à l’occasion de la conférence de Microsoft mais OpenAI a créé la surprise en annonçant sa sortie accompagnée d’une démo en live dès mardi.
GPT-4 est donc le successeur de GPT-3 et GPT-3.5, les modèles de langage qui alimentent ChatGPT et sont à l’origine de la plupart des nouveautés IA ces 3 derniers mois. Concrètement, c’est donc une sorte de mise à jour de ChatGPT qui le rend (encore) plus puissant et ajoute de nouvelles fonctionnalités :
Il peut voir. C’est la plus grande nouveauté de GPT-4 : il peut lire et reconnaître des images. Cette fonctionnalité n’est pas encore accessible au public mais le live de mardi a montré comment GPT-4 pouvait expliquer le sens d’une image et même comprendre son aspect comique.
Par contre, il n’est pas directement capable de générer des images. Nul doute cependant qu’une prochaine version du Visual ChaGPT, que j'ai présenté la semaine dernière, intégrera GPT-4Il a une grande mémoire. Alors que les versions précédentes étaient limitées à environ 3000 mots, GPT-4 peut en gérer plus de 25000. Il peut donc lire ou générer des documents ou des conversations beaucoup plus longues.
Il est très intelligent. Ou, du moins, il obtient de (très) bons résultats à différents tests et examens (comme le LSAT ou l’examen du Bareau Américain).
Ces nouvelles capacités rendent GPT-4 encore plus efficace et compétent que son prédécesseur. La démonstration live et les tests des premiers utilisateurs ces derniers jours montrent comment il peut expliquer une image, programmer un jeu comme Snake à lui tout seul, ou encore créer des sites web sur base d’un croquis.
GPT-4 est déjà accessible au public sous trois formes :
Il est évidemment disponible dans ChatGPT Plus, la version payante du chatbot d’OpenAI.
Il est également disponible sur Poe, un chatbot proposé par Quora, qui propose plusieurs modèles dont GPT-4 (uniquement en version premium)
Microsoft a aussi annoncé que GPT-4 est en fait le modèle derrière Bing AI depuis son lancement il y a 5 semaines.
Ces trois versions ne permettent cependant pas l’utilisation des images et ne donnent donc pas accès à toute la puissance de GPT-4. L’accès à l’API, qui se fait par liste d’attente, permettra très bientôt à des développeurs de créer des outils qui utilisent cette possibilité (je parie que je pourrai t’en présenter un dès dimanche prochain).
Enfin, un autre gros changement dont on parle moins mais dont les conséquences seront peut-être les plus importantes, est la nature plus secrète de GPT-4 : jusqu’ici, OpenAI a partagé énormément d’informations sur la manière dont ses modèles de langage étaient créés et formés. Cette fois, l’annonce contient beaucoup moins de détails techniques.
Pour de nombreux observateurs, OpenAI est passé d’un groupe de recherche ouvert à une entreprise complètement fermée dont les communications ressemblent plus à des communiqués de presse qu’à des articles scientifiques.
2. Des photos toujours plus réalistes avec Midjourney 5
L’autre grosse mise à jour de la semaine, c’est la nouvelle version de Midjouney, la déjà très populaire IA de génération d’image qui fonctionne sur Discord.
La différence la plus notable est la qualité des mains qui s’est très fortement améliorée. Jusqu’ici, toutes les IA de génération d’images avaient en effet énormément de mal à dessiner les mains. Midjourney 5 a pratiquement résolu ce problème (même si ce n’est pas encore parfait).
D’une manière générale, cette nouvelle version génère des images ressemblant encore plus à de véritables photos : éclairage, composition, texture,… Tous les aspects de l’image ont été améliorés.
Les premiers tests indiquent aussi que l’IA comprend et respecte mieux les demandes en langage naturel : le prompt - la demande écrite envoyée à l’IA - s’approche de plus en plus d’une simple description du résultat, sans avoir à connaître des expressions ou mots clefs magiques.
Le résultat est qu’il est encore plus simple qu’avant de passer de l’idée à l’image à l’aide de Midjourney.
3. L’IA dans nos bureaux avec Google et Microsoft
Jeudi, Microsoft n’a donc pas annoncé GPT-4 mais plutôt l’arrivée imminente de l’IA dans sa suite bureautique. Microsoft 365 Copilot est le nom de cet assistant qui sera notamment capable de
écrire, corriger, résumer des textes dans Word et Outlook
manipuler et analyser des données dans Excel
générer des présentations Powerpoint
Copilot viendra aussi sous la forme du Business Chat qui permettra de tchater et poser des questions à propos de l'ensemble des données présentes dans la suite 365 (docs, mails, projects, to-dos,...).
Ce ne sont évidemment pas les seuls à avoir eu l’idée d’introduire l’IA dans ces applications de bureautique. Google a en effet annoncé essentiellement la même chose pour ses outils au sein de Google Workspace.
Ni l’un ni l’autre n’ont cependant annoncé de date de sortie officielle. Leurs IAs sont en test auprès de clients ou partenaires de confiance et seront rendues disponibles au fur et à mesure, mais sans date ni planning connu.
4. Une nouvelle alternative à ChatGPT
Alors qu’on est toujours sans nouvelle de Bard et que Ernie, l’alternative chinoise, fait un flop, un tout autre chatbot a fait parler de lui cette semaine : Anthropic AI, une entreprise soutenue par Google, a annoncé la sortie en version bêta de Claude.
Comme ChatGPT, Claude est un assistant IA conçu pour fournir un soutien “utile, honnête et inoffensif” dans diverses tâches de conversation et de traitement de texte. Claude a été entraîné en utilisant une nouvelle méthode appelée l'IA Constitutionnelle (Constitutional AI). Cette approche vise à améliorer les méthodes précédentes comme l'apprentissage par renforcement à partir des retours humains, en évitant de nécessiter des étiquettes de retour d'information sur la nocivité.
Ce chatbot était déjà disponible via Poe (par Quora) et les retours utilisateurs indiquent qu’il fournit des réponses claires et détaillées dans des conversations souvent plus fluides et naturelles que celles avec ChatGPT.
Au passage, on apprend aussi que, contrairement à ce que beaucoup pensaient (moi en premier), Notion AI utilise Claude et pas les modèles d’OpenAI.
5. Nouveaux lancements chez Google
En plus de l’arrivée des IA dans Workspace, Google a fait d’autres d’annonces intéressantes en début de semaine.
Il y a d’abord la mise à disposition de PaLM (un de ses modèles de langage) par API dans la suite Google Cloud. Les développeurs peuvent donc créer des applications et programmes qui utilisent ce modèle comme ils peuvent le faire avec les modèles d’OpenAI.
Google a également annoncé l'ajout d'outils d'IA générative (textes et images) sur sa plateforme Vertex AI. Ce 'Generative AI App Builder' permettra aux développeurs de créer des interfaces de chat et des assistants numériques alimentés par des IA made in Google.
Cela fait un moment que Google fait de la recherche en IA et on savait que leurs équipes étaient douées dans ce domaine. Mais ces recherches ne semblaient pas déboucher sur des produits et solutions concrètes. La donne a clairement changé cette semaine !
🛠️ App, outils et trucs cool
J’ai testé en live sur Twitch la demande à GPT-4 d’écrire une micro-app, il s’en sort vachement bien. Du coup, je vais essayer cursor.so qui devrait rendre l’expérience encore meilleure.
Et bientôt, il ne sera même plus nécessaire de coder. Flutterflow vient par exemple d’annoncer son IA pour générer des applications mobiles.
En attendant l’IA dans Powerpoint, tu peux déjà demander à l’IA de créer des présentations pour toi avec Tome (qui a récemment levé 43 Millions de $) ou MagicSlides.
Intercom lance Fin, présenté comme le ChatGPT du support client. Assez logiquement, je m’attends à ce que la plupart des sociétés qui proposent des chatboxes de support développent leurs solutions IA comme celle-ci.
Milo veut devenir le copilote de la vie de famille, pour qu’on puisse se concentrer sur ce qui compte et pas sur la logistique.
Avec /ai, tu peux intégrer l’IA générative d’un coup dans tous les champs textes de tous les sites.
J’avais pensé créer un ChatGPT qui répond à partir du contenu de pages Notion… Quelqu’un à créé ce AskNotion avant moi…
Si tu as un Ipad, essaye Kids Drawing Magic, l'application de dessin alimentée par l'IA qui rend l'art amusant et facile pour les enfants de tous âges !
📰 Le reste de l’actu en (très) bref
La première alternative open-source à ChatGPT est sortie 🇫🇷
Les développeurs d'OpenChatKit ont adopté une approche décentralisée pour la puissance de calcul.
Bien qu'il ait des capacités limitées, OpenChatKit excelle dans le résumé, la réponse aux questions en contexte, l'extraction d'informations et la classification du texte.
D'autres chatbots basés sur des technologies similaires, comme les modèles LLaMa de Meta, devraient apparaître prochainement.
GPT-4 pour apprendre les langues avec DuoLingo 🇫🇷
Duolingo fait partie des premiers partenaires privilégies à pouvoir intégrer GPT-4 dans leurs applications.
Duolingo introduit un nouveau niveau d'abonnement, Duolingo Max, avec deux fonctionnalités basées sur GPT-4 : Expliquez ma réponse et Jeu de rôle.
La fonction "Expliquez ma réponse" permet aux utilisateurs de discuter avec Duo pour comprendre leurs erreurs et recevoir des explications détaillées.
La fonction "Jeu de rôle" offre des scénarios rédigés par des humains pour pratiquer la conversation avec l'IA dans la langue apprise.
lls travaillent sur une mise à jour d'ampleur pour Siri, pour combler le retard pris face à ChatGPT.
Il faudra des mois pour qu'Apple produise une IA aussi complète et créative que ChatGPT.
Amazon rencontre des défis similaires avec son assistant vocal, Alexa, et travaille également à rattraper son retard.
Une IA qui tourne sur un ordinateur personnel ! 🇫🇷
LLaMA, le modèle de langage de Meta, rivalisant avec GPT-3, a été piraté et rendu publique la semaine dernière.
LLaMA est disponible en plusieurs tailles, et la plus petite version n'a pas besoin de grosses cartes graphiques ou de serveurs, contrairement à GPT-3 ou aux autres modèles de genre.
Le modèle est maintenant fonctionnel en local sur des MacBook, Windows, Pixel 6 et Raspberry Pi.
Le sidebar Bing AI est disponible 🇬🇧
La nouvelle barre latérale apparaît sous la forme d'un gros bouton Bing en haut à gauche d'Edge
La barre latérale Bing est basée sur le contexte de la page que vous consultez dans Edge.
Elle peut résumer des articles, comparer des éléments sur une page web et permet de choisir parmi différents tons pour générer du texte.
Elle peut également être utilisée pour générer des textes (article de blog, réponses sur les réseaux, emails)
Quelle semaine !
J’espère que celle qui s’annonce sera un peu plus calme pour qu’on puisse souffler un peu et prendre le temps d’intégrer tout ce qui a déjà changé avec les dernières annonces.
Dans tous les cas, je serai là dimanche prochain pour faire le point et continuer à explorer le monde des IA avec toi.
Thomas
PS: Si tu as aimé ce mail, dis-le en scrollant jusqu’au titre tout en haut et clique sur le ❤️ - Merci !
Brainy Sunday #5 - What a week, huh ?
Je prends beaucoup de plaisir à lire ta newsletter, merci beaucoup !