Brainy Sunday #18 - Qui ne connait pas ChatGPT ?

Toujours plus d'IA dans nos outils, Meta se dévoile et une génération d'images encore plus impressionnante

juil. 02, 2023

Hello 👋
Oui, oui, je suis toujours là !
J’avoue, entre un agenda trop chargé et un besoin de repos, j’ai jeté l’éponge la semaine dernière dernier et il n’y a donc pas eu de Brainy Sunday. A vrai dire, je suis resté un peu la tête dans le guidon jusqu’à vendredi…
Mais j’ai repris ma veille avec enthousiasme et rattrapé mon retard ce week-end et je peux donc te livrer une grosse vingtaine d’actus, un paquet de bons liens et même un petit exercice pratique.
Bonne lecture !

r/midjourney - Finally, proof! — Finally, proof! par soulnemesis avec Midjourney

❓Quelle(s) IA utilises-tu ?

Cette semaine, j’ai vu passer cette étude américaine à propos de l’IA et de son utilisation.

J'avoue avoir été un peu surpris. Près d'un Américain sur deux n'a apparemment pas entendu parler de ChatGPT - et seul un sur quatre semble connaître les IA de génération d'image comme Midjourney ou Stable Diffusion.

Je sais que mon enthousiasme m'enferme un peu dans une sorte de bulle, mais j'ai du mal à imaginer que 47% des Américains n'aient jamais entendu parler des IA génératives. D'autant que je me dis que ça doit être à peu près pareil chez nous (je ne vois pas pourquoi ça ne serait pas le cas).

Un autre chiffre intéressant concerne les usages de l'IA qui apparaît comme majoritairement utilisée pour la recherche d'information et la création :

Tu me connais un peu : l'idée qu'une des principales utilisations de ChatGPT soit d'obtenir des réponses à des questions m'inquiète un peu. Vu la tendance à l'hallucination des modèles de langage, ça me semble encore moins prudent que de se contenter de lire le premier résultat Google…

Et puis, tout ceci me fait surtout me demander ce qu'il en est de mes lecteurs.

Vu que tu me lis, je me doute que tu dois faire partie de ceux qui ont déjà (beaucoup) entendu parler des différents outils IA comme ChatGPT, Midjourney, Bard, DALL-E, Bing,etc. Mais est-ce que tu les utilises régulièrement ?

Ta réponse m'intéresse 👇

Chargement...

Et si tu as quelques minutes de plus, ça m'intéresserait énormément que tu me dises quelle(s) IA tu utilises et pour quoi faire. Ou si tu n'en utilises pas, pourquoi.

→ Partage moi ton experience en répondant à ce mail.

r/midjourney - My Neighbor Totoro — Live Action Studio Ghibli par Arcfuse01 avec Midjourney

Envie d’apprendre à (mieux) utiliser l’IA ?

Un des trucs qui m’a occupé ces derniers temps, c’est ma participation à une formation sur l’IA crée avec l’équipe de Contournement.

Ils ont en effet mis sur pied le Cahier de vacances de l’IA - une formation en ligne pour devenir plus productif grâce au no-code et à l'IA et pour laquelle j’ai créé une série de vidéos.

Si tu te dis depuis un moment que tu voudrais introduire l’IA dans ton quotidien mais que tu ne sais pas trop comment faire ou par où commencer, c’est très probablement la formation qu’il te faut.

En savoir plus sur la formation

🛠️ App, outils et autres bons liens

L’éditeur d’images IA de PlayGround AI a été complètement revu et amélioré et devient l’un des plus complets du marché. (voir la vidéo de présentation)
Les outils de génération de QRcode sont toujours à la mode avec des sites comme Hovercode et QR Code Monster.
Slated propose un outil pour organiser des meeting de 3 personnes ou plus à l’aide de l’IA.
Récolte et analyse les commentaires de tes clients et utilisateur à l’aide de l’IA avec Olvy
Génère ton avatar 3D à partie de tes photos avec l’IA d’Avaturn (voir mon test)
Quantified forme et entraine les équipes de vente en les faisant participer à des mises en situation avec l’IA.
L’IA de Sketch2Render transforme tes croquis de maison et bâtiment en dessins complet et détaillés.
Gan.AI et Ubique proposent tous les deux un service assez similaire : enregistrer une vidéo et la personnaliser pour tous tes contacts ou prospects.
Crée un chatbot IA entrainé à partir de tes page Notion avec Userdesk.
h2oGPT permet d’envoyer un même prompt à 6 modèle de langage Open Source en une fois.
L’IA de PlayHT peut générer et cloner des voix.
Il est maintenant possible de générer des voix à l’aide de l’IA sur Cohesive.
C’est plus fun que réellement utile à ce stade, mais la démo de l’éditeur d’image DragGan est disponible en ligne.
A tester également : la génération de vidéo sur base de texte avec ZeroScope.

Test de l’IA de stable Diffusion XL par moi-même

🧪 A tester : la génération d’image

Avec moins d’un quart des américain qui ont déjà testé Midjourney, je me doute qu’il doit y avoir un paquet de personnes qui n’ont encore jamais créé d’image avec l’IA.

Si c’est ton cas, je te propose de changer ça en prenant quelques minutes pour générer ta toute première image avec une IA gratuite, simple à utiliser et efficace.

Pour cela, je t’invite à te rendre sur le site de ClipDrop qui permet d’utiliser gratuitement la toute dernière version de Stable Diffusion.

Là, tu doit juste écrire un prompt, c’est à dire une description de ton image puis cliquer sur Generate pour lancer l’IA qui va générer 4 images différentes que tu pourras ensuite agrandir d’un clic.

Voici 3 prompts de départ, du plus simple au plus complexe, que je t’invite à modifier avec le sujet (en gras) de ton choix pour te lancer :

Pirate cat, full body shot, action movie still

portrait photograph of an roswell extra-terrestrial alien as a ww2 general, high detail, shot on kodachrome, film photograph, analog photography portrait masterpiece

complex 3d render ultra detailed of a beautiful porcelain cracked android face, cyborg, 150 mm, beautiful studio soft light, rim light, vibrant details, luxurious cyberpunk, lace, hyperrealistic, anatomical, facial muscles, cable electric wires, microchip, elegant, beautiful background, octane render, 8k

(Astuce : le prompt doit être anglais - mais tu peux utiliser Deepl pour traduire facilement les mots ou expressions dont tu as besoin.)

Je reprend, étape par étape, ce que tu dois faire pour créer ta première image avec l’IA :

Choisir une des description (prompts)ci-dessus et la copier.
Aller sur clipdrop.co/stable-diffusion
Coller la description dans le champs texte
Cliquer sur le bouton Generate
Attendre quelques instant
Admirer le résultat et cliquer sur une image si tu veux la voir en grand
Cliquer sur le bouton “download” en haut à droite et répondre à ce mail en m’envoyant ta création.

Après cette première experience, essaye d’imaginer d’autres scènes et descriptions pour créer de nouvelles images - et n’hésites pas à me demander conseils (par email, sur Twitter ou sur LinkedIn) si tu veux améliorer tes résultats 😉

r/midjourney - Arcade Machines in Dystopia — Arcade Machines in Dystopia par timeless_aiart avec Midjourney

📰 L’actu en (très) bref

Meta dévoile un impressionnant outil de synthèse vocale
- Ce nouvel outil nommé Voicebox peut générer des voix aussi facilement que chatGPT peut générer du texte.
- Meta a entraîné Voicebox sur 60 000 heures de livres audio en anglais et 50 000 heures de livres audio multilingues en six langues pour obtenir des performances optimales.
- Il peut supprimer intelligemment les bruits des clips vocaux, comme les aboiements de chiens, et régénérer la voix sans en perdre une miette.
- Il peut traiter un texte qu'il n'a jamais reçu auparavant et en générer une version en respectant le contexte et les inflexions de voix.
Des milliers de comptes chatGPT ont été piratés
- Plus de 100 000 identifiants de comptes ChatGPT ont été piratés et sont en vente sur le dark web.
- Les pirates auraient utilisé des logiciels "voleurs d'informations" pour voler les comptes, notamment le logiciel russe Racoon.
- ChatGPT, par défaut, conserve toutes les demandes des utilisateurs et des réponses de l'IA. Un accès non autorisé aux comptes ChatGPT peut donc révéler des données privées ou sensibles.
- Il est recommandé aux utilisateurs de ChatGPT de changer immédiatement leur mot de passe pour protéger leur compte.
L’opération européenne de lobbying d’OpenAI semble avoir fonctionné
- OpenAI a approché les législateurs européens pour leur suggérer des modifications du Règlement sur l'intelligence artificielle au cours des douze derniers mois.
- OpenAI a partagé un livre blanc avec des demandes de modifications du texte, et certaines de ces demandes ont été incluses dans le texte adopté par le Parlement européen le 14 juin.
- OpenAI a notamment réussi à influencer le législateur européen pour que ses systèmes d'IA générative, comme ChatGPT ou Dall-E, ne soient pas considérés comme des "systèmes à haut risque".
- Ca n’a probablement aucun lien mais OpenAI a également annoncé l’ouverture de ses bureau européen à Londres.
Unity lance deux outils IA pour les créateurs de jeux vidéo
- Unity est une plateforme de développement qui permet de créer, executer et monétiser des jeux 2D et 3D.
- Le premier outil, Unity Muse, est un chatbot qui peut répondre aux questions des développeur et les aider à créer plus vite, notamment en écrivant du code à leur place.
- Muse permet de créer des éléments de jeux et des objets 3D à l'aide de prompts et de croquis.
- Un second outil, Unity Sentis, permet d'intégrer et utiliser un modèle d'IA dans les jeux créés sur la plateforme - par exemple pour générer des dialogues.
Dropbox intègre lui aussi l’IA avec Dropbox Dash et Dropbox AI
- Le service de stockage et de partage de fichiers en ligne Dropbox a créé la surprise en annonçant ces deux outils.
- Dropbox Dash est un outil universel de recherche de documents qui centralise tous les contenus et applications dans une seule barre de recherche.
- Dropbox AI offre une fonctionnalité avancée d'aperçu de fichiers qui permet d'obtenir des résumés concis de documents volumineux et des informations en quelques clics.
- Pour l'instant, ces fonctionnalités sont proposées en version test aux clients Dropbox Pro aux USA.
La nouvelle version du chatbot chinois Ernie semble très puissante
- Baidu teste publiquement son chatbot Ernie en Chine depuis mars 2023.
- Ils ont annoncé que la nouvelle version du modèle d'IA a surpassé le ChatGPT d'OpenAI dans plusieurs domaines clés.
- Lors de tests basés sur des examens d'entrée et de qualification standard en Chinois, Ernie s’impose comme le meilleur des modèle de langage.
Opera lance son nouveau navigateur qui intègre nativement l'IA
- Opera est l'un des rares navigateurs qui parvient à se distinguer face à des géants tels que Google Chrome, Microsoft Edge ou Firefox.
- Le nouveau Opera One embarque une intelligence artificielle nommée Aria.
- Similaire à Bing dans dans la navigateur de Microsoft, Aria peut effectuer des recherches d'informations sur le Web, répondre à des questions sur le contenu des pages visitées et générer du texte ou du code.
- Opera One propose aussi une toute nouvelle interface dynamique qui s'adaptera progressivement aux besoins des utilisateurs.
Midjourney s’améliore encore avec sa version 5.2
- La plus grande nouveauté est l'introduction du “zoom arrière”, un outil d’outpainting qui permet d'élargir le champ d'une image tout en conservant ses détails (similaire à l’outil Uncrop que je t’avais partagé).
- Une nouvelle commande /shorten a été ajoutée pour analyser les prompts et suggérer des alternatives plus concises et efficaces.
- Cette nouvelle version propose également de nouveaux modes de variation (appelée Remix) et une amélioration du paramètre —stylize pour augmenter la variation des résultats
Stability AI sort un nouveau Stable Diffusion XL
- Stable Diffusion est un autre modèle de génération d’image créé et partagé en open source par Stability AI.
- Un nouveau modèle nommé Stable Diffusion XL est en test depuis plusieurs semaines.
- La version 0.9 de ce modèle est partagée et disponible en ligne (sur dreamstudio et clipdrop).
- La qualité des images est grandement améliorée avec cette mise à jour - particulièrement pour les images photoréalistes.
- Cette sortie annonce l’arrivée prochaine d’une version 1.0 qui devrait, logiquement, être partagée en Open Source.
Youtube double les vidéo à l’aide de l’IA
- YouTube s'est associé à l'équipe d'Aloud, spécialisée dans le doublage par IA, pour permettre aux créateurs de doubler facilement leurs vidéos.
- YouTube prévoit d'intégrer cette fonctionnalité de manière native : les utilisateurs pourront choisir la langue de l’audio comme ils peuvent déjà le faire pour les sous-titres.
- Actuellement, le doublage n’est possible que dans 3 langues (anglais, espagnol et portugais) et reste plutôt monocorde - mais Aloud promet des avancées rapides.
- Cette fonctionnalité devrait être définitivement lancée en 2024 et est actuellement en test chez certains créateurs, dont la chaîne américaine The Amoeba Sisters.
Vimeo intègre de nouvelles fonctionnalités IA
- La plateforme de vidéo Vimeo intègre de nouveaux outils d'IA pour ses utilisateurs payants, dont une fonctionnalité de génération de scripts.
- Un prompteur est également inclus, permettant aux utilisateurs d'ajuster le timing et la taille de la police, ainsi qu'un éditeur de vidéo qui identifie automatiquement les "mots de remplissage, les longues pauses et les “moments gênants", et permet de les supprimer en un seul clic.
- Les outils seront disponibles à partir du 17 juillet pour les utilisateurs qui souscrivent à l’offre payante.
Google intègre l’IA générative dans Google Sheets
- En mars dernier, Google a annoncé Duet, une série de nouvelles fonctionnalités d'IA générative pour sa suite professionnelle (Workspace).
- Cette semaine, ils ont annoncé la fonctionnalité “Help me to organize" pour Google Sheets.
- Avec cette fonctionnalité, Duet peut créer des tableaux et des modèles ou ré-arranger les données sur base de texte.
- Cette fonctionnalité vient compléter le “Help me write” déjà lancé avec Duet pour Gmail et Google Docs.
- Duet est accessible en test avec Workspace Lab - mais pas encore en France ni en Belgique.
AMD continue son offensive pour contrer NVIDIA
- AMD a annoncé deux nouveaux partenariats stratégiques pour le développement de ses puces destinées aux IA : HuggingFace (plateforme IA open-source) et PyTorch (framework logiciel de machine learning).
- Cette annonce a été faite en même temps que le lancement d’une nouvelle gamme de puces, l'Instinct MI300X, destinée à gérer les charges de travail massives requises par l'IA.
- AMD, qui avait déjà annoncé un partenariat avec Microsoft, cherche clairement à mettre fin au quasi-monopole de son concurrent, NVDIA.
Microsoft annonce de nouvelles fonctionnalités pour Bing AI
- Avec notamment l’amélioration des performances de la reconnaissance vocale sur l'application mobile (iOS et Android)
- La recherche vocale est également disponible sur la version desktop de Bing Chat, en plus de la version mobile.
- Lancement de la reconnaissance d’images : les utilisateurs peuvent télécharger une image et poser des questions à son propos.
- Amélioration des performances : Bing Chat est plus rapide que jamais.
Microsoft annonce également l’arrivée de l’IA dans Bing Shopping
- L'IA de Bing pourra automatiquement générer des guides d'achats : listes de produits, comparatifs,…
- Ces nouveaux guides d'achat de Bing sont désormais disponibles aux États-Unis avant un déploiement mondial de la fonctionnalité.
- Bing Shopping pourra également comparer et synthétiser les avis utilisateurs et clients des produits.
- Un comparateur de prix permettra également de trouver les meilleurs offres et promotions.
Même le Vatican prend position sur la question de l'IA
- Le Vatican a publié un manuel de bonnes pratiques pour les laboratoires de développement d'IA et l'industrie technologique en général.
- Les bonnes pratiques défendues dans le manuel sont centrées sur de grands principes et valeurs, tels que la responsabilité, la transparence et la nécessité de respecter l'environnement.
- Derrière chacun de ces grands principes, le manuel propose des idées claires, des outils et des propositions de solutions pour assurer leur efficacité.
Le générique de la nouvelle série Marvel a été générée avec l’IA
- La nouvelle série Marvel "Secret Invasion", diffusée sur Disney+, a suscité une polémique en raison de son générique entièrement généré par une IA.
- Le générique de la série, qui mélange des images de personnages et de paysages, a été généré par une IA, une approche qualifiée d'"exploratoire et inévitable" par le producteur exécutif, Ali Salim
- Cette utilisation de l'IA a suscité des critiques de la part des artistes professionnels, qui craignent que l'IA ne remplace leur travail et ne s'approprie certains éléments de leurs œuvres.
- Certains, comme le directeur créatif Patrick Clair, voient l'IA non pas comme une menace pour les rôles créatifs, mais comme une technologie qui changera la façon dont l'industrie travaille.
Les Grammy Awards anticipent et réglementent la musique créée par IA
- Leur règlement a été mis à jour pour préciser que seuls les créateurs humains peuvent être pris en considération pour une nomination.
- Pour qu'une œuvre réalisée avec l'aide de l'IA soit prise en compte, un humain doit avoir apporté une contribution "significative" au processus créatif.
- Pour être nommé dans la catégorie "Album de l'année", l'artiste ou tout autre contributeur doit avoir participé à au moins 20% de l'album.
- Ces nouvelles règles montrent l'impact croissant de l'IA sur l'industrie musicale et la nécessité de définir des règles claires pour son utilisation.
DeepMind crée un modèle d'IA universel pour la robotique
- La filiale de Google a développé un modèle appelé RoboCat qui peut effectuer diverses tâches via différents modèles de bras robotiques.
- RoboCat a été formé à partir d'images et de données portant sur les actions des robots, collectées à la fois en situation réelle et en simulation pure.
- Bien que RoboCat ait été entrainé sur quatre types de robots avec des bras à deux pinces, le modèle a pu s'adapter à un bras plus complexe utilisant une pince à trois doigts avec deux fois plus d'entrées contrôlables.
Hugging Face prend position pour l’Open Source devant le Congrès américain
- Clément Delangue, PDG de Hugging Face, a témoigné devant le Congrès américain et souligné l’importance de l’Open Source et de l’Open Science pour le développement de l’IA.
- Pour lui, l’IA doit être démocratisée et généralisée pour exploiter son plein potentiel transformationnel.
- L'approche ouverte permet un accès gratuit et facile aux modèles d'IA, permettant à quiconque ayant les compétences et l'initiative de les développer.
- Hugging Face adopte donc une approche ouverte et éthique de l'IA, avec une documentation ouverte, des mesures de sauvegarde, une modération communautaire, et des jeux de données opt-in/opt-out pour respecter les droits d'auteur.
Meta se veut transparent sur son utilisation de l’IA
- Meta cherche à être plus transparent en expliquant comment Facebook et Instagram classent le contenu et comment les utilisateurs peuvent contrôler ce qu'ils voient sur les applications.
- Ils publient des "cartes de système" qui donnent des informations sur le fonctionnement de leurs IA.
- Ces cartes couvrent le flux d'actualités, les stories et les autres interface de consultation du contenu.
- Ils mettent également à disposition des chercheurs des outils et des données pour qu'ils puissent étudier leurs systèmes.
OpenAI annonce un produit concurrent à… Microsoft !
- OpenAI envisagerait de commercialiser une version adaptée de ChatGPT pour en faire un "assistant personnel super intelligent pour le travail" qui pourrait rédiger des brouillons de documents ou résumer des réunions.
- Un tel assistant serait en concurrence directe avec les Copilotes que Microsoft intègre dans ses produits pour les entreprises.

r/midjourney - The Good, the Bad and the Lizard (Lizergio Leone, 1966) — The Good, the Bad and the Lizard (Lizergio Leone, 1966) par mossymayn avec Midjourney

C’est tout pour cette semaine !
J’attends avec impatience tes réponses à mes questions et les images que tu auras généré avec Stable Diffusion.
Et on se retrouve bien évidemment la semaine prochaine pour une nouvelle édition pleine de bons liens.
- Thomas

r/midjourney - Stylish Skippies — Stylish Skippies par Spaggers89 avec Midjourney