La revue de presse IA/ML – septembre 2023

Temps de lecture : 4 minutes

Nous sommes heureux de vous partager notre toute première revue de presse sur les sujets d’IA et de ML.

Dans une volonté d’accroître la circulation d’informations, nous avons mis en place au sein de notre communauté IA / ML, un nouveau processus de partage d’articles qualitatifs afin de, petit à petit, construire une base de connaissance. Ainsi, grâce à cela, quiconque souhaitant monter en compétence ou s’informer sur un sujet peut profiter de ces articles déjà identifiés.

Les articles partagés ont été soigneusement sélectionnés, et nous vous en proposons ici un résumé dans cette revue de presse qui, nous l’espérons sera la première d’une longue série.

Bonne lecture !

Patterns for Building LLM-based Systems & Products

Partagé par : Antoine | source :eugeneyan

Tag: LLM, Design Pattern

Comme vous avez certainement dû le suivre dans l’actualité de ces derniers mois, les LLM sont omniprésents, et notre newsletter ne fait pas exception ! Mais, au-delà du trend et de l’engouement médiatique, nous devons rester pragmatiques et voir les LLM comme un outil supplémentaire dans notre mallette.

Or nous savons tous que le chemin du PoC à la mise production est très souvent long et fastidieux. A travers cet article, les auteurs nous proposent 7 axes à étudier pour éviter au maximum les pièges et détours et permettre d’avoir une vision orienté résultat : un produit en production utilisant un algo de LLM. Un rêve à la portée de tous maintenant, peut-être.

Announcing OverflowAI

Partagé par : Pierre Ange | source: stackoverflow.blog

Tag : LLM Overflow Open Source

Stack Overflow contre-attaque avec OverflowAI. En effet, les 58 millions de questions / réponses postés sur le blog par l’ensemble des développeurs de la planète sont une formidable source de données pour un algo de LLM.

Au programme : amélioration de la recherche avec des Vector Databases, sourçage des réponses, bot slack, extension VSCode… 

En bref, tout pour améliorer la vie des développeurs et séduire les plus réticents d’entre eux. 

Generative AI in Jupyter

Partagé par : Antoine | source : blog Jupyter

Tag : LLM Jupyter Open Source

Après OverFlow AI, voilà Jupyter AI (son copilote Jupyternaut et sa commande magique ?%%ai) toujours Open Source, la version 1.0 est disponible dès JupyterLab 3. Pour bénéficier de la version 2.0 de Jupyter AI, cela se passera uniquement sur JupyterLab 4 pour le moment (donc seule la version 1.0 sera dispo sur AWS Sagemaker).

Les skills de ce nouveau compagnon sont multiples et variés : expliquer ou générer du code, fixer des bugs ou encore résumer du contenu à la demande. Assez classique pour un coding assistant me direz-vous, mais là ou Jupyternaut se démarque c’est dans sa capacité à répondre à des questions basées sur les fichiers stockés en local, et aussi et surtout par sa capacité à créer de notebooks sur demande “naturelle” prompt. Magnifique !

Dans l’article vous lirez également, que l’utilisation de Long Chain leurs permet de se connecter à plusieurs fournisseurs tels que AI21, Anthropic, AWS, Cohere, et OpenAI ou même des algos “maison” construits par vos soins. 

Bonus : si vous vous demandez si, nous développeurs, nous serons un jour remplacés par ces “.pickles”, je vous répondrais que nous avons encore le temps avant une future reconversion pro, surtout si nous apprenons intelligemment à utiliser ces outils qui permettent, indéniablement, de nous faire gagner du temps. Si vous voulez en savoir plus, je vous invite à regarder la vidéo de Micode ici :

3 Endings More Poetic Than AI Wiping Us Out

Partagé par : Antoine | source: thealgorithmicbridge.substack.com

Tag : Art, GenAI

Nous connaissons tous les fins probables de notre mode : Big Crunch, Big Rip, Big Freeze. Et si la fin de notre espèce humaine était causée par l’IA ?

Cette thèse appelée “AI Doom« , véritable scénario de science-fiction, est de plus en plus abordée dans les débats. Mais Alberto Romero n’est pas convaincu par les récits proposés. Ainsi, à travers cet article, il propose 3 nouveaux récits qu’il annonce plus poétiques, et de surcroît tout cela est généré par une IA. En effet, qui de mieux placé qu’elle pour écrire sur ce sujet?

L’éducation laborieuse de ChatGPT

Partagé par : Erwan  | source: groupeonepoint

Tag : ChatGPT

Pour les fanas de ChatGPT et autres ChatBot basés sur des LLM, voici un article expliquant assez bien comment fonctionne son apprentissage.

Ce qui est intéressant à observer est que les LLM ne sont que la partie immergé de l’iceberg. Car pour s’assurer que les réponses de l’IA respectent le principe des “HHH” (Honest – Helpful – Harmless), les développeurs ont mis en place des techniques d’alignement des LLM (3 sont présentés dans l’article), dont une qui utilise une techno toute aussi sexy : du Reinforcement Learning (with Human Feedback)! Petit bonus pour ceux qui veulent s’amuser : https://www.mlyearning.org/how-to-jailbreak-chatgpt/

Machine Unlearning: The right to be forgotten

Partagé par : Arnaud | source: ai.googleblog.com

Tag : Ethics, ML, Unlearning, Kaggle

Après le machine Learning, place au “machine UnLearning”. WTH le Unlearning ? En résumé, cela consiste à faire oublier des exemples d’apprentissage faux ou non respectueux de la privacy (« right to be forgotten »: noble cause…) à des modèles déjà entraînés, sachant que ré entraîner les modèles from scratch serait trop coûteux ?

Belle problématique, aussi éthique que technique, qui pourrait potentiellement ajouter une nouvelle brique au MLOps, le Model update ? Pour tenter de répondre à cette question, Google lance avec ses partenaires académiques le premier concours sur le Machine Unlearning sur Kaggle !

Commentaires :

A lire également sur le sujet :