La revue de presse IA/ML – septembre 2023
Nous sommes heureux de vous partager notre toute première revue de presse sur les sujets d’IA et de ML.
Dans une volonté d’accroître la circulation d’informations, nous avons mis en place au sein de notre communauté IA / ML, un nouveau processus de partage d’articles qualitatifs afin de, petit à petit, construire une base de connaissance. Ainsi, grâce à cela, quiconque souhaitant monter en compétence ou s’informer sur un sujet peut profiter de ces articles déjà identifiés.
Les articles partagés ont été soigneusement sélectionnés, et nous vous en proposons ici un résumé dans cette revue de presse qui, nous l’espérons sera la première d’une longue série.
Bonne lecture !
Patterns for Building LLM-based Systems & Products
Partagé par : Antoine | source :eugeneyan
Tag: LLM, Design Pattern
Comme vous avez certainement dû le suivre dans l’actualité de ces derniers mois, les LLM sont omniprésents, et notre newsletter ne fait pas exception ! Mais, au-delà du trend et de l’engouement médiatique, nous devons rester pragmatiques et voir les LLM comme un outil supplémentaire dans notre mallette.
Or nous savons tous que le chemin du PoC à la mise production est très souvent long et fastidieux. A travers cet article, les auteurs nous proposent 7 axes à étudier pour éviter au maximum les pièges et détours et permettre d’avoir une vision orienté résultat : un produit en production utilisant un algo de LLM. Un rêve à la portée de tous maintenant, peut-être.
Announcing OverflowAI
Partagé par : Pierre Ange | source: stackoverflow.blog
Tag : LLM Overflow Open Source
Stack Overflow contre-attaque avec OverflowAI. En effet, les 58 millions de questions / réponses postés sur le blog par l’ensemble des développeurs de la planète sont une formidable source de données pour un algo de LLM.
Au programme : amélioration de la recherche avec des Vector Databases, sourçage des réponses, bot slack, extension VSCode…
En bref, tout pour améliorer la vie des développeurs et séduire les plus réticents d’entre eux.
Generative AI in Jupyter
Partagé par : Antoine | source : blog Jupyter
Tag : LLM Jupyter Open Source
Après OverFlow AI, voilà Jupyter AI (son copilote Jupyternaut et sa commande magique ?%%ai) toujours Open Source, la version 1.0 est disponible dès JupyterLab 3. Pour bénéficier de la version 2.0 de Jupyter AI, cela se passera uniquement sur JupyterLab 4 pour le moment (donc seule la version 1.0 sera dispo sur AWS Sagemaker).
Les skills de ce nouveau compagnon sont multiples et variés : expliquer ou générer du code, fixer des bugs ou encore résumer du contenu à la demande. Assez classique pour un coding assistant me direz-vous, mais là ou Jupyternaut se démarque c’est dans sa capacité à répondre à des questions basées sur les fichiers stockés en local, et aussi et surtout par sa capacité à créer de notebooks sur demande “naturelle” prompt. Magnifique !
Dans l’article vous lirez également, que l’utilisation de Long Chain leurs permet de se connecter à plusieurs fournisseurs tels que AI21, Anthropic, AWS, Cohere, et OpenAI ou même des algos “maison” construits par vos soins.
Bonus : si vous vous demandez si, nous développeurs, nous serons un jour remplacés par ces “.pickles”, je vous répondrais que nous avons encore le temps avant une future reconversion pro, surtout si nous apprenons intelligemment à utiliser ces outils qui permettent, indéniablement, de nous faire gagner du temps. Si vous voulez en savoir plus, je vous invite à regarder la vidéo de Micode ici :
3 Endings More Poetic Than AI Wiping Us Out
Partagé par : Antoine | source: thealgorithmicbridge.substack.com
Tag : Art, GenAI
Nous connaissons tous les fins probables de notre mode : Big Crunch, Big Rip, Big Freeze. Et si la fin de notre espèce humaine était causée par l’IA ?
Cette thèse appelée “AI Doom« , véritable scénario de science-fiction, est de plus en plus abordée dans les débats. Mais Alberto Romero n’est pas convaincu par les récits proposés. Ainsi, à travers cet article, il propose 3 nouveaux récits qu’il annonce plus poétiques, et de surcroît tout cela est généré par une IA. En effet, qui de mieux placé qu’elle pour écrire sur ce sujet?
L’éducation laborieuse de ChatGPT
Partagé par : Erwan | source: groupeonepoint
Tag : ChatGPT
Pour les fanas de ChatGPT et autres ChatBot basés sur des LLM, voici un article expliquant assez bien comment fonctionne son apprentissage.
Ce qui est intéressant à observer est que les LLM ne sont que la partie immergé de l’iceberg. Car pour s’assurer que les réponses de l’IA respectent le principe des “HHH” (Honest – Helpful – Harmless), les développeurs ont mis en place des techniques d’alignement des LLM (3 sont présentés dans l’article), dont une qui utilise une techno toute aussi sexy : du Reinforcement Learning (with Human Feedback)! Petit bonus pour ceux qui veulent s’amuser : https://www.mlyearning.org/how-to-jailbreak-chatgpt/
Machine Unlearning: The right to be forgotten
Partagé par : Arnaud | source: ai.googleblog.com
Tag : Ethics, ML, Unlearning, Kaggle
Après le machine Learning, place au “machine UnLearning”. WTH le Unlearning ? En résumé, cela consiste à faire oublier des exemples d’apprentissage faux ou non respectueux de la privacy (« right to be forgotten »: noble cause…) à des modèles déjà entraînés, sachant que ré entraîner les modèles from scratch serait trop coûteux ?
Belle problématique, aussi éthique que technique, qui pourrait potentiellement ajouter une nouvelle brique au MLOps, le Model update ? Pour tenter de répondre à cette question, Google lance avec ses partenaires académiques le premier concours sur le Machine Unlearning sur Kaggle !