- Sep 2, 2024
Bienvenue sur la newsletter de l'été 2024
- Vincent Terrasi
- 0 comments
OpenAI en tête, mais Google et Meta rattrapent leur retard ! 🏎️
L'été 2024 a été marqué par une course effrénée à l'innovation dans le domaine de l'IA. OpenAI, longtemps considéré comme le leader incontesté, avec ses modèles de langage révolutionnaires comme GPT, se retrouve aujourd'hui confronté à une concurrence féroce. Google et Meta sont en train de rattraper leur retard, investissant massivement dans la recherche et le développement de l'IA. Je vous invite à regarder l'animation suivante :
Que se passe-t-il exactement?
- Google : retour en force : Google est loin de se laisser distancer. L'entreprise a présenté ses propres modèles de langage, notamment Gemini 1.5 Pro, et travaille activement sur des applications concrètes de l'IA dans tous ses produits et services.
- Meta : ambitions audacieuses : Meta, la maison-mère de Facebook et Instagram, a également annoncé des avancées significatives avec Llama 3.1, ce modèle interdit en Europe pour des raisons de RGPD offre des performances incroyables.
A retenir:
- OpenAI a clairement perdu déjà sa première place dans quelques domaines, Claude 3.5 se montre bien meilleure pour écrire des articles optimisés pour le SEO que GPT 4 et les dernières IA de Google montrent déjà que ce dernier est en train de prendre une avance considérable dans tous les domaines : Extraction de connaissance, Génération d'images, ...
Dévoilement du fonctionnement interne de Google Search : Un diagramme incroyablement détaillé ! 🔍
Un diagramme récemment mis en lumière dévoile la complexité des systèmes de recherche de Google. Un véritable chef-d'œuvre pour les experts en SEO, il montre comment les différents composants travaillent de concert pour générer des résultats de recherche de qualité.
Voici quelques points clés à noter sur ce diagramme :
1. Il montre tous les composants utilisés par Google depuis le crawling de sites web jusqu'à la génération des résultats de recherche en temps réel.
2. Les principaux composants incluent :
- Le crawler (Trawler) qui parcourt le web
- Les systèmes de stockage et d'indexation (Alexandria, DocIndex)
- Les systèmes de classement (PageRank, RankBrain)
- Des systèmes de génération de signaux en temps réel
3. Il y a de nombreux sous-systèmes et bases de données spécialisés, comme le KnowledgeGraph, l'analyse d'images, et la détection de spam.
4. Le diagramme montre comment l'apprentissage profond (Deep Learning) est intégré dans le processus. De nombreux concepts ont été identifiés depuis des années grâce au reverse engineering.
5. On peut voir aussi de nombreux éléments liés à la qualité et à l'évaluation des résultats, comme le système Quality Rater et bien d'autres, des articles complets ont été écrits sur ce sujet.
Ce diagramme a été créé par Dr. Mario Fischer et mis à jour en août 2024
A retenir :
Ce diagramme donne un aperçu fascinant de la complexité et de la sophistication des systèmes de recherche de Google. Attention par contre, il s'agit d'une vue simplifiée donc il n'est pas possible d'en retirer des vérités générales sans une approche holistique.
Le prix des LLMs s'effondre : L'IA devient accessible à tous ! 💰
Le coût d'utilisation des LLMs a fortement diminué ces derniers mois. GPT-4, Llama 3.1, et d'autres modèles sont désormais disponibles à des prix abordables. Cette démocratisation de l'IA ouvre la voie à une adoption massive de cette technologie dans de très nombreux domaines.
Le prix par million de tokens s'effondre.
Un tournant majeur :
- Les entreprises technologiques s'affrontent pour proposer les modèles de langage les plus performants, tout en les rendant accessibles à un large public.
- Les modèles de langage abordables ouvrent de nouvelles perspectives pour les entrepreneurs qui souhaitent développer des applications et des services innovants. Je vois beaucoup d'entreprises qui essaient de développer leur propre solution, pourtant le coût humain, l'infrastructure, la maintenance, la veille, et les technologies qui changent chaque semaine sont souvent complètement sous-estimés.
A retenir :
- En moins de 5 mois, le prix pour utiliser des modèles de pointe a chuté de 36$ à 2$ par million de tokens, soit une réduction de plus de 94%.
L’Automated Prompt Engineering : L'avenir de l'IA générative 🤖
Pour exploiter pleinement le potentiel des IA génératives, il faut savoir formuler des prompts précis et efficaces. L'Automated Prompt Engineering est une nouvelle approche qui consiste à automatiser ce processus, permettant de générer des prompts de haute qualité en quelques secondes.
Comment ça marche?
Les systèmes d'Automated Prompt Engineering sont entraînés sur un ensemble de données composé de paires prompt-résultat. Ils apprennent à générer des prompts qui conduisent à des résultats de haute qualité.
Un peu d'histoire:
En septembre 2023, une équipe de chercheurs de Google DeepMind dirigée par Chrengrun Yang a créé un programme dénommé OPRO permettant de laisser les LLM essayer différents prompts jusqu’à trouver le plus adéquat pour résoudre une tâche.
Plutôt que d’essayer de modifier manuellement un prompt à de nombreuses reprises pour le perfectionner, il est donc possible d’automatiser ce processus itératif.
Les chercheurs ont aussi choisi d’utiliser le langage naturel pour décrire le problème d’optimisation plutôt que de s’en remettre à la programmation. Ceci permet à l’IA de s’adapter aux requêtes changeant constamment pour l’optimisation sur différentes tâches.
Ils donnent ensuite au LLM l’instruction de générer de nouvelles solutions itérativement en se basant sur la description du problème et les solutions précédemment trouvées.
Au coeur du programme OPRO, se trouve un algorithme appelé « Meta-Prompt ». Il passe en revue les précédents prompts, et mesure leur succès dans la résolution d’un problème donné.
Par la suite, l’algorithme génère de multiples prompts et les essaye pour trouver le meilleur. Ainsi, on pourrait comparer Meta-Prompt avec une personne qui taperait sur son clavier de multiples variantes de prompts jusqu’à trouver le plus efficace.
A retenir :
De manière générale, les prompts optimisés par Meta-Prompt surpassent ceux créés par des humains sur les deux benchmarks publiés dans leur étude avec une marge de plus de 50%.
Envie de tester , Claude 3 fournir un accès à son meta prompt et vous pouvez le tester : https://console.anthropic.com/dashboard > Generate a prompt
Pour info, pour faire de la qualité, l'Automated Prompt Engineer est la meilleure solution et cela sera abordé dans ma prochaine formation.
Dernière surprise pour Octobre : Lancement d'une nouvelle formation.
J'ai préparé une nouvelle formation qui va montrer une nouvelle façon d'utiliser l'IA de façon créative. Cette formation s'adressera à tous les coeurs de métiers.
Vous allez explorer des concepts essentiels comme la divergence, qui vous aide à générer de nouvelles idées, et apprendre à utiliser des graphes de connaissance pour mieux organiser et comprendre l'information et appréhender le automated prompt engineering.
Contrairement à mes autres formations, je vais donner directement l'accès à des apps qui ne demanderont plus de toucher au code ou jouer avec Google Colab.
La formation est déjà en vente et sortira vers Octobre , je limite à 250 personnes pour le lancement pour des raisons de suivi pédagogique et surtout je vais offrir aux 250 premiers inscrits dès l'achat un accès de 3 mois via LinkedIn Premium à toutes mes formations GenAI sur LinkedIn. ( soit 90$ offerts ), vous pouvez d'ailleurs l'utiliser pour faire d'autres formations de qualité.
https://www.datamarketinglabs.com/
Voici une vidéo de teasing, mais d'autres vidéos vont suivre. Vous allez voir, il est grand temps d'utiliser l'IA autrement. Mon objectif pédagogique est clairement d'améliorer l'humain, et cette nouvelle formation va complètement dans ce sens. Dans cette vidéo, je cherche des idées pour illustrer la divergence, et l'organisation du contenu de cette newsletter m'a été soufflée par ce nouvel outil.