L’IA commence à écrire son propre code et à concevoir ses successeurs, marquant le début de l’amélioration récursive autonome.
LEAP : Les LLMs généralistes prouvent des théorèmes complexes
Le framework agentique LEAP (LLM-in-Lean Environment Agentic Prover) démontre que les LLMs généralistes peuvent exceller en mathématiques formelles. En utilisant une approche de décomposition hiérarchique inspirée du flux de travail humain, LEAP a résolu les 12 problèmes du Putnam 2026, égalant les modèles spécialisés.
Pourquoi c’est important
L’automatisation du raisonnement mathématique formel s’affranchit du besoin de modèles ultra-spécialisés, ouvrant la voie à une vérification logicielle massive et fiable.
L’IA comme moteur de raisonnement : La fin de l’ingénierie logicielle classique
Une nouvelle étude formalise le passage du SaaS à l' »Agent as a Service » (AaaS). Les agents IA ne se contentent plus d’assister les développeurs ; ils décomposent les tâches, génèrent dynamiquement du code éphémère pour les exécuter, puis le suppriment, redéfinissant le code comme un simple instrument de raisonnement.
Pourquoi c’est important
Le développement logiciel passe de l’écriture de règles statiques à l’orchestration d’intentions (Agentic Engineering).
Anthropic alerte sur l’amélioration récursive autonome
Anthropic a publié un avertissement concernant la capacité croissante de l’IA à concevoir ses propres successeurs. Actuellement, plus de 80% du code fusionné dans la base de code d’Anthropic est généré par Claude, augmentant la productivité des ingénieurs par 8 depuis 2024. L’entreprise suggère la possibilité d’une pause mondiale coordonnée.
Impact :l’industrie s’approche du point de bascule où l’intervention humaine dans la création de l’IA devient minoritaire, posant des défis majeurs de contrôle.
Anthropic déploie Mythos pour la cybersécurité offensive
Le modèle ultra-performant Mythos d’Anthropic, spécialiste du code, s’est révélé capable de détecter des failles informatiques à une échelle exceptionnelle. Le Projet Glasswing a été lancé avec 150 partenaires pour tester ces capacités. Parallèlement, des ingénieurs d’Anthropic aideraient la NSA à utiliser Mythos pour des opérations de cybersécurité offensives.
Impact
Les modèles frontières deviennent des armes géopolitiques à part entière, accélérant la course aux armements cybernétiques.
L’Université de Washington repense l’évaluation critique de l’IA
Au lieu de simplement enseigner l’utilisation de l’IA, le College of the Environment de l’UW a lancé un cursus centré sur l’examen critique de la technologie. Les données montrent que les étudiants les plus confiants dans leur compréhension de l’IA sont ceux qui vérifient le moins ses résultats (hallucinations).
Impact concret
La formation passe de l’apprentissage de l’outil à la gestion du doute, de l’incertitude et de l’éthique face aux réponses générées.
Dreambeans par Google Labs
Lancé sur Product Hunt, Dreambeans est une application de Google Labs qui génère des « histoires IA quotidiennes » hautement personnalisées en se basant sur les données de vos applications Google existantes. L’outil a pris la première place du classement quotidien le 7 juin.
CAS D’USAGE :transformer l’historique d’activité et les données personnelles en narrations engageantes générées par IA.


