Claude Opus 4.8 : 6 semaines après Opus 4.7
Anthropic shippe à un rythme effréné : Opus 4.8 sort seulement 6 semaines après Opus 4.7. Le focus officiel : le travail agentique long-horizon. Sur le benchmark Super-Agent, Opus 4.8 est le seul modèle à compléter tous les cas d'usage end-to-end — battant les Opus précédents et GPT-5.5 à coût équivalent.
Concrètement, Claude 4.8 reste connecté à une tâche pendant des heures, garde le contexte cohérent, et finit ce qu'il a commencé. C'est la différence entre un assistant qui complète et un employé qui exécute.
Agents planifiés : le scheduler intégré
L'annonce du Code with Claude Tokyo a éclipsé le reste : les Claude Managed Agents disposent maintenant de scheduled deployments. Concrètement, un agent peut être configuré pour démarrer tous les jours à 9h, ouvrir une session, exécuter sa tâche, commit son résultat. Sans scheduler externe, sans infra à maintenir.
Couplé avec les environment variables stockées en vault, c'est un changement de paradigme : on quitte le « LLM-as-a-service » pour aller vers le « LLM-as-an-employee ». Notre équipe explore déjà ce modèle pour le carrousel d'actualités de ce site.
Workflows dynamiques en GA
Annoncé en même temps : Claude Code passe les dynamic workflows en General Availability. Concrètement, on peut maintenant scripter des séquences décisionnelles complexes (« si X alors Y sinon Z ») nativement dans Claude, sans framework tiers comme LangChain ou CrewAI. Le modèle devient orchestrateur.
L'autre bombe : Claude Mythos arrive en public via Fable 5
Pendant que Tokyo célébrait les agents planifiés, Anthropic tirait une autre cartouche le 9 juin : la sortie grand public de Claude Mythos via Claude Fable 5. Mythos est un modèle spécialisé en cybersécurité jusqu'ici réservé à 50 partenaires triés (dont le gouvernement US) via le Project Glasswing. Bilan de la preview : plus de 10 000 vulnérabilités critiques détectées dans des logiciels d'infrastructure stratégique.
Avec Claude Fable 5, ce niveau de capacité sort enfin du ghetto enterprise. Le modèle est accessible aux clients payants avec des garde-fous renforcés (blocage des cas d'usage offensifs en cybersécurité ou en bioterrorisme). Toutes les équipes de dev peuvent désormais auditer leur propre code à un niveau qui n'existait pas il y a 6 mois.
Ce que ça change pour nos clients
Pour les apps qu'on construit, le rapport coût/valeur de l'IA bascule. Une tâche qui demandait avant un dev full-time peut maintenant tourner en autonomie via un agent planifié. Et avec Fable 5, on fait désormais passer chaque app qu'on livre dans un audit sécurité IA pré-déploiement : détection de failles, suggestions de correctifs, pentesting automatique. Un niveau qui était jusqu'ici réservé aux GAFAM.
La question n'est plus « est-ce que l'IA peut le faire ? » mais « est-ce que le travail mérite d'être agentifié, et est-ce qu'il a passé l'audit Fable 5 ? ».