Daily AI Coding Tools Brief — 8 Jun 2026
Dynamic Workflows en preview: cientos de subagentes en paralelo para tareas a escala de codebase
Claude Code puede ahora planificar trabajo y ejecutar cientos de subagentes en paralelo dentro de una sola sesión, habilitando migraciones a escala de codebase, auditorías de seguridad y revisiones de arquitectura desde el inicio hasta el merge. Disponible en preview para planes Max, Team y Enterprise elegibles, y a través de la API de Claude en Bedrock, Vertex y Foundry. Advertencia: el consumo de tokens puede ser sustancialmente mayor al de una sesión típica.
v2.1.166: fallbackModel, glob en deny-rules y seguridad de mensajería entre sesiones
Agrega fallbackModel para configurar hasta tres modelos de respaldo usados en orden cuando el primario está sobrecargado. Los patrones glob ahora funcionan en la posición de nombre de herramienta de las reglas deny (* deniega todo). Los mensajes enviados vía SendMessage desde otras sesiones ya no portan autoridad de usuario. Correcciones: parpadeo en terminales JetBrains 2026.1+, teclas Shift+no-ASCII en WezTerm/Ghostty.
v2.1.163: guardarraíles de versión administrada y comando /plugin list
Nueva configuración administrada requiredMinimumVersion y requiredMaximumVersion evita que Claude Code se ejecute fuera de versiones aprobadas — esencial para la gobernanza de flotas. Nuevo comando /plugin list con opciones de filtrado. Corrección: sesiones en segundo plano que perdían tareas tras actualizaciones.
v2.1.160: renombrado 'ultracode' y prompts de seguridad para archivos del sistema
El trigger de dynamic-workflow se renombró de workflow a ultracode. Ahora muestra prompts de seguridad al escribir en archivos de inicio del shell o configuración de git. Correcciones: portapapeles en WSL, arranque del demonio en segundo plano, falta de respuesta en Windows bajo carga alta de CPU.
AgentKit: conjunto completo para construir, desplegar y optimizar agentes
OpenAI lanzó AgentKit con Agent Builder (canvas visual para flujos multi-agente con versionado), ChatKit (toolkit embebible para experiencias de chat en productos) y capacidades de evaluación mejoradas: datasets, trace grading, optimización automática de prompts y soporte para modelos de terceros.
Sites preview en Codex: crea y despliega apps web directamente desde el workspace
Sites ahora disponible en preview en la app Codex. Permite crear, guardar, desplegar e inspeccionar sitios web, dashboards, herramientas internas, apps web y juegos alojados por OpenAI directamente desde el flujo de trabajo de Codex, sin salir del entorno de desarrollo.
Plugins por rol: datos, producción creativa, ventas, diseño de producto, inversión
Codex se expande más allá del código con seis plugins por rol: analytics de datos, producción creativa, ventas, diseño de producto, inversión en acciones públicas y banca de inversión. Diseñados para equipos no técnicos que comparten workspace con desarrolladores, permitiendo flujos de trabajo unificados entre disciplinas.
Moderation scores en Responses API y Chat Completions API
Pasa un objeto moderation en cualquier solicitud de generación para recibir resultados de moderación para el input del modelo y el output generado en la misma respuesta. Disponible en Responses API y Chat Completions API.
Modelos OpenAI ahora disponibles en Amazon Bedrock vía Responses API
Los modelos OpenAI están ahora disponibles en Amazon Bedrock a través de un endpoint de Responses API compatible con OpenAI. Los modelos y características soportados varían por región AWS, con autenticación, controles de cuenta y facturación gestionados por AWS.
GPT-4.5 se retira el 27 de junio — guía de migración disponible
OpenAI retira GPT-4.5 de ChatGPT y la API el 27 de junio de 2026 tras un período de transición de 30 días. Los usuarios de la API deben migrar a GPT-5.5, GPT-4.1 u otros modelos disponibles. Guía de migración disponible en la documentación oficial.
Fecha límite crítica: migrar a Antigravity antes del 18 de junio de 2026
Las extensiones IDE de Gemini Code Assist y la CLI dejarán de servir solicitudes para tiers individuales, Google AI Pro y Google AI Ultra el 18 de junio de 2026. Los usuarios deben migrar a Antigravity y Antigravity CLI antes de esa fecha para evitar interrupciones. Antigravity 2.0 se lanzó en Google I/O el 19 de mayo con app de escritorio, CLI, SDK y Managed Agents API.
IntelliJ Gemini Code Assist 1.53.2: correcciones y mejoras menores
Versión de mantenimiento con diversas correcciones de errores y mejoras menores de producto para la plataforma IntelliJ (IntelliJ IDEA, PyCharm, WebStorm, etc.).
Contexto expandido y razonamiento configurable para planes Pro, Pro+ y Max
GitHub Copilot ahora soporta ventanas de contexto significativamente más grandes (hasta 1M tokens) con niveles de razonamiento configurables para los planes Pro, Pro+ y Max, permitiendo abordar tareas complejas con mayor profundidad de contexto y precisión ajustada a cada caso de uso.
Agent tasks REST API disponible para planes Pro, Pro+ y Max
La API REST para tareas de agente de Copilot está disponible para los planes Pro, Pro+ y Max, permitiendo integrar el trabajo agéntico de Copilot en pipelines CI/CD y automatizaciones personalizadas.
MAI-Code-1-Flash y modelos Gemini ahora disponibles en Copilot
MAI-Code-1-Flash, el modelo de codificación propietario de Microsoft, se añadió a GitHub Copilot. Además, los modelos Gemini de Google están ahora disponibles en la CLI de Copilot, el agente en la nube y la app de Copilot, ampliando significativamente la elección de modelos dentro del ecosistema.
CLI mejorada: rubber duck reviews, programación de prompts y entrada de voz GA
La CLI de GitHub Copilot recibió una actualización mayor lanzada en Microsoft Build 2026: rubber duck reviews (el agente razona en voz alta antes de sugerir), programación de prompts y entrada de voz en disponibilidad general. Interfaz de terminal experimental con pestañas para issues, pull requests y gists.
Copilot SDK en disponibilidad general
El SDK de GitHub Copilot está ahora en disponibilidad general, permitiendo a los desarrolladores integrar las capacidades de Copilot en sus propias aplicaciones, extensiones y flujos de trabajo automatizados.
Facturación por uso activa con controles de presupuesto por usuario
La facturación por uso de GitHub Copilot está activa para todos los usuarios desde el 1 de junio. Las revisiones de código de Copilot ahora consumen minutos de GitHub Actions además de créditos de GitHub AI. Se lanzaron nuevos controles de presupuesto a nivel de usuario y se habilitaron actualizaciones a Copilot Max.
GA para Enterprise: escaneo de codebase y parches automáticos con Opus 4.8
Anthropic expande Claude Security a todos los clientes Enterprise como parte de la expansión de Project Glasswing a ~150 nuevas organizaciones. Usa Claude Opus 4.8 para escanear codebases y sugerir parches. Nuevas capacidades: escaneo de directorios específicos, descarte de hallazgos con razón documentada, exportación a CSV/Markdown, y webhooks a Slack y Jira.
Línea de Tiempo — Lanzamientos de Modelos
| Fecha | Modelo | Proveedor | Tier | Tipo | Notas |
|---|---|---|---|---|---|
| 2026-06-01 | Qwen 3.7 Plus | Alibaba / Qwen | S | Propietario | Modelo multimodal GUI-agéntico, 1M tokens ctx, GA. ScreenSpot Pro: 79.0. SWE-Bench Pro: 57.6. $2.50/$7.50 por 1M tokens. |
| 2026-05-28 | Claude Opus 4.8 | Anthropic | S+ | Propietario | Actualización de Opus con mejoras en codificación agéntica, razonamiento y trabajo de conocimiento. Alimenta Dynamic Workflows en Claude Code. |
| 2026-05-21 | Qwen 3.7 Max | Alibaba / Qwen | S | Propietario | Flagship texto-only. #5 en AI Analysis Index v4.0. SWE-Bench Pro: 60.6, Terminal-Bench 2.0: 69.7, MCP-Atlas: 76.4. |
| 2026-05-19 | Gemini 3.5 Flash | S | Propietario | Lanzado en Google I/O 2026. Inteligencia frontier a 4x la velocidad. Contexto 1M tokens. $1.50/$9 por 1M tokens. | |
| 2026-04-24 | DeepSeek V4 Preview | DeepSeek | S | Abierto | V4 Pro: 1.6T params (49B activos), V4 Flash: 284B (13B activos). Atención CSA híbrida, 1M tokens ctx, 32T tokens de entrenamiento. |
| 2026-04-20 | Kimi K2.6 | Moonshot AI | S | Abierto | 1T params, 32B activos, open-weight. Agent Swarm: 300 subagentes, 4000 pasos coordinados. SWE-Bench Pro: 58.6. HLE-Full (con herramientas): 54.0. |
| 2026-04-08 | GLM-5.1 | Zhipu / Z.ai | A | Abierto | Release open-source de GLM-5. Primera empresa AI pública de China en lanzar un modelo de nivel frontier. |
| 2026-06 | Gemini 3.5 Pro | S+ | Próximo | Anunciado en Google I/O el 19 de mayo. Precio estimado ~$15/$60 por 1M tokens. Lanzamiento esperado junio 2026. | |
| 2026-06 | GPT-5.6 | OpenAI | S+ | Próximo | Referencia de enrutamiento hallada en el backend de OpenAI. Polymarket: 89% de probabilidad de lanzamiento antes del 30 de junio. |
Tendencias Destacadas
La orquestación multi-agente pasa de investigación a producción: Claude Code Dynamic Workflows y OpenAI AgentKit se lanzaron en la misma semana, señalando que las plataformas de codificación AI están apostando decididamente por arquitecturas de agentes en paralelo como primitiva de primera clase para tareas a escala de codebase.
El contexto extendido y el razonamiento configurable se convierten en estándar de mercado: GitHub Copilot lleva las ventanas de contexto a 1M tokens con niveles de razonamiento ajustables, entrando directamente en territorio que Claude y Gemini ya ocupaban y acelerando la nivelación del mercado entre las tres principales plataformas.
Consolidación de plataformas impone migraciones en plazos ajustados: Google fija el 18 de junio como fecha límite para migrar de Gemini Code Assist a Antigravity, GitHub Copilot pasa a facturación por uso, y OpenAI depreca su Evals platform y Agent Builder — todo en la misma quincena, obligando a los equipos de desarrollo a adaptarse simultáneamente en múltiples frentes.
Dynamic Workflows in research preview: hundreds of parallel subagents for codebase-scale tasks
Claude Code can now plan work and run hundreds of parallel subagents in a single session — enabling codebase-scale migrations, security audits, and architecture reviews from kickoff to merge. Available in research preview for Max, Team, and eligible Enterprise plans, and via the Claude API on Amazon Bedrock, Google Vertex AI, and Microsoft Foundry. Token consumption may be substantially higher than a typical session.
v2.1.166: fallbackModel, deny-rule glob support, and cross-session messaging security
Adds fallbackModel setting to configure up to three fallback models tried in order when the primary model is overloaded or unavailable. Glob patterns now work in the deny-rule tool-name position (* denies all tools). Messages relayed via SendMessage from other Claude sessions no longer carry user authority. Fixes: terminal flickering in JetBrains 2026.1+, Shift+non-ASCII keys dropped in WezTerm/Ghostty.
v2.1.163: managed version guardrails and /plugin list command
New managed settings requiredMinimumVersion and requiredMaximumVersion prevent Claude Code from running outside approved version ranges — essential for fleet governance. New /plugin list command with filtering options. Fix: background sessions losing tasks after version updates.
v2.1.160: 'ultracode' trigger rename and safety prompts for system file writes
The dynamic-workflow trigger is renamed from workflow to ultracode. Safety prompts now shown when writing to shell startup files or git configuration. Fixes: WSL clipboard issues, background daemon startup problems, and Windows unresponsiveness under heavy CPU load.
AgentKit: complete toolkit for building, deploying, and optimizing agents
OpenAI launched AgentKit with Agent Builder (visual canvas for creating and versioning multi-agent workflows), ChatKit (embeddable chat toolkit for products), and enhanced eval capabilities: datasets, trace grading, automated prompt optimization, and third-party model support to measure and improve agent performance.
Sites preview in Codex: create and deploy web apps directly from the workspace
Sites is now available in preview in the Codex app. Create, save, deploy, and inspect websites, dashboards, internal tools, web apps, and games hosted by OpenAI directly from the Codex workflow — without leaving the development environment.
Role-specific plugins: data analytics, creative production, sales, product design, investing
Codex expands beyond code with six role-specific plugins: data analytics, creative production, sales, product design, public equity investing, and investment banking — designed for non-technical teams sharing a workspace with developers, enabling unified cross-discipline workflows.
Moderation scores added to Responses API and Chat Completions API
Pass a moderation object in a generation request to receive moderation results for both model input and generated output in the same response. Available in both the Responses API and Chat Completions API.
OpenAI models now available in Amazon Bedrock via Responses API
OpenAI models are now available in Amazon Bedrock through an OpenAI-compatible Responses API endpoint. Supported models and features vary by AWS Region, with AWS-managed authentication, account controls, and billing.
GPT-4.5 retires June 27 — migration guide available
OpenAI is retiring GPT-4.5 from ChatGPT and the API on June 27, 2026, following a 30-day sunset period. API users must migrate to GPT-5.5, GPT-4.1, or other available models before the cutoff date. A migration guide is available in the official documentation.
Critical deadline: migrate to Antigravity before June 18, 2026
Gemini Code Assist IDE extensions and Gemini CLI will stop serving requests for individual, Google AI Pro, and Google AI Ultra tiers on June 18, 2026. Users must migrate to Antigravity and Antigravity CLI before this date to avoid workflow disruption. Antigravity 2.0 launched at Google I/O May 19 with a desktop app, CLI, SDK, and Managed Agents API.
IntelliJ Gemini Code Assist 1.53.2: bug fixes and minor enhancements
Maintenance release with various bug fixes and minor product enhancements across the IntelliJ platform (IntelliJ IDEA, PyCharm, WebStorm, etc.).
Expanded context windows and configurable reasoning levels for Pro, Pro+, and Max
GitHub Copilot now supports significantly larger context windows (up to 1M tokens) with configurable reasoning levels for Pro, Pro+, and Max plans — enabling complex tasks with greater context depth and precision tuned to each use case.
Agent tasks REST API now available for Pro, Pro+, and Max plans
Copilot's agent tasks REST API is now available for Pro, Pro+, and Max plans, enabling integration of Copilot agentic work into CI/CD pipelines and custom automation workflows.
MAI-Code-1-Flash and Gemini models now available in Copilot
MAI-Code-1-Flash, Microsoft's proprietary coding model, has been added to GitHub Copilot. Additionally, Google's Gemini models are now available in Copilot CLI, the cloud agent, and the Copilot app — significantly expanding model choice across the ecosystem.
CLI refresh: rubber duck reviews, prompt scheduling, and voice input now GA
GitHub Copilot CLI received a major refresh at Microsoft Build 2026: rubber duck reviews (agent reasons aloud before suggesting), prompt scheduling, and voice input are now generally available. Experimental terminal interface with tabs for working with issues, pull requests, and gists.
Copilot SDK reaches general availability
The GitHub Copilot SDK has reached general availability, enabling developers to integrate Copilot capabilities directly into their own applications, extensions, and automated workflows.
Usage-based billing now live with per-user budget controls
Usage-based billing for GitHub Copilot is now live for all users as of June 1. Copilot code review now consumes GitHub Actions minutes in addition to GitHub AI Credits. New user-level budget controls launched, and upgrades to Copilot Max are now enabled.
GA for Enterprise: codebase scanning and auto-patches powered by Opus 4.8
Anthropic expands Claude Security to all Enterprise customers as part of Project Glasswing's expansion to ~150 new organizations across 15+ countries. Powered by Claude Opus 4.8 for codebase scanning and patch suggestions. New capabilities: targeted directory scanning, dismissing findings with documented reasons, CSV/Markdown export, and webhooks to Slack and Jira.
Model Launches Timeline
| Date | Model | Provider | Tier | Type | Notes |
|---|---|---|---|---|---|
| 2026-06-01 | Qwen 3.7 Plus | Alibaba / Qwen | S | Proprietary | Multimodal GUI-agentic model, 1M-token context, GA. ScreenSpot Pro: 79.0. SWE-Bench Pro: 57.6. $2.50/$7.50 per 1M tokens. |
| 2026-05-28 | Claude Opus 4.8 | Anthropic | S+ | Proprietary | Opus upgrade with stronger agentic coding, reasoning, and practical knowledge work. Powers Dynamic Workflows in Claude Code. |
| 2026-05-21 | Qwen 3.7 Max | Alibaba / Qwen | S | Proprietary | Text-only flagship. #5 on AI Analysis Index v4.0. SWE-Bench Pro: 60.6, Terminal-Bench 2.0: 69.7, MCP-Atlas: 76.4. |
| 2026-05-19 | Gemini 3.5 Flash | S | Proprietary | Launched at Google I/O 2026. Frontier-level intelligence at 4x the speed. 1M-token context. $1.50/$9 per 1M tokens. | |
| 2026-04-24 | DeepSeek V4 Preview | DeepSeek | S | Open | V4 Pro: 1.6T params (49B active), V4 Flash: 284B (13B active). Hybrid CSA attention, 1M-token context, trained on 32T tokens. |
| 2026-04-20 | Kimi K2.6 | Moonshot AI | S | Open | 1T params, 32B active, open-weight. Agent Swarm: 300 sub-agents, 4,000 coordinated steps. SWE-Bench Pro: 58.6. HLE-Full (with tools): 54.0. |
| 2026-04-08 | GLM-5.1 | Zhipu / Z.ai | A | Open | Open-source release of the GLM-5 architecture. First model from China's first publicly-listed AI company to reach frontier level. |
| 2026-06 | Gemini 3.5 Pro | S+ | Upcoming | Announced at Google I/O May 19. Estimated ~$15/$60 per 1M tokens. Expected launch June 2026. | |
| 2026-06 | GPT-5.6 | OpenAI | S+ | Upcoming | Routing reference found in OpenAI backend. Polymarket prices 89% probability of launch before June 30. |
Notable Trends
Multi-agent orchestration moves from research to production: Claude Code Dynamic Workflows and OpenAI AgentKit both shipped in the same week, signaling that AI coding platforms are betting decisively on parallel-agent architectures as a first-class primitive for codebase-scale work.
Extended context and configurable reasoning becoming table stakes: GitHub Copilot brings context windows to 1M tokens with tunable reasoning levels — a direct play into territory Claude and Gemini already occupied, accelerating market leveling across the top three platforms.
Platform consolidation forces developer migrations on tight timelines: Google sets June 18 as the hard cutoff for Gemini Code Assist to Antigravity migration, GitHub Copilot moves to usage-based billing, and OpenAI is shutting down its Evals platform and Agent Builder — all in the same fortnight, forcing dev teams to adapt across multiple fronts simultaneously.
Dynamic Workflows en préversion: des centaines de sous-agents parallèles pour les tâches à l'échelle du codebase
Claude Code peut désormais planifier le travail et exécuter des centaines de sous-agents en parallèle dans une seule session — permettant des migrations à l'échelle du codebase, des audits de sécurité et des revues d'architecture de bout en bout. Disponible en préversion pour les plans Max, Team et Enterprise éligibles, et via l'API Claude sur Bedrock, Vertex et Foundry.
v2.1.166: fallbackModel, support glob deny-rule, et sécurité des messages inter-sessions
Ajoute le paramètre fallbackModel pour configurer jusqu'à trois modèles de secours essayés en ordre si le modèle primaire est surchargé. Les patterns glob fonctionnent désormais dans la position tool-name des règles deny (* refuse tous les outils). Les messages relayés via SendMessage depuis d'autres sessions Claude ne portent plus l'autorité utilisateur.
v2.1.163: garde-fous de version administrée et commande /plugin list
Les nouveaux paramètres administrés requiredMinimumVersion et requiredMaximumVersion empêchent Claude Code de fonctionner en dehors des versions approuvées — essentiel pour la gouvernance de flotte. Nouvelle commande /plugin list avec options de filtrage.
v2.1.160: renommage du déclencheur 'ultracode' et prompts de sécurité pour les fichiers système
Le déclencheur dynamic-workflow est renommé de workflow en ultracode. Des prompts de sécurité s'affichent désormais lors de l'écriture dans les fichiers de démarrage shell ou la configuration git. Corrections: presse-papiers WSL, démarrage du daemon en arrière-plan, non-réactivité Windows sous forte charge CPU.
AgentKit: boîte à outils complète pour créer, déployer et optimiser des agents
OpenAI a lancé AgentKit avec Agent Builder (canvas visuel pour créer et versionner des flux multi-agents), ChatKit (toolkit de chat intégrable) et des capacités d'évaluation améliorées: datasets, trace grading, optimisation automatique des prompts et support des modèles tiers.
Sites en préversion dans Codex: créez et déployez des apps web depuis l'espace de travail
Sites est désormais disponible en préversion dans l'application Codex. Créez, sauvegardez, déployez et inspectez des sites web, tableaux de bord, outils internes et jeux hébergés par OpenAI directement depuis le flux de travail Codex.
Plugins par rôle: analytics, production créative, ventes, design produit, investissement
Codex s'étend au-delà du code avec six plugins par rôle: analytics de données, production créative, ventes, design produit, investissement en actions publiques et banque d'investissement — conçus pour les équipes non-techniques partageant un espace de travail avec les développeurs.
Scores de modération ajoutés aux Responses API et Chat Completions API
Passez un objet moderation dans une demande de génération pour recevoir des résultats de modération pour l'entrée du modèle et la sortie générée dans la même réponse. Disponible dans les Responses API et Chat Completions API.
Modèles OpenAI désormais disponibles dans Amazon Bedrock via l'API Responses
Les modèles OpenAI sont désormais disponibles dans Amazon Bedrock via un endpoint d'API Responses compatible OpenAI. Les modèles et fonctionnalités pris en charge varient selon la région AWS.
GPT-4.5 se retire le 27 juin — guide de migration disponible
OpenAI retire GPT-4.5 de ChatGPT et de l'API le 27 juin 2026, après une période de transition de 30 jours. Les utilisateurs de l'API doivent migrer vers GPT-5.5, GPT-4.1 ou d'autres modèles disponibles avant la date limite.
Date limite critique: migrer vers Antigravity avant le 18 juin 2026
Les extensions IDE Gemini Code Assist et la CLI cesseront de servir les requêtes pour les tiers individuels, Google AI Pro et Google AI Ultra le 18 juin 2026. Les utilisateurs doivent migrer vers Antigravity et Antigravity CLI avant cette date. Antigravity 2.0 a été lancé à Google I/O le 19 mai avec une app bureau, CLI, SDK et API Managed Agents.
IntelliJ Gemini Code Assist 1.53.2: corrections de bugs et améliorations mineures
Version de maintenance avec diverses corrections de bugs et améliorations mineures sur la plateforme IntelliJ (IntelliJ IDEA, PyCharm, WebStorm, etc.).
Fenêtres de contexte étendues et niveaux de raisonnement configurables pour Pro, Pro+ et Max
GitHub Copilot prend désormais en charge des fenêtres de contexte significativement plus grandes (jusqu'à 1M tokens) avec des niveaux de raisonnement configurables pour les plans Pro, Pro+ et Max.
API REST Agent tasks disponible pour les plans Pro, Pro+ et Max
L'API REST des tâches d'agent Copilot est désormais disponible pour les plans Pro, Pro+ et Max, permettant l'intégration du travail agentique Copilot dans les pipelines CI/CD.
MAI-Code-1-Flash et modèles Gemini désormais disponibles dans Copilot
MAI-Code-1-Flash, le modèle de codage propriétaire de Microsoft, a été ajouté à GitHub Copilot. Les modèles Gemini de Google sont désormais disponibles dans la CLI Copilot, l'agent cloud et l'application Copilot.
Refonte CLI: rubber duck reviews, planification de prompts et saisie vocale en disponibilité générale
La CLI GitHub Copilot a reçu une mise à jour majeure lors de Microsoft Build 2026: rubber duck reviews, planification de prompts et saisie vocale désormais en disponibilité générale. Interface terminale expérimentale avec onglets pour les issues, pull requests et gists.
Le SDK Copilot atteint la disponibilité générale
Le SDK GitHub Copilot est désormais en disponibilité générale, permettant aux développeurs d'intégrer les capacités Copilot dans leurs propres applications, extensions et flux de travail automatisés.
Facturation à l'usage active avec contrôles de budget par utilisateur
La facturation à l'usage de GitHub Copilot est active pour tous les utilisateurs depuis le 1er juin. La révision de code Copilot consomme désormais des minutes GitHub Actions en plus des crédits GitHub AI. Nouveaux contrôles de budget au niveau utilisateur et mises à niveau vers Copilot Max activées.
GA pour Enterprise: scan de codebase et patches automatiques avec Opus 4.8
Anthropic étend Claude Security à tous les clients Enterprise dans le cadre de l'expansion de Project Glasswing à ~150 nouvelles organisations dans 15+ pays. Alimenté par Claude Opus 4.8 pour la numérisation de codebase et les suggestions de patches. Nouvelles capacités: scan de répertoire ciblé, export CSV/Markdown, webhooks Slack et Jira.
Chronologie des Lancements de Modèles
| Date | Modèle | Fournisseur | Tier | Type | Notes |
|---|---|---|---|---|---|
| 2026-06-01 | Qwen 3.7 Plus | Alibaba / Qwen | S | Propriétaire | Modèle GUI-agentique multimodal, contexte 1M tokens, GA. ScreenSpot Pro: 79.0. SWE-Bench Pro: 57.6. $2.50/$7.50 par 1M tokens. |
| 2026-05-28 | Claude Opus 4.8 | Anthropic | S+ | Propriétaire | Mise à jour Opus avec codage agentique, raisonnement et travail de connaissance améliorés. Alimente Dynamic Workflows dans Claude Code. |
| 2026-05-21 | Qwen 3.7 Max | Alibaba / Qwen | S | Propriétaire | Flagship texte-seulement. #5 sur AI Analysis Index v4.0. SWE-Bench Pro: 60.6, Terminal-Bench 2.0: 69.7, MCP-Atlas: 76.4. |
| 2026-05-19 | Gemini 3.5 Flash | S | Propriétaire | Lancé à Google I/O 2026. Intelligence de niveau frontier à 4x la vitesse. Contexte 1M tokens. $1.50/$9 par 1M tokens. | |
| 2026-04-24 | DeepSeek V4 Preview | DeepSeek | S | Ouvert | V4 Pro: 1.6T params (49B actifs), V4 Flash: 284B (13B actifs). Attention CSA hybride, contexte 1M tokens, 32T tokens d'entraînement. |
| 2026-04-20 | Kimi K2.6 | Moonshot AI | S | Ouvert | 1T params, 32B actifs, open-weight. Agent Swarm: 300 sous-agents, 4000 étapes coordonnées. SWE-Bench Pro: 58.6. HLE-Full (avec outils): 54.0. |
| 2026-04-08 | GLM-5.1 | Zhipu / Z.ai | A | Ouvert | Version open-source de l'architecture GLM-5. Premier modèle de la première entreprise IA cotée en bourse en Chine à atteindre le niveau frontier. |
| 2026-06 | Gemini 3.5 Pro | S+ | À venir | Annoncé à Google I/O le 19 mai. Prix estimé ~$15/$60 par 1M tokens. Lancement prévu juin 2026. | |
| 2026-06 | GPT-5.6 | OpenAI | S+ | À venir | Référence de routage trouvée dans le backend d'OpenAI. Polymarket: 89% de probabilité de lancement avant le 30 juin. |
Tendances Notables
L'orchestration multi-agents passe de la recherche à la production: Claude Code Dynamic Workflows et OpenAI AgentKit ont tous deux été lancés la même semaine, signalant que les plateformes de codage AI misent décisivement sur les architectures d'agents parallèles comme primitif de premier ordre.
Le contexte étendu et le raisonnement configurable deviennent la norme: GitHub Copilot porte les fenêtres de contexte à 1M tokens avec des niveaux de raisonnement ajustables — une incursion directe sur le territoire déjà occupé par Claude et Gemini, accélérant la convergence du marché.
La consolidation des plateformes force des migrations dans des délais serrés: Google fixe le 18 juin comme date limite pour la migration de Gemini Code Assist vers Antigravity, GitHub Copilot passe à la facturation à l'usage, et OpenAI ferme sa plateforme Evals et Agent Builder — le tout en quinze jours.