Lo nuevo hoy

Today's highlights

Points forts du jour

Click en cualquiera para ir al detalle

Click any item to jump to the full section

Cliquez un élément pour aller à la section complète

8
Herramientas Rastreadas
60+
Actualizaciones
9
Modelos Catalogados
8
Proveedores Cubiertos
🤖

Claude Code

Anthropic
2.1.161
Modelo

Claude Opus 4.8 es el nuevo modelo por defecto con workflows dinámicos

Claude Opus 4.8 reemplaza a Opus 4.7 como modelo por defecto. Mejoras en benchmarks: codificación agéntica 64.3% → 69.2%, razonamiento multidisciplinar con herramientas 54.7% → 57.9%. Fast Mode disponible a 2x la tarifa estándar con 2.5x velocidad. El nuevo comando /workflows permite orquestar decenas a cientos de agentes en segundo plano. La palabra clave de trigger se renombró de workflow a ultracode.

28 may 2026
github.com →
Feature

Plugins se cargan automáticamente desde .claude/skills/ sin marketplace

Los plugins en directorios .claude/skills/ ahora se cargan automáticamente sin necesidad de marketplace. Nuevo comando claude plugin init <name> para crear un plugin. Autocompletado para argumentos de /plugin. El campo agent en settings.json es respetado en sesiones despachadas con --agent <name>. EnterWorktree puede cambiar entre worktrees gestionados por Claude durante la sesión.

29 may 2026
github.com →
Feature

Auto mode disponible en Bedrock, Vertex y Foundry para Opus 4.7 y 4.8

Auto mode se extiende a proveedores de nube: Amazon Bedrock, Google Vertex y Azure Foundry. Disponible para modelos Opus 4.7 y Opus 4.8. Activar con CLAUDE_CODE_ENABLE_AUTO_MODE=1.

30 may 2026
github.com →
Seguridad

Nuevas confirmaciones antes de escribir archivos de configuración sensibles

Se agregó prompt de confirmación antes de escribir en archivos de inicio de shell (.zshenv, .zlogin, .bash_login) y ~/.config/git/. En modo acceptEdits, también se pide confirmación antes de modificar archivos de configuración de build que otorgan ejecución de código: .npmrc, .yarnrc*, bunfig.toml, .bazelrc, .pre-commit-config.yaml, .devcontainer/.

01 jun 2026
github.com →
Feature

OTEL con etiquetas personalizadas y llamadas paralelas independientes en caso de fallo

Los valores de OTEL_RESOURCE_ATTRIBUTES ahora aparecen como etiquetas en métricas para segmentar por equipo/repo. Las llamadas paralelas de herramientas se vuelven independientes: un comando Bash fallido ya no cancela las demás llamadas del batch. El portapapeles en Linux ahora usa wl-copy/xclip/xsel con soporte de selección PRIMARY (pegar con clic medio).

02 jun 2026
github.com →
Feature

Nuevo comando /simplify: revisión de limpieza y aplicación automática de fixes

/simplify ejecuta una revisión enfocada en reutilización, simplificación, eficiencia y limpieza de altitud, y aplica los fixes automáticamente. Distinto de /code-review --fix que hace una revisión completa. También se agregó /code-review --fix que aplica hallazgos tras la revisión.

27 may 2026
github.com →
💻

OpenAI Codex / Codex CLI

OpenAI
0.136.0
Update

Codex CLI v0.136.0: archivado de sesiones, links web clickeables y sandbox en Windows

Novedades principales: archivado de sesiones con /archive (TUI) o codex archive/codex unarchive (CLI); links web clickeables en TUI via OSC 8; modo stdio para app-server (codex app-server --stdio); provisión de sandbox en Windows alpha (codex sandbox setup --elevated); registro de CODEX_API_KEY para ejecución remota. Correcciones: refresh de token ChatGPT, hardening de seguridad para /diff/PowerShell/websocket, autenticación Bedrock con AWS_REGION.

01 jun 2026
github.com →
Update

Codex CLI v0.135.0: diagnósticos enriquecidos, perfiles de permisos y edición de texto Vim

Diagnósticos más ricos en codex doctor; detalles de conexión remota en /status; edición de objetos de texto Vim con binding de interrupción configurable; perfiles de permisos con nombre en /permissions; helper zsh parcheado incluido en paquetes macOS/Linux; modo de instalación no interactivo via CODEX_NON_INTERACTIVE=1. SDK Python con presets Sandbox.

28 may 2026
github.com →
Feature

OpenAI lanza AgentKit: Agent Builder visual, Connector Registry y ChatKit embebible

AgentKit es el toolkit completo para construir, desplegar y optimizar agentes sobre la Responses API. Incluye: Agent Builder (canvas visual para crear y versionar workflows multi-agente), Connector Registry (hub de herramientas y conexiones de datos gestionado por admins), y ChatKit (experiencias de chat con agentes embebibles y personalizables).

02 jun 2026
openai.com →
Update

GPT-5.5, GPT-5.4 y Codex ahora disponibles en Amazon Bedrock (AWS)

Disponibilidad general de los modelos frontier de OpenAI (GPT-5.5, GPT-5.4) y Codex en Amazon Bedrock. Los clientes de AWS pueden usar IA frontier con sus flujos de seguridad, cumplimiento y gobernanza existentes.

01 jun 2026
openai.com →
Feature

Codex lanza 6 plugins por rol con 62 apps y 110 skills para trabajo general

OpenAI lanzó seis plugins específicos por rol que cubren 62 aplicaciones populares y 110 skills, expandiendo la utilidad de Codex más allá de la ingeniería de software hacia el trabajo de conocimiento general.

02 jun 2026
openai.com →
🧠

GPT Models

OpenAI
GPT-5.5
Fix

Rollback de snapshot o4-mini por aumento de flags de contenido en monitoreo automático

OpenAI revirtió un snapshot reciente de o4-mini (desplegado menos de una semana antes) que estaba destinado a mejorar la longitud de respuestas. El monitoreo automático detectó un aumento en flags de contenido. Relevante para flujos de generación de código que dependen de o4-mini.

28 may 2026
help.openai.com →
Update

GPT-4.5 se retira de ChatGPT el 27 jun 2026; GPT-4.1 deprecado en Copilot

OpenAI anunció la retirada de GPT-4.5 de ChatGPT el 27 de junio de 2026 (período de transición de 30 días). GPT-4.1 fue deprecado en todos los productos de GitHub Copilot (Chat, ediciones inline, modo agente, completado de código) desde el 1 de junio. La sustitución recomendada es GPT-5.5.

28 may 2026
witho2.com →

Gemini / Code Assist

Google
2.5 Pro GA
Update

Gemini CLI y Code Assist para individuos se discontinúan el 18 jun 2026; migración a Antigravity

Google está integrando Gemini CLI en la nueva plataforma Antigravity CLI. Las extensiones IDE de Gemini Code Assist y Gemini CLI dejarán de servir peticiones para tiers individuales, Google AI Pro y Google AI Ultra el 18 de junio de 2026. Los titulares de licencias Standard y Enterprise retienen acceso y seguirán recibiendo actualizaciones. Los usuarios gratuitos deben migrar a Antigravity.

20 may 2026
developers.googleblog.com →
Modelo

Gemini 2.5 Pro y 2.5 Flash pasan a disponibilidad general para Code Assist Standard y Enterprise

Ambos modelos, previamente en Preview, son ahora GA para Gemini Code Assist Standard y Enterprise. Impulsan chat, generación de código y transformación de código con manejo mejorado de tareas complejas en codificación, matemáticas, ciencias y razonamiento.

27 may 2026
developers.google.com →
Feature

Inline Diff Visualization llega a GA en IntelliJ y VS Code; memoria persistente en GitHub

Inline diff ahora es GA para IntelliJ y VS Code: las sugerencias de código se resaltan visualmente en verde (adiciones) y rojo (eliminaciones) directamente en el editor. Agent Mode en VS Code también soporta editar cambios directamente via Gemini Inline Diff. Además, Gemini Code Assist en GitHub ahora almacena interacciones anteriores para mantener contexto entre sesiones en el mismo repositorio.

27 may 2026
developers.google.com →
🐙

GitHub Copilot

GitHub / Microsoft
Build 2026
Feature

GitHub Copilot App en preview técnica: canvas, sandboxes cloud/local y Agent Merge

La app de escritorio de Copilot está disponible en preview técnica para usuarios Pro, Pro+, Business y Enterprise. Características: My Work dashboard, git worktrees por sesión de agente, Agent Merge (gestión automática de CI/merges), superficies Canvas para colaboración bidireccional, sandboxes locales y en nube, revisión de código mejorada con skills /security-review y /rubberduck, soporte nativo Azure DevOps, entrada de voz, sesiones de agente cloud y automatizaciones programadas.

02 jun 2026
github.blog →
Feature

Copilot SDK llega a GA con soporte para Node.js, Python, Go, .NET, Rust y Java

El SDK de Copilot llega a GA ofreciendo acceso programático al runtime de agentes de Copilot: planificación, invocación de herramientas, edición de archivos, streaming y sesiones multi-turno. Nuevas adiciones desde el preview: slash commands, prompts de input interactivos y una API de producción estable. Disponible para todos los suscriptores de Copilot y via BYOK para no suscriptores.

02 jun 2026
github.blog →
Update

GitHub Copilot migra a facturación por uso con GitHub AI Credits en todos los planes

Todos los planes de Copilot ahora usan facturación por uso con GitHub AI Credits (asignaciones mensuales + presupuestos de excedente). La revisión de código ahora consume tanto minutos de Actions como AI Credits. Nuevos controles de presupuesto por usuario a nivel de org con alertas por email. Nuevo tier Copilot Max para suscriptores existentes con límites de uso más altos. Pro+ ofrece 5x+ los límites de Pro.

01 jun 2026
github.blog →
Feature

Copilot Code Review: Agent Skills, soporte MCP y nuevo tier de análisis medio

Preview pública de Agent Skills y soporte MCP para llevar contexto específico de la organización a las revisiones de código via directorios .github/skills y conexiones a servidores MCP. Nuevo tier de "análisis medio" que enruta automáticamente PRs complejos a un modelo de mayor razonamiento.

02 jun 2026
github.blog →
Feature

Copilot Memory captura preferencias de usuario para Business y Enterprise

Copilot Memory ahora captura preferencias a nivel de usuario (estilo de comunicación, stack de herramientas, convenciones git) para clientes Business y Enterprise, aplicándolas entre repositorios. Los admins tienen controles de política, exportación/auditoría, eliminación masiva y opt-out por usuario. En preview pública para el agente de codificación y Copilot CLI.

02 jun 2026
github.blog →
Modelo

MAI-Code-1-Flash disponible en GitHub Copilot: primer modelo de código in-house de Microsoft

MAI-Code-1-Flash, el primer modelo de codificación ligero desarrollado internamente por Microsoft, comienza su despliegue gradual en tiers Free, Pro, Pro+ y Max. Se afirma que es el mejor en su clase para su tamaño entre modelos ligeros. Seleccionable en VS Code via el selector de modelos.

02 jun 2026
github.blog →
Feature

Copilot CLI: nuevo UI experimental, Rubber Duck critic, programación de prompts y entrada de voz

Actualización mayor de Copilot CLI presentada en Microsoft Build 2026: interfaz de terminal experimental rediseñada con sistema de tabs (Sessions, Issues, PRs, Gists); Rubber Duck (crítico de IA para feedback de diseño/plan); comandos /every y /after para programación de prompts; entrada de voz hands-free usando reconocimiento de voz local en dispositivo. El UI experimental está en preview; el resto es GA.

02 jun 2026
github.blog →
Feature

GitHub lanza Agent Apps: agentes de terceros instalables desde Marketplace

GitHub introduce agent apps — agentes de IA de terceros instalables desde GitHub Marketplace que se integran directamente en workflows de GitHub. Socios iniciales: Amplitude, Bright Security, Endor Labs, LaunchDarkly, Miro, Sonar, PagerDuty, Packfiles y Octopus Deploy. GitHub planea abrir la creación de agent apps a cualquier desarrollador en los próximos meses.

02 jun 2026
github.blog →
🖊️

Cursor / Zed / Devin Desktop

Various
Cursor 3
Update

Windsurf se convierte en Devin Desktop con protocolo ACP, motor Rust y vista Kanban de agentes

Cognition (creadores de Devin) relanzó Windsurf como Devin Desktop. La vista por defecto es ahora un Kanban para gestionar agentes locales y cloud. Novedades: Spaces (contexto compartido entre agentes), soporte ACP (Agent Client Protocol open-source para interoperabilidad con Codex, Claude Agent, OpenCode), y Devin Local (sucesor de Cascade, reescrito en Rust con 30% menos tokens y subagentes). Retrocompatible con Windsurf y VSCode.

02 jun 2026
devin.ai →
Feature

Cursor 3: builds paralelos con subagentes async, splitting automático de PRs y Composer 2.5

Cursor puede ahora multitaskear en tareas independientes simultáneamente usando subagentes asíncronos. Una acción rápida integrada divide los cambios en PRs usando el contexto del chat. Facturación cambia a uso puro (~$1.00–$1.50/ejecución) para Bugbot; nuevo tier Premium para usuarios intensivos de agentes. Composer 2.5 posicionado como rendimiento frontier a costo reducido. Pills de acción rápida para skills frecuentes.

02 jun 2026
cursor.com →
Feature

Zed: agentes de terminal como threads en sidebar y lanzamiento de Zed for Business

Zed anunció la posibilidad de ejecutar Claude Code, Amp u otros agentes de terminal como threads en el sidebar del editor. Soporte ACP (Agent Client Protocol) para interoperabilidad con Claude Agent, Codex, Cursor y otros. Lanzamiento del tier Zed for Business con facturación centralizada, controles de acceso por roles y gestión de equipos.

02 jun 2026
zed.dev →
🏗️

Microsoft Build 2026

Microsoft
Build 2026
Preview

GitHub Spark: construcción de apps full-stack con lenguaje natural y deploy en un clic

GitHub Spark permite describir una app en inglés simple y obtener código full-stack funcional con preview en vivo y despliegue en un clic con integración profunda en el ecosistema GitHub. Actualmente disponible para suscriptores Pro+ y Enterprise.

02 jun 2026
github.com →
Modelo

Microsoft lanza MAI-Code-1-Flash y MAI-Thinking-1: primeros modelos AI in-house

MAI-Code-1-Flash es el primer modelo de codificación in-house de Microsoft, diseñado para ser el mejor en su clase para su tamaño. MAI-Thinking-1 es un modelo de razonamiento construido para alta eficiencia a bajo costo de tokens. Ambos reducen la dependencia en OpenAI. MAI-Code-1-Flash ya está disponible en GitHub Copilot.

02 jun 2026
cnbc.com →
🔵

Google I/O 2026 Products

Google
I/O 2026
Feature

Jules llega a disponibilidad general: agente de codificación asíncrono que devuelve PRs

Jules, el agente de codificación asíncrono de Google, llega a GA en Google I/O 2026. Acepta una descripción de tarea, la ejecuta en una VM cloud aislada y devuelve un pull request. Impulsado por Gemini 2.5 Pro. Durante la beta pública el uso es gratuito. Integración directa con workflows de GitHub. Muestra el plan y razonamiento antes de hacer cambios. Incluye changelog de audio de commits.

19 may 2026
jules.google →
Update

Google Antigravity 2.0: plataforma agent-first con CLI, SDK y Managed Agents enterprise

Antigravity 2.0 es la plataforma agent-first de Google lanzada en I/O 2026. App de escritorio standalone para orquestación de agentes. Componentes: Antigravity CLI, Antigravity SDK, integración de Managed Agents y soporte enterprise via Gemini Enterprise Agent Platform. Soporta orquestación multi-agente, programación de tareas en segundo plano y comandos de voz nativos. Impulsado por Gemini 3.5 Flash. Nuevo plan AI Ultra a $100/mes con 5x más límites.

19 may 2026
techcrunch.com →

Línea de Tiempo — Lanzamientos de Modelos

Todos los lanzamientos importantes de los últimos 7 días, los más recientes primero
Fecha Modelo Proveedor Tier Tipo Notas
2026-05-28 Claude Opus 4.8 Anthropic S+ Propietario Nuevo modelo por defecto en Claude Code. Agentic coding: 69.2%, razonamiento multidisciplinar: 57.9%, Online-Mind2Web (computer use): 84% (#1). Fast Mode a 2.5x velocidad, 3x más barato que predecesor.
2026-06-01 MiniMax M3 MiniMax A+ Abierto Open-weight con contexto de 1M tokens. SWE-Bench Pro: 59.0%, BrowseComp: 83.5. Arquitectura MSA para eficiencia a largo contexto. ~9x prefill más rápido. $0.60/$2.40 por M tokens. Benchmarks independientes pendientes de verificación.
2026-06-02 MAI-Code-1-Flash Microsoft A Propietario Primer modelo de codificación in-house de Microsoft. Ligero, optimizado para Copilot. Mejor en su clase para su tamaño. Disponible en GitHub Copilot via selector de modelos.
2026-05-19 Gemini 3.5 Flash Google S Propietario GA en Google I/O 2026. Terminal-Bench 2.1: 76.2%, GDPval-AA Elo: 1656, MCP Atlas: 83.6%. 4x más rápido que modelos frontier comparables. Contexto 1M tokens. $1.50/$9.00 por M tokens.
2026-05-19 Qwen3.7-Max Alibaba / Qwen S Propietario API-only. SWE-Bench Pro: 60.6% (#1), SWE-Verified: 80.4%, HMMT 2026 (math): 97.1% (#1). Contexto 1M tokens. Modo de razonamiento extendido nativo. Diseñado para workflows autónomos de largo horizonte.
2026-04-24 DeepSeek-V4-Pro DeepSeek S Abierto MoE 1.6T/49B activos. SWE-bench: 80.6%, MMLU-Pro: 87.5%. Contexto 1M tokens. MIT license. $0.435/$0.87 por M tokens. 27% del cómputo de V3.2 a contexto 1M.
2026-04-20 Kimi K2.6 Moonshot AI A+ Abierto MoE 1T/32B activos + MoonViT para visión. SWE-Bench Pro: 58.6%, Agentic Elo: 1520. Hasta 300 sub-agentes y 4000 pasos coordinados. Contexto 256K. $0.60/$2.50 por M tokens.
2026-06-01 GPT-5.5 OpenAI S+ Propietario En despliegue a planes pagos de ChatGPT. Contexto 1M tokens. Ahora disponible en Amazon Bedrock. GPT-5.5 Instant es el nuevo modelo por defecto para todos los usuarios de ChatGPT.
2026-06-10 o3-Pro OpenAI S+ Próximo Programado para el 10 de junio de 2026. Modelo más capaz de OpenAI. Recomendado para preguntas difíciles donde la fiabilidad es más importante que la velocidad.
S+ FronteraS MayorA+ DestacadoA SólidoB+ Incremental
8
Tools Tracked
60+
Updates Found
9
Models Cataloged
8
Providers Covered
🤖

Claude Code

Anthropic
2.1.161
Model

Claude Opus 4.8 is the new default model with dynamic workflows

Claude Opus 4.8 replaces Opus 4.7 as the default model. Benchmark improvements: agentic coding 64.3% → 69.2%, multidisciplinary reasoning with tools 54.7% → 57.9%. Fast Mode available at 2x standard rate for 2.5x speed. The new /workflows command orchestrates tens to hundreds of background agents. The trigger keyword was renamed from workflow to ultracode.

28 may 2026
github.com →
Feature

Plugins auto-load from .claude/skills/ directories without marketplace

Plugins in .claude/skills/ directories now auto-load without requiring a marketplace. New claude plugin init <name> command to scaffold plugins. Autocomplete added for /plugin arguments. The agent field in settings.json is honored for dispatched sessions with --agent <name> override. EnterWorktree can now switch between Claude-managed worktrees mid-session.

29 may 2026
github.com →
Feature

Auto mode now available on Bedrock, Vertex, and Foundry for Opus 4.7 and 4.8

Auto mode extends to cloud providers: Amazon Bedrock, Google Vertex, and Azure Foundry. Available for Opus 4.7 and Opus 4.8 models. Enable via CLAUDE_CODE_ENABLE_AUTO_MODE=1.

30 may 2026
github.com →
Security

New confirmation prompts before writing sensitive configuration files

Confirmation prompt added before writing to shell startup files (.zshenv, .zlogin, .bash_login) and ~/.config/git/. In acceptEdits mode, also prompts before modifying build config files that grant code execution: .npmrc, .yarnrc*, bunfig.toml, .bazelrc, .pre-commit-config.yaml, .devcontainer/.

01 jun 2026
github.com →
Feature

OTEL custom dimension labels and independent parallel tool calls on failure

OTEL_RESOURCE_ATTRIBUTES values now appear as labels on metric datapoints for slicing by team/repo. Parallel tool calls are now independent: a failed Bash command no longer cancels other calls in the same batch. Linux clipboard now uses wl-copy/xclip/xsel with PRIMARY selection support for middle-click paste.

02 jun 2026
github.com →
Feature

New /simplify command: cleanup-only review with automatic fix application

/simplify runs a cleanup-only review focused on reuse, simplification, efficiency, and altitude cleanups, then auto-applies the fixes. Distinct from /code-review --fix which performs a full review. /code-review --fix was also added to apply findings after a full review.

27 may 2026
github.com →
💻

OpenAI Codex / Codex CLI

OpenAI
0.136.0
Update

Codex CLI v0.136.0: session archiving, clickable web links, and Windows sandbox

Key additions: session archiving via /archive (TUI) or codex archive/codex unarchive (CLI); clickable web links in TUI via OSC 8; app-server stdio mode (codex app-server --stdio); Windows alpha sandbox provisioning (codex sandbox setup --elevated); CODEX_API_KEY registration for remote execution. Fixes: ChatGPT token refresh before expiry, command-safety hardening for /diff/PowerShell/websocket, Bedrock auth fallback to AWS_REGION.

01 jun 2026
github.com →
Update

Codex CLI v0.135.0: enriched diagnostics, permission profiles, and Vim text-object editing

Richer codex doctor diagnostics; remote connection details in /status; Vim text-object editing with configurable interrupt binding; named permission profiles in /permissions; bundled patched zsh helper for macOS/Linux packages; non-interactive install mode via CODEX_NON_INTERACTIVE=1. Python SDK Sandbox presets.

28 may 2026
github.com →
Feature

OpenAI launches AgentKit: visual Agent Builder, Connector Registry, and embeddable ChatKit

AgentKit is the full toolkit for building, deploying, and optimizing agents on top of the Responses API. Includes: Agent Builder (visual canvas for creating and versioning multi-agent workflows), Connector Registry (admin-managed hub for tools and data connections), and ChatKit (embeddable, customizable chat-based agent experiences).

02 jun 2026
openai.com →
Update

GPT-5.5, GPT-5.4, and Codex now available on Amazon Bedrock (AWS)

General availability of OpenAI frontier models (GPT-5.5, GPT-5.4) and Codex on Amazon Bedrock. AWS customers can use frontier AI through their existing security, compliance, and governance workflows.

01 jun 2026
openai.com →
Feature

Codex launches 6 role-specific plugins covering 62 apps and 110 skills for broader knowledge work

OpenAI launched six new role-specific Codex plugins covering 62 popular apps and 110 skills, expanding Codex usefulness for broader knowledge work beyond software engineering.

02 jun 2026
openai.com →
🧠

GPT Models

OpenAI
GPT-5.5
Fix

o4-mini snapshot rolled back due to content flag increase in automated monitoring

OpenAI rolled back a recent o4-mini snapshot (deployed less than a week prior) intended to improve response length. Automated monitoring detected an increase in content flags. Relevant for code generation workflows that depend on o4-mini.

28 may 2026
help.openai.com →
Update

GPT-4.5 retires from ChatGPT on 27 Jun 2026; GPT-4.1 deprecated in Copilot

OpenAI announced GPT-4.5 retirement from ChatGPT on June 27, 2026 (30-day sunset window). GPT-4.1 was deprecated across all GitHub Copilot experiences (Chat, inline edits, agent mode, code completions) as of June 1. Recommended replacement is GPT-5.5.

28 may 2026
witho2.com →

Gemini / Code Assist

Google
2.5 Pro GA
Update

Gemini CLI and Code Assist for individuals discontinued 18 Jun 2026; migration to Antigravity

Google is folding Gemini CLI into the new Antigravity CLI platform. Gemini Code Assist IDE Extensions and Gemini CLI will stop serving requests for individuals, Google AI Pro, and Google AI Ultra tiers on June 18, 2026. Standard and Enterprise license holders retain access and will continue receiving updates. Free-tier users must migrate to Antigravity.

20 may 2026
developers.googleblog.com →
Model

Gemini 2.5 Pro and 2.5 Flash reach GA for Code Assist Standard and Enterprise

Both models, previously in Preview, are now GA for Gemini Code Assist Standard and Enterprise. They power chat, code generation, and code transformation, with improved handling of complex tasks in coding, math, science, and reasoning.

27 may 2026
developers.google.com →
Feature

Inline Diff Visualization reaches GA in IntelliJ and VS Code; persistent memory on GitHub

Inline diff is now GA for both IntelliJ and VS Code: code suggestions are visually highlighted in green (additions) and red (deletions) directly in the editor. Agent Mode in VS Code also supports editing code changes via integrated Gemini Inline Diff. Additionally, Gemini Code Assist on GitHub now stores previous interactions to maintain context across future sessions on the same repository.

27 may 2026
developers.google.com →
🐙

GitHub Copilot

GitHub / Microsoft
Build 2026
Feature

GitHub Copilot App in technical preview: canvases, cloud/local sandboxes, and Agent Merge

The Copilot desktop app is available in technical preview for Pro, Pro+, Business, and Enterprise users. Features: My Work dashboard, git worktrees per agent session, Agent Merge (auto-handles CI/merges), Canvas surfaces for bidirectional agent-developer collaboration, local and cloud sandboxes, enhanced code review with /security-review and /rubberduck skills, native Azure DevOps support, voice input, cloud agent sessions, and scheduled automations.

02 jun 2026
github.blog →
Feature

Copilot SDK reaches GA with support for Node.js, Python, Go, .NET, Rust, and Java

The Copilot SDK reaches GA offering programmatic access to the Copilot agent runtime: planning, tool invocation, file edits, streaming, and multi-turn sessions. New additions since preview include slash commands, interactive input prompts, and a stable production API. Available to all Copilot subscribers and via BYOK for non-subscribers.

02 jun 2026
github.blog →
Update

GitHub Copilot moves to usage-based billing with GitHub AI Credits across all plans

All Copilot plans now use usage-based billing with GitHub AI Credits (monthly allotments + overage budgets). Code review now consumes both Actions minutes and AI Credits. New org-level user budget controls with email alerts. New Copilot Max premium tier for existing subscribers with higher usage limits. Pro+ offers 5x+ the limits of Pro.

01 jun 2026
github.blog →
Feature

Copilot Code Review: Agent Skills, MCP support, and new medium analysis tier

Public preview of agent skills and MCP support to bring org-specific context into code reviews via .github/skills directories and MCP server connections. New "medium analysis" tier that automatically routes complex PRs to a higher-reasoning model.

02 jun 2026
github.blog →
Feature

Copilot Memory captures user preferences for Business and Enterprise

Copilot Memory now captures user-level preferences (communication style, tool stack, git conventions) for Business and Enterprise customers, applying them across repositories. Admins get policy controls, export/audit, bulk deletion, and per-user opt-out. In public preview for the coding agent and Copilot CLI.

02 jun 2026
github.blog →
Model

MAI-Code-1-Flash available in GitHub Copilot: Microsoft's first in-house coding model

MAI-Code-1-Flash, Microsoft's first internally developed lightweight coding model, begins gradual rollout to Free, Pro, Pro+, and Max tiers. Claims best-in-class quality for its size among lightweight models. Selectable via the model picker in VS Code. Gradual rollout expanding over coming weeks.

02 jun 2026
github.blog →
Feature

Copilot CLI: experimental UI redesign, Rubber Duck critic, prompt scheduling, and voice input

Major Copilot CLI update at Microsoft Build 2026: experimental redesigned terminal interface with tab system (Sessions, Issues, PRs, Gists); Rubber Duck AI critic for design/plan feedback; /every and /after commands for prompt scheduling; hands-free voice input using local on-device speech-to-text. Experimental UI is in preview; remaining features are GA.

02 jun 2026
github.blog →
Feature

GitHub launches Agent Apps: installable third-party agents from Marketplace

GitHub introduces agent apps — installable third-party AI agents from the GitHub Marketplace that integrate directly into GitHub workflows. Initial partners include Amplitude, Bright Security, Endor Labs, LaunchDarkly, Miro, Sonar, PagerDuty, Packfiles, and Octopus Deploy. GitHub plans to open up building agent apps to anyone in coming months.

02 jun 2026
github.blog →
🖊️

Cursor / Zed / Devin Desktop

Various
Cursor 3
Update

Windsurf becomes Devin Desktop with ACP protocol, Rust engine, and Kanban agent view

Cognition (makers of Devin) rebranded and relaunched Windsurf as Devin Desktop. Default surface is now a Kanban for managing local and cloud agents. New features: Spaces (shared context between agents), ACP (open-source Agent Client Protocol for interoperability with Codex, Claude Agent, OpenCode), and Devin Local (Cascade successor rewritten in Rust with 30% fewer tokens and subagent support). Backward compatible with Windsurf and VSCode.

02 jun 2026
devin.ai →
Feature

Cursor 3: parallel builds with async subagents, automatic PR splitting, and Composer 2.5

Cursor can now multitask across independent tasks simultaneously using async subagents. A built-in quick action splits changes into PRs using chat context. Billing changes to purely usage-based (~$1.00–$1.50/run) for Bugbot; new Premium seat tier for heavy agent users. Composer 2.5 positioned as frontier performance at reduced cost. Quick-action pills for frequently used skills.

02 jun 2026
cursor.com →
Feature

Zed: terminal agents as threads in sidebar and Zed for Business launch

Zed announced the ability to run Claude Code, Amp, or any terminal agent as threads inside Zed's sidebar. ACP (Agent Client Protocol) support for interoperability with Claude Agent, Codex, Cursor, and others. Launch of the Zed for Business enterprise tier with centralized billing, role-based access controls, and team management.

02 jun 2026
zed.dev →
🏗️

Microsoft Build 2026

Microsoft
Build 2026
Preview

GitHub Spark: full-stack app building with natural language and one-click deployment

GitHub Spark lets you describe an app in plain English and get working full-stack code with a live preview, one-click deployment, and deep GitHub ecosystem integration. Currently available for Pro+ and Enterprise subscribers.

02 jun 2026
github.com →
Model

Microsoft launches MAI-Code-1-Flash and MAI-Thinking-1: first in-house AI models

MAI-Code-1-Flash is Microsoft's first in-house coding model, designed to be best-in-class for its size. MAI-Thinking-1 is a reasoning model built for high efficiency at low token cost. Both reduce reliance on OpenAI. MAI-Code-1-Flash is already available in GitHub Copilot.

02 jun 2026
cnbc.com →
🔵

Google I/O 2026 Products

Google
I/O 2026
Feature

Jules reaches GA: async coding agent that returns pull requests

Jules, Google's async coding agent, reaches GA at Google I/O 2026. It accepts a task description, executes it in an isolated cloud VM, and returns a pull request. Powered by Gemini 2.5 Pro. Usage is free during public beta. Direct GitHub workflow integration. Shows plan/reasoning before making changes. Includes audio changelog of commits.

19 may 2026
jules.google →
Update

Google Antigravity 2.0: agent-first platform with CLI, SDK, and enterprise Managed Agents

Antigravity 2.0 is Google's agent-first development platform launched at I/O 2026. Standalone desktop app for agent orchestration. Components: Antigravity CLI, Antigravity SDK, Managed Agents integration, and enterprise support via Gemini Enterprise Agent Platform. Supports multi-agent orchestration, background task scheduling, and native voice commands. Powered by Gemini 3.5 Flash. New $100/month AI Ultra plan with 5x higher usage limits.

19 may 2026
techcrunch.com →

Model Launches Timeline

All major model launches from the last 7 days, sorted newest first
Date Model Provider Tier Type Notes
2026-05-28 Claude Opus 4.8 Anthropic S+ Proprietary New default model in Claude Code. Agentic coding: 69.2%, multidisciplinary reasoning: 57.9%, Online-Mind2Web (computer use): 84% (#1). Fast Mode at 2.5x speed, 3x cheaper than predecessor.
2026-06-01 MiniMax M3 MiniMax A+ Open Open-weight with 1M token context. SWE-Bench Pro: 59.0%, BrowseComp: 83.5. MSA architecture for long-context efficiency. ~9x faster prefill. $0.60/$2.40 per M tokens. Independent benchmark verification pending.
2026-06-02 MAI-Code-1-Flash Microsoft A Proprietary Microsoft's first in-house coding model. Lightweight, optimized for Copilot. Best-in-class for its size. Available in GitHub Copilot via model picker.
2026-05-19 Gemini 3.5 Flash Google S Proprietary GA at Google I/O 2026. Terminal-Bench 2.1: 76.2%, GDPval-AA Elo: 1656, MCP Atlas: 83.6%. 4x faster than comparable frontier models. 1M token context. $1.50/$9.00 per M tokens.
2026-05-19 Qwen3.7-Max Alibaba / Qwen S Proprietary API-only. SWE-Bench Pro: 60.6% (#1), SWE-Verified: 80.4%, HMMT 2026 (math): 97.1% (#1). 1M token context. Native extended-thinking mode. Built for long-horizon autonomous workflows.
2026-04-24 DeepSeek-V4-Pro DeepSeek S Open MoE 1.6T/49B active. SWE-bench: 80.6%, MMLU-Pro: 87.5%. 1M token context. MIT license. $0.435/$0.87 per M tokens. Uses 27% of V3.2's compute at 1M context.
2026-04-20 Kimi K2.6 Moonshot AI A+ Open MoE 1T/32B active + MoonViT for vision. SWE-Bench Pro: 58.6%, Agentic Elo: 1520. Up to 300 sub-agents and 4,000 coordinated steps. 256K context. $0.60/$2.50 per M tokens.
2026-06-01 GPT-5.5 OpenAI S+ Proprietary Rolling out to paid ChatGPT plans. 1M token context. Now available on Amazon Bedrock. GPT-5.5 Instant is the new default model for all ChatGPT users.
2026-06-10 o3-Pro OpenAI S+ Upcoming Scheduled for June 10, 2026. OpenAI's most capable model. Recommended for challenging questions where reliability matters more than speed.
S+ FrontierS MajorA+ NotableA SolidB+ Incremental
8
Outils Suivis
60+
Mises à Jour
9
Modèles Catalogués
8
Fournisseurs Couverts
🤖

Claude Code

Anthropic
2.1.161
Modèle

Claude Opus 4.8 est le nouveau modèle par défaut avec des workflows dynamiques

Claude Opus 4.8 remplace Opus 4.7 comme modèle par défaut. Améliorations des benchmarks: codage agentique 64.3% → 69.2%, raisonnement multidisciplinaire avec outils 54.7% → 57.9%. Fast Mode disponible à 2x le tarif standard pour 2.5x de vitesse. La nouvelle commande /workflows orchestre des dizaines à des centaines d'agents en arrière-plan. Le mot-clé déclencheur a été renommé de workflow à ultracode.

28 may 2026
github.com →
Feature

Les plugins se chargent automatiquement depuis .claude/skills/ sans marketplace

Les plugins dans les répertoires .claude/skills/ se chargent automatiquement sans marketplace. Nouvelle commande claude plugin init <name> pour créer des plugins. Autocomplétion ajoutée pour les arguments de /plugin. Le champ agent dans settings.json est respecté pour les sessions dispatchées avec --agent <name>. EnterWorktree peut maintenant changer entre les worktrees gérés par Claude en cours de session.

29 may 2026
github.com →
Feature

Le mode Auto est désormais disponible sur Bedrock, Vertex et Foundry pour Opus 4.7 et 4.8

Le mode Auto s'étend aux fournisseurs cloud: Amazon Bedrock, Google Vertex et Azure Foundry. Disponible pour les modèles Opus 4.7 et Opus 4.8. Activer via CLAUDE_CODE_ENABLE_AUTO_MODE=1.

30 may 2026
github.com →
Sécurité

Nouvelles confirmations avant d'écrire des fichiers de configuration sensibles

Invite de confirmation ajoutée avant d'écrire dans les fichiers de démarrage du shell (.zshenv, .zlogin, .bash_login) et ~/.config/git/. En mode acceptEdits, invite aussi avant de modifier les fichiers de config de build qui accordent l'exécution de code: .npmrc, .yarnrc*, bunfig.toml, .bazelrc, .pre-commit-config.yaml, .devcontainer/.

01 jun 2026
github.com →
Feature

Étiquettes de dimension personnalisées OTEL et appels d'outils parallèles indépendants en cas d'échec

Les valeurs de OTEL_RESOURCE_ATTRIBUTES apparaissent maintenant comme étiquettes sur les datapoints de métriques pour segmenter par équipe/repo. Les appels d'outils parallèles sont désormais indépendants: une commande Bash échouée n'annule plus les autres appels du même batch. Le presse-papiers Linux utilise maintenant wl-copy/xclip/xsel avec support de sélection PRIMARY pour coller avec le clic du milieu.

02 jun 2026
github.com →
Feature

Nouvelle commande /simplify: révision nettoyage uniquement avec application automatique des correctifs

/simplify effectue une révision axée uniquement sur le nettoyage (réutilisation, simplification, efficacité) et applique automatiquement les correctifs. Distinct de /code-review --fix qui effectue une révision complète. /code-review --fix a aussi été ajouté pour appliquer les résultats après une révision complète.

27 may 2026
github.com →
💻

OpenAI Codex / Codex CLI

OpenAI
0.136.0
Update

Codex CLI v0.136.0: archivage de sessions, liens web cliquables et sandbox Windows

Nouveautés principales: archivage de sessions via /archive (TUI) ou codex archive/codex unarchive (CLI); liens web cliquables dans le TUI via OSC 8; mode stdio pour app-server (codex app-server --stdio); provisionnement sandbox Windows alpha (codex sandbox setup --elevated); enregistrement CODEX_API_KEY pour l'exécution distante. Corrections: refresh du token ChatGPT, durcissement de sécurité pour /diff/PowerShell/websocket, authentification Bedrock avec AWS_REGION.

01 jun 2026
github.com →
Update

Codex CLI v0.135.0: diagnostics enrichis, profils de permissions et édition d'objets texte Vim

Diagnostics enrichis pour codex doctor; détails de connexion distante dans /status; édition d'objets texte Vim avec binding d'interruption configurable; profils de permissions nommés dans /permissions; helper zsh patché inclus dans les packages macOS/Linux; mode d'installation non-interactif via CODEX_NON_INTERACTIVE=1. Presets Sandbox du SDK Python.

28 may 2026
github.com →
Feature

OpenAI lance AgentKit: Agent Builder visuel, Connector Registry et ChatKit intégrable

AgentKit est le toolkit complet pour construire, déployer et optimiser des agents sur la Responses API. Comprend: Agent Builder (canvas visuel pour créer et versionner des workflows multi-agents), Connector Registry (hub de tools et connexions de données géré par les admins), et ChatKit (expériences de chat avec agents intégrables et personnalisables).

02 jun 2026
openai.com →
Update

GPT-5.5, GPT-5.4 et Codex désormais disponibles sur Amazon Bedrock (AWS)

Disponibilité générale des modèles frontier d'OpenAI (GPT-5.5, GPT-5.4) et Codex sur Amazon Bedrock. Les clients AWS peuvent utiliser l'IA frontier via leurs workflows de sécurité, conformité et gouvernance existants.

01 jun 2026
openai.com →
Feature

Codex lance 6 plugins par rôle couvrant 62 apps et 110 skills pour le travail général

OpenAI a lancé six nouveaux plugins Codex spécifiques par rôle couvrant 62 applications populaires et 110 skills, étendant l'utilité de Codex au-delà de l'ingénierie logicielle vers le travail de connaissance général.

02 jun 2026
openai.com →
🧠

GPT Models

OpenAI
GPT-5.5
Fix

Rollback du snapshot o4-mini en raison d'une augmentation des signalements de contenu dans la surveillance automatisée

OpenAI a revert un snapshot récent d'o4-mini (déployé moins d'une semaine auparavant) censé améliorer la longueur des réponses. La surveillance automatisée a détecté une augmentation des signalements de contenu. Pertinent pour les workflows de génération de code dépendant d'o4-mini.

28 may 2026
help.openai.com →
Update

GPT-4.5 se retire de ChatGPT le 27 juin 2026; GPT-4.1 déprécié dans Copilot

OpenAI a annoncé le retrait de GPT-4.5 de ChatGPT le 27 juin 2026 (fenêtre de transition de 30 jours). GPT-4.1 a été déprécié dans tous les produits GitHub Copilot (Chat, éditions inline, mode agent, complétion de code) depuis le 1er juin. Le remplacement recommandé est GPT-5.5.

28 may 2026
witho2.com →

Gemini / Code Assist

Google
2.5 Pro GA
Update

Gemini CLI et Code Assist pour les particuliers arrêtés le 18 juin 2026; migration vers Antigravity

Google intègre Gemini CLI dans la nouvelle plateforme Antigravity CLI. Les extensions IDE Gemini Code Assist et Gemini CLI cesseront de servir les requêtes pour les tiers individuels, Google AI Pro et Google AI Ultra le 18 juin 2026. Les titulaires de licences Standard et Enterprise conservent l'accès. Les utilisateurs gratuits doivent migrer vers Antigravity.

20 may 2026
developers.googleblog.com →
Modèle

Gemini 2.5 Pro et 2.5 Flash atteignent la disponibilité générale pour Code Assist Standard et Enterprise

Les deux modèles, précédemment en Aperçu, sont maintenant GA pour Gemini Code Assist Standard et Enterprise. Ils alimentent le chat, la génération de code et la transformation de code, avec une meilleure gestion des tâches complexes en codage, mathématiques, sciences et raisonnement.

27 may 2026
developers.google.com →
Feature

La visualisation Inline Diff atteint la GA dans IntelliJ et VS Code; mémoire persistante sur GitHub

L'inline diff est maintenant GA pour IntelliJ et VS Code: les suggestions de code sont visuellement surlignées en vert (ajouts) et rouge (suppressions) directement dans l'éditeur. Agent Mode dans VS Code supporte aussi l'édition des changements de code via Gemini Inline Diff intégré. De plus, Gemini Code Assist sur GitHub stocke maintenant les interactions précédentes pour maintenir le contexte entre les sessions sur le même dépôt.

27 may 2026
developers.google.com →
🐙

GitHub Copilot

GitHub / Microsoft
Build 2026
Feature

GitHub Copilot App en aperçu technique: canevas, sandboxes cloud/local et Agent Merge

L'app bureau Copilot est disponible en aperçu technique pour les utilisateurs Pro, Pro+, Business et Enterprise. Fonctionnalités: tableau de bord My Work, git worktrees par session d'agent, Agent Merge (gestion automatique CI/merges), surfaces Canvas pour la collaboration bidirectionnelle agent-développeur, sandboxes locaux et cloud, révision de code améliorée avec les skills /security-review et /rubberduck, support Azure DevOps natif, saisie vocale, sessions d'agent cloud et automatisations planifiées.

02 jun 2026
github.blog →
Feature

Le SDK Copilot atteint la GA avec support pour Node.js, Python, Go, .NET, Rust et Java

Le SDK Copilot atteint la GA offrant un accès programmatique au runtime d'agents Copilot: planification, invocation d'outils, modifications de fichiers, streaming et sessions multi-tours. Nouvelles additions depuis l'aperçu: slash commands, invites d'entrée interactives et une API de production stable. Disponible pour tous les abonnés Copilot et via BYOK pour les non-abonnés.

02 jun 2026
github.blog →
Update

GitHub Copilot passe à la facturation à l'usage avec GitHub AI Credits pour tous les plans

Tous les plans Copilot utilisent désormais la facturation à l'usage avec GitHub AI Credits (allocations mensuelles + budgets de dépassement). La révision de code consomme maintenant à la fois des minutes Actions et des AI Credits. Nouveaux contrôles de budget utilisateur au niveau org avec alertes par email. Nouveau tier premium Copilot Max pour les abonnés existants avec des limites d'utilisation plus élevées. Pro+ offre 5x+ les limites de Pro.

01 jun 2026
github.blog →
Feature

Copilot Code Review: Agent Skills, support MCP et nouveau niveau d'analyse moyen

Aperçu public des agent skills et du support MCP pour apporter du contexte spécifique à l'organisation dans les révisions de code via les répertoires .github/skills et les connexions aux serveurs MCP. Nouveau niveau "medium analysis" qui route automatiquement les PRs complexes vers un modèle de raisonnement plus élevé.

02 jun 2026
github.blog →
Feature

Copilot Memory capture les préférences utilisateur pour Business et Enterprise

Copilot Memory capture maintenant les préférences au niveau utilisateur (style de communication, stack d'outils, conventions git) pour les clients Business et Enterprise, en les appliquant entre les dépôts. Les admins ont des contrôles de politique, export/audit, suppression en masse et opt-out par utilisateur. En aperçu public pour l'agent de codage et Copilot CLI.

02 jun 2026
github.blog →
Modèle

MAI-Code-1-Flash disponible dans GitHub Copilot: premier modèle de code maison de Microsoft

MAI-Code-1-Flash, le premier modèle de codage léger développé en interne par Microsoft, commence son déploiement progressif sur les tiers Free, Pro, Pro+ et Max. Revendique la meilleure qualité de sa catégorie pour sa taille parmi les modèles légers. Sélectionnable via le sélecteur de modèles dans VS Code.

02 jun 2026
github.blog →
Feature

Copilot CLI: nouveau UI expérimental, critique Rubber Duck, planification de prompts et entrée vocale

Mise à jour majeure de Copilot CLI lors de Microsoft Build 2026: interface terminal expérimentale redessinée avec système d'onglets (Sessions, Issues, PRs, Gists); critique IA Rubber Duck pour le feedback de conception/plan; commandes /every et /after pour la planification de prompts; saisie vocale mains libres via la reconnaissance vocale locale. L'UI expérimental est en aperçu; les autres fonctionnalités sont GA.

02 jun 2026
github.blog →
Feature

GitHub lance les Agent Apps: agents tiers installables depuis le Marketplace

GitHub introduit les agent apps — agents IA tiers installables depuis le GitHub Marketplace qui s'intègrent directement dans les workflows GitHub. Partenaires initiaux: Amplitude, Bright Security, Endor Labs, LaunchDarkly, Miro, Sonar, PagerDuty, Packfiles et Octopus Deploy. GitHub prévoit d'ouvrir la création d'agent apps à tous dans les prochains mois.

02 jun 2026
github.blog →
🖊️

Cursor / Zed / Devin Desktop

Various
Cursor 3
Update

Windsurf devient Devin Desktop avec protocole ACP, moteur Rust et vue Kanban des agents

Cognition (créateurs de Devin) a rebaptisé et relancé Windsurf sous le nom Devin Desktop. La surface par défaut est maintenant un Kanban pour gérer les agents locaux et cloud. Nouveautés: Spaces (contexte partagé entre agents), ACP (Agent Client Protocol open-source pour l'interopérabilité avec Codex, Claude Agent, OpenCode), et Devin Local (successeur de Cascade réécrit en Rust avec 30% moins de tokens et support de sous-agents). Rétrocompatible avec Windsurf et VSCode.

02 jun 2026
devin.ai →
Feature

Cursor 3: builds parallèles avec sous-agents async, découpage automatique de PRs et Composer 2.5

Cursor peut maintenant effectuer plusieurs tâches indépendantes simultanément en utilisant des sous-agents asynchrones. Une action rapide intégrée divise les changements en PRs en utilisant le contexte du chat. La facturation passe au purement à l'usage (~1,00–1,50$/exécution) pour Bugbot; nouveau tier Premium pour les utilisateurs intensifs d'agents. Composer 2.5 positionné comme performance frontier à coût réduit. Pills d'action rapide pour les skills fréquemment utilisés.

02 jun 2026
cursor.com →
Feature

Zed: agents terminal comme threads dans la barre latérale et lancement de Zed for Business

Zed a annoncé la possibilité d'exécuter Claude Code, Amp ou tout agent terminal comme threads dans la barre latérale de Zed. Support ACP (Agent Client Protocol) pour l'interopérabilité avec Claude Agent, Codex, Cursor et autres. Lancement du tier entreprise Zed for Business avec facturation centralisée, contrôles d'accès par rôles et gestion d'équipes.

02 jun 2026
zed.dev →
🏗️

Microsoft Build 2026

Microsoft
Build 2026
Aperçu

GitHub Spark: construction d'apps full-stack en langage naturel et déploiement en un clic

GitHub Spark permet de décrire une application en anglais simple et d'obtenir du code full-stack fonctionnel avec un aperçu en direct, un déploiement en un clic et une intégration profonde dans l'écosystème GitHub. Actuellement disponible pour les abonnés Pro+ et Enterprise.

02 jun 2026
github.com →
Modèle

Microsoft lance MAI-Code-1-Flash et MAI-Thinking-1: premiers modèles IA maison

MAI-Code-1-Flash est le premier modèle de codage maison de Microsoft, conçu pour être le meilleur de sa catégorie pour sa taille. MAI-Thinking-1 est un modèle de raisonnement conçu pour une haute efficacité à faible coût de tokens. Les deux réduisent la dépendance envers OpenAI. MAI-Code-1-Flash est déjà disponible dans GitHub Copilot.

02 jun 2026
cnbc.com →
🔵

Google I/O 2026 Products

Google
I/O 2026
Feature

Jules atteint la disponibilité générale: agent de codage asynchrone qui retourne des pull requests

Jules, l'agent de codage asynchrone de Google, atteint la GA lors de Google I/O 2026. Il accepte une description de tâche, l'exécute dans une VM cloud isolée et retourne une pull request. Propulsé par Gemini 2.5 Pro. Utilisation gratuite pendant la bêta publique. Intégration directe avec les workflows GitHub. Affiche le plan et le raisonnement avant de faire des changements. Inclut un changelog audio des commits.

19 may 2026
jules.google →
Update

Google Antigravity 2.0: plateforme agent-first avec CLI, SDK et Managed Agents enterprise

Antigravity 2.0 est la plateforme de développement agent-first de Google lancée lors de I/O 2026. Application bureau standalone pour l'orchestration d'agents. Composants: Antigravity CLI, Antigravity SDK, intégration Managed Agents et support enterprise via Gemini Enterprise Agent Platform. Supporte l'orchestration multi-agents, la planification de tâches en arrière-plan et les commandes vocales natives. Propulsé par Gemini 3.5 Flash. Nouveau plan AI Ultra à 100$/mois avec 5x plus de limites.

19 may 2026
techcrunch.com →

Chronologie des Lancements de Modèles

Tous les lancements majeurs des 7 derniers jours, les plus récents en premier
Date Modèle Fournisseur Tier Type Notes
2026-05-28 Claude Opus 4.8 Anthropic S+ Propriétaire Nouveau modèle par défaut dans Claude Code. Codage agentique: 69.2%, raisonnement multidisciplinaire: 57.9%, Online-Mind2Web (utilisation d'ordinateur): 84% (#1). Fast Mode à 2.5x de vitesse, 3x moins cher que le prédécesseur.
2026-06-01 MiniMax M3 MiniMax A+ Ouvert Open-weight avec contexte de 1M tokens. SWE-Bench Pro: 59.0%, BrowseComp: 83.5. Architecture MSA pour l'efficacité à long contexte. ~9x plus rapide en prefill. 0,60$/2,40$ par M tokens. Vérification indépendante des benchmarks en attente.
2026-06-02 MAI-Code-1-Flash Microsoft A Propriétaire Premier modèle de codage maison de Microsoft. Léger, optimisé pour Copilot. Meilleur de sa catégorie pour sa taille. Disponible dans GitHub Copilot via le sélecteur de modèles.
2026-05-19 Gemini 3.5 Flash Google S Propriétaire GA lors de Google I/O 2026. Terminal-Bench 2.1: 76.2%, GDPval-AA Elo: 1656, MCP Atlas: 83.6%. 4x plus rapide que les modèles frontier comparables. Contexte 1M tokens. 1,50$/9,00$ par M tokens.
2026-05-19 Qwen3.7-Max Alibaba / Qwen S Propriétaire API uniquement. SWE-Bench Pro: 60.6% (#1), SWE-Verified: 80.4%, HMMT 2026 (math): 97.1% (#1). Contexte 1M tokens. Mode de raisonnement étendu natif. Conçu pour les workflows autonomes à long horizon.
2026-04-24 DeepSeek-V4-Pro DeepSeek S Ouvert MoE 1.6T/49B actifs. SWE-bench: 80.6%, MMLU-Pro: 87.5%. Contexte 1M tokens. Licence MIT. 0,435$/0,87$ par M tokens. Utilise 27% du calcul de V3.2 à contexte 1M.
2026-04-20 Kimi K2.6 Moonshot AI A+ Ouvert MoE 1T/32B actifs + MoonViT pour la vision. SWE-Bench Pro: 58.6%, Elo agentique: 1520. Jusqu'à 300 sous-agents et 4000 étapes coordonnées. Contexte 256K. 0,60$/2,50$ par M tokens.
2026-06-01 GPT-5.5 OpenAI S+ Propriétaire Déploiement aux plans ChatGPT payants. Contexte 1M tokens. Maintenant disponible sur Amazon Bedrock. GPT-5.5 Instant est le nouveau modèle par défaut pour tous les utilisateurs ChatGPT.
2026-06-10 o3-Pro OpenAI S+ À venir Prévu pour le 10 juin 2026. Le modèle le plus capable d'OpenAI. Recommandé pour les questions difficiles où la fiabilité compte plus que la vitesse.
S+ FrontièreS MajeurA+ NotableA SolideB+ Incrémental