🥇 Bit #1 — Gemini Spark llega a los usuarios esta semana: Google ejecuta su jugada agentic con Gmail como ventaja desigual
Qué pasó: El martes pasado en I/O 2026, Google presentó Gemini Spark, un agente personal 24/7 construido sobre Gemini base + el harness agentic de Google Antigravity. Esta semana (semana del 26 de mayo) empieza el rollout a suscriptores de Google AI Ultra en EE.UU. La diferencia con Claude Cowork u OpenAI ChatGPT Agent es la integración nativa con Gmail, Docs, Sheets, Slides y Workspace — sin configurar permisos, sin pegar tokens. El agente corre en VMs dedicadas en Google Cloud, recibe instrucciones por email y se integra con apps externas vía MCP (Canva, OpenTable, Instacart al lanzamiento; Adobe, Samsung, Spotify, GitHub, Notion, Slack confirmados para verano). En paralelo, Google lanzó Gemini 3.5 Flash a precio US$1.50/M input + US$9/M output — 3x más caro que 3 Flash Preview, pero ya superando a Gemini 3.1 Pro en benchmarks como Terminal-Bench 2.1 (76.2%) y CharXiv (84.2%). Google AI Ultra bajó de US$250 a US$100/mes en el mismo evento.
Take: Dos cosas que importan más allá del producto: primero, MCP es ahora estándar de facto. Anthropic lo inventó en noviembre 2024, lo donó a la Linux Foundation en diciembre 2025, y ahora Google lo adopta en Search, Maps, BigQuery, GKE y Compute Engine. Cuando todos los frontier labs convergen sobre el mismo protocolo, la pregunta para founders deja de ser "qué modelo usar" y pasa a "qué MCP server propio puedo construir que mi nicho específico necesite". Segundo, el rollout a Europa quedó atrás (Q3 2026 por el AI Act) — LATAM probablemente sigue ese mismo timing. Para builders de la región, esto significa una ventana real de meses para construir integraciones MCP locales (verticales LATAM-específicos) antes de que las apps grandes lleguen oficialmente.
Fuentes:
Simon Willison (deep dive precio + benchmarks) — https://simonwillison.net/2026/May/19/gemini-35-flash/
Google blog (Gemini 3.5) — https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/
🥈 Bit #2 — Enter (Brasil) se convierte en el primer unicornio de IA de LATAM: US$100M Series B liderada por Founders Fund
Qué pasó: El 5 de mayo, Founders Fund lideró una Series B de US$100 millones en Enter, legaltech brasileña fundada en 2023, con participación de Ribbit Capital, Sequoia Capital, ONEVC, Atlantico y Kaszek. La valuación: US$1.200 millones — primer unicornio de IA de la región. Las cifras son contundentes: revenue creció 10x+ desde la Series A, base de clientes se triplicó, y más de 300.000 casos legales por año pasan por EnterOS. Clientes anclados: Bradesco, Nubank, Mercado Livre, Airbnb, LATAM Airlines, Azul, más otras 40+ empresas grandes. El producto automatiza análisis de litigios, preparación de defensas y manejo de acuerdos extrajudiciales — con revisión humana al final del flujo.
Take: Este es el playbook que vale memorizar para founders LATAM. Tres componentes: (1) vertical específico con regulación pesada (no horizontal, no "AI for X" genérico) — el sector legal en Brasil tiene complejidad procesal que un modelo global nunca va a aprender bien; (2) datos propietarios que mejoran el modelo con cada caso — Enter dice explícitamente que cada caso procesado mejora la precisión del sistema; (3) ancla de clientes regulados desde el principio (bancos, aerolíneas, marketplaces) que pagan por evitar errores costosos, no por ahorrar tiempo. La diferencia con startups LATAM más viejas: Enter no compite en la capa de modelo, compite en distribución vertical + integración profunda. Y las dos americanas top (Founders Fund + Sequoia) entraron juntas — señal de que el venture estadounidense ya está mirando LATAM AI no como mercado emergente sino como oportunidad de retorno comparable.
Fuentes:
Gunderson Dettmer (detalles legales del deal) — https://www.gunder.com/en/news-insights/client-news/founders-fund-leads-dollar100-million-series-b-for-enter-latin-americas-first-unicorn
🥉 Bit #3 — Kimi K2.6 vence a Claude Opus 4.6 y GPT-5.4 en SWE-Bench Pro: el gap open-weight vs. closed se reduce a 3.5 meses
Qué pasó: Moonshot AI lanzó Kimi K2.6 el 20 de abril bajo licencia Modified MIT — 1T parámetros MoE (1 billón en notación hispana, 10¹²), 32B activos. Los benchmarks publicados (verificados por terceros como Vercel, Baseten, Fireworks): 58.6% en SWE-Bench Pro, superando a GPT-5.4 (57.7%), Claude Opus 4.6 (53.4%) y Gemini 3.1 Pro (54.2%). Precio API: US$0.60/M input y US$2.50-3.00/M output — aproximadamente 88% más barato que Claude Opus 4.7 en input. Característica diferencial: Agent Swarms con 300 sub-agentes coordinados en 4.000 pasos paralelos. En paralelo, Epoch AI publicó datos midiendo el ECI (Epoch Capabilities Index): el gap promedio entre el mejor modelo open-weight y el mejor closed se redujo a 3.5 meses (vs. ~12 meses en finales de 2024). Y Zhipu AI (Z.ai) lanzó GLM-5, 744B parámetros, entrenado completamente sobre 100.000 Huawei Ascend 910B sin un solo chip NVIDIA — Z.ai está en la Entity List de EE.UU. desde enero 2025.
Take: Dos lecturas, ninguna trivial. Primera: para cualquier equipo LATAM ajustado de presupuesto, ya no hay razón técnica para defaultear a Claude Opus en flujos agentic de código. Kimi K2.6 está en el mismo nivel — o por encima — y cuesta una fracción. Segunda: el embargo de chips a China no detuvo el progreso chino, lo redirigió. GLM-5 entrenado solo en Huawei Ascend es la primera prueba pública de que el ecosistema doméstico chino funciona end-to-end para modelos frontier. Estratégicamente, eso reabre la pregunta para reguladores y proveedores cloud LATAM: ¿conviene apostar todo a NVIDIA, o vale diversificar hardware desde ahora? Tercera lectura silenciosa: ningún modelo open todavía iguala a Claude Opus 4.7 (lanzado abril) en HLE-Full ni en tareas multimodales complejas. El gap existe, simplemente es más pequeño de lo que el discurso sugiere.
Fuentes:
Moonshot AI (Kimi K2.6 tech blog) — https://www.kimi.com/blog/kimi-k2-6
Epoch AI (datos del gap 3.5 meses) — https://epoch.ai/data-insights/open-weights-vs-closed-weights-models
Hugging Face blog (GLM-5 / Z.ai sin NVIDIA) — https://huggingface.co/blog/mlabonne/glm-5
The Register (Z.ai Huawei) — https://www.theregister.com/2026/01/15/zhipu_glm_image_huawei_hardware/
🔗 Enlaces de interés
Anthropic Mythos: el modelo de ciberseguridad que la propia Anthropic considera demasiado peligroso para release general. Lanzado el 7 de abril bajo Project Glasswing, Mythos puede descubrir vulnerabilidades zero-day en sistemas operativos y navegadores, y encadenar bugs en exploits multi-paso. Acceso restringido a un grupo aprobado: AWS, Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA. El 21 de abril, Bloomberg reportó que un grupo no autorizado accedió al modelo el mismo día del anuncio público a través de un vendor externo. Después de criticar el enfoque, OpenAI restringió acceso a su modelo Cyber a fines de abril. (Rest of World · TechCrunch · CNBC)
Microsoft, Google y xAI aceptan que el gobierno de EE.UU. testee sus modelos antes del lanzamiento. Anunciado el 5 de mayo, es un acuerdo voluntario para pre-launch testing a través del AI Safety Institute. Notable porque ocurre dos semanas antes de que Trump retirara la orden ejecutiva que habría hecho esto obligatorio (cubierto ayer). El mensaje: la industria prefiere acuerdos voluntarios negociados a regulación impuesta. (CNN)
Claude Opus 4.7 ahora soporta imágenes de alta resolución (2576px / 3.75MP). Lanzado el 16 de abril, es el primer Claude con soporte de imagen de alta resolución. Útil para flujos de análisis visual: revisión de diagramas técnicos, OCR de documentos densos, análisis de imágenes médicas. También trae el nivel de esfuerzo
xhigh(nuevo default de Claude Code), el comando/ultrareviewpara revisiones multi-etapa, y task budgets en beta pública. (Anthropic · GitHub Changelog)
💡 Tip del día
Reduce tu factura de Claude Opus en ~88% para tareas de coding agentic — sin sacrificar calidad en SWE-Bench.
Si tu stack hoy es Claude Code o Cline corriendo Claude Opus 4.7 para refactors y feature work, hoy puedes probar Kimi K2.6 vía API y ver el costo real. K2.6 superó a Claude Opus 4.6 en SWE-Bench Pro (58.6% vs 53.4%) y queda casi empatado con Opus 4.7 en SWE-Bench Verified (80.2% vs 80.8%). El costo: US$0.60 input + US$2.50-3.00 output por millón vs US$5 input + US$25 output de Opus 4.7.
Cómo probarlo en 5 minutos:
Crear cuenta en
platform.kimi.ai, generar API keyEn Claude Code o Cline, apuntar el endpoint a la API de Kimi (compatible con formato OpenAI)
Probar en un PR real — ideal uno con cambios cross-file que requiera context grande (K2.6 tiene 256K de contexto)
Medir: tiempo de respuesta, calidad del diff, costo del run completo
Caveat honesto: K2.6 todavía no iguala a Opus 4.7 en HLE-Full ni en tareas de razonamiento puramente matemáticas. Para coding + tool use + agentic loops, está en el mismo tier a una fracción del costo. Para investigación o tareas de reasoning crítico, Opus 4.7 sigue siendo superior.