Briefing Semanal 1–7 junio 2026

La frontera de la IA se abrió en cada modalidad —de la laptop al robot— y Microsoft decidió soltarse de OpenAI.

10 historias 9 fuentes 10 min. de lectura
Resumen de la semana

En siete días aterrizaron modelos de frontera con pesos abiertos en casi toda modalidad —multimodal, físico, código, imagen y voz—: lo abierto dejó de ir detrás.

Gemma 4 12B mete IA multimodal sin encoders en una laptop de 16 GB y Cosmos 3 hace lo mismo para robots: la frontera ya corre fuera del datacenter.

NVIDIA liberó Nemotron 3 Ultra con pesos, datos y recetas, el mejor abierto de Estados Unidos, que aún va detrás del chino Kimi K2.6.

Microsoft presentó siete modelos propios entrenados sin destilar de nadie: busca soltarse de OpenAI y abaratar el cómputo en Azure.

Y mientras el capital corre hacia la IA física, un paper de Wharton advierte que automatizar sin freno erosiona la demanda que lo sostiene.

intermedio · briefing semanal

Recibe el briefing los lunes

sin spam · una vez por semana · política

01 / 10
Google3 junio 2026

Gemma 4 12B: IA multimodal sin encoders que corre en una laptop de 16 GB

Google DeepMind liberó Gemma 4 12B, un modelo abierto que procesa texto, imagen, audio y video sin redes de encoder separadas, proyectando los datos crudos directo al espacio del modelo. Trae 256K de contexto, uso de herramientas y modo de razonamiento, y corre entero en una laptop de 16 GB bajo licencia Apache 2.0. Pone capacidad multimodal de frontera al alcance de cualquiera, sin datacenter.

Leer en Google
abiertomultimodalgoogle
02 — 10
02

NVIDIA lanza Cosmos 3, el primer omnimodel abierto para IA física

En GTC Taipei NVIDIA presentó Cosmos 3, descrito como el primer omnimodel totalmente abierto: entiende y genera texto, imagen, video, sonido ambiente y acciones con física realista, sobre una arquitectura de mixture-of-transformers que razona antes de generar. Dice recortar de meses a días los ciclos de entrenamiento y evaluación de robots. Llega con una coalición abierta que incluye a Generalist, Runway y Skild AI.

1 min
03

Nemotron 3 Ultra: NVIDIA abre un modelo de 550B con pesos, datos y recetas

NVIDIA publicó Nemotron 3 Ultra, un Mixture-of-Experts de 550 mil millones de parámetros (55 mil millones activos) sobre una arquitectura híbrida Mamba-Transformer, con pesos, datos de entrenamiento y recetas bajo licencia permisiva. Es el mejor modelo abierto de Estados Unidos y corre varias veces más rápido que sus rivales. Aun así queda seis puntos de inteligencia por detrás del chino Kimi K2.6.

1 min
04

MiniMax M3: modelo abierto de código con un millón de tokens de contexto

MiniMax anunció M3, que combina rendimiento de agente de código de primer nivel, ventana de un millón de tokens y multimodalidad nativa en un solo modelo abierto. Reporta 59% en SWE-Bench Pro, por encima de GPT-5.5 y Gemini 3.1 Pro, gracias a una atención dispersa propia que procesa por bloques. Los pesos llegarían a Hugging Face dentro de diez días y los números aún son auto-reportados.

1 min
05

Microsoft presenta siete modelos propios para depender menos de OpenAI

En Build, Microsoft mostró siete modelos MAI hechos en casa, encabezados por MAI-Thinking-1, un Mixture-of-Experts de cerca de un billón de parámetros entrenado desde cero sin destilar de terceros. En SWE-Bench Pro iguala a Claude Opus 4.6 y MAI-Code-1-Flash llega a todos los planes de GitHub Copilot. La apuesta es correr en Azure y soltarse de OpenAI y Anthropic.

1 min
06

Ideogram 4.0: modelo de imagen abierto con prompts en JSON y control de layout

Ideogram liberó los pesos de su modelo de imagen 4.0, un Diffusion Transformer de 9.3B entrenado desde cero, con interfaz de prompts en JSON, cajas de layout y el mejor renderizado de texto dentro de la imagen. Genera a resolución nativa de 2K y trae a pesos abiertos lo que vivía tras una API. La licencia es libre para investigación pero pide acuerdo aparte para producción comercial.

1 min
07

Generalist AI levanta 400 millones para construir AGI física

La startup de modelos fundacionales para robots cerró 400 millones de dólares a una valuación cercana a 2 mil millones, con NVIDIA, Fei-Fei Li, Bezos y Naval Ravikant entre los inversores. Usará el capital para escalar la recolección de datos del mundo real y el cómputo. Es otra señal de que la IA física concentra el dinero esta semana.

1 min
08

dots.tts: un modelo de síntesis de voz de 2B liberado bajo Apache 2.0

Un equipo publicó un modelo fundacional de texto-a-voz de 2 mil millones de parámetros que modela el habla en un espacio latente continuo, con código y checkpoints abiertos bajo licencia Apache 2.0. Es estado del arte abierto en chino e inglés, con latencias de primer paquete de apenas 54 a 85 milisegundos. La voz se suma a la ola de pesos abiertos de la semana.

1 min
09

Wall Attention: atención sin RoPE para contexto largo, de Tilde Research

Tilde Research sumó a la librería FLA un mecanismo de atención softmax completa con un decay multiplicativo aprendido por canal y sin codificación posicional RoPE. La idea es manejar contextos largos sin las penalizaciones habituales de las posiciones rotatorias. Es de las piezas de arquitectura que rara vez salen del laboratorio y aquí llegan como código abierto.

1 min
10

Un paper de Wharton modela cómo la automatización puede erosionar su propia demanda

El trabajo de Brett Hemenway Falk y Gerry Tsoukalas, que volvió a circular esta semana, muestra que cada empresa captura todo el ahorro de automatizar pero solo carga con una fracción de la pérdida de demanda que provoca. El resultado es una carrera por automatizar más allá de lo colectivamente óptimo. Probaron varias políticas y solo un impuesto pigouviano a la automatización corrige la falla.

1 min

Herramientas que uso

Afiliado

Fathom

Asistente de IA que graba, transcribe y resume tus reuniones (Zoom, Meet, Teams). Lo uso a diario. Si te suscribes desde este link, recibo créditos que sostienen PX Noticias IA.

Conocer Fathom →
Recomendación

Microsoft Copilot

El asistente de IA de Microsoft, integrado en Windows y Office. A mano si vives en ese ecosistema y quieres IA sin cambiar de herramienta.

Visitar Microsoft Copilot →

Quién hace esto

Jonathan Proaño

Soy Jonathan. Construyo sitios web, apps e implementaciones de IA en Parlox Network.

Si tú o tu organización necesitan asesoría, desarrollo o un copiloto con criterio para sus proyectos de software o IA — escríbeme directo. Respondo personalmente todos los mensajes.

Sobre el sitio

PX Noticias IA es un briefing semanal curado de noticias sobre inteligencia artificial, escrito en español. Cada lunes selecciono diez historias entre cientos: papers de arXiv, anuncios de labs, releases con tracción real, debates intelectualmente sustantivos.

No es un agregador. Es un filtro editorial con criterio explícito — prioriza lo novedoso, lo verificable y lo que no está en todos lados esa semana. Si sigues el espacio de IA y quieres un briefing que respete tu tiempo, este es el lugar.