Google lanza Gemini 3: su IA más inteligente con mejoras en razonamiento y comprensión multimodal

La imagen actual no tiene texto alternativo. El nombre del archivo es: TECNOPUNTA-163.jpg

Google lanza Gemini 3: su IA más avanzada reta a OpenAI y GPT-5

Google ha dado hoy otro gran paso hacia la inteligencia artificial general con el lanzamiento de Gemini 3, descrito por la compañía como “nuestro modelo más inteligente”. Con esta nueva versión, la filial de Alphabet se coloca en competencia directa con OpenAI y GPT-5, que recientemente presentó su versión 5.1 con mejoras en capacidad y estilo de comunicación.

Además de Gemini 3, Google ha presentado Gemini 3 Deep Think, un modelo con razonamiento avanzado diseñado para tareas más complejas, aunque por el momento permanece en fase de pruebas.

El equipo de DeepMind, liderado por Demis Hassabis, describe a Gemini 3 como el mejor modelo del mundo en comprensión multimodal y su sistema de programación más potente hasta la fecha. Entre sus capacidades destacan visualizaciones más completas, mayor interactividad y razonamiento de vanguardia, lo que abre nuevas posibilidades para aplicaciones que combinan texto, imágenes y datos.

Los interesados en probar el modelo pueden acceder a Gemini 3 Pro a través de la aplicación de Gemini. Los suscriptores de Google AI Pro y Ultra también podrán utilizarlo en Modo IA dentro del buscador de Google, integrando estas funciones directamente en la experiencia de búsqueda.

Gemini 3: la IA multimodal de Google que combina texto, imágenes, vídeo y audio

Gemini 3 destaca por sus capacidades multimodales, lo que le permite procesar simultáneamente texto, imágenes, código, vídeo y audio, además de demostrar un razonamiento avanzado. Según Google, el modelo “demuestra un razonamiento de nivel de doctorado” y su versión Pro es capaz de resolver problemas complejos en una amplia gama de temas con un alto grado de fiabilidad.

Entre sus características principales se incluyen:

Respuestas inteligentes, concisas y directas.
Capacidad de agente, para completar tareas complejas y planificar a largo plazo.
Procesamiento multimodal, integrando información de distintos formatos para generar soluciones creativas.

Por ejemplo, Gemini 3 puede descifrar y traducir recetas escritas a mano en varios idiomas, ayudando a crear un libro de cocina familiar. También puede analizar artículos académicos, vídeos de clases o tutoriales y generar código para tarjetas interactivas, visualizaciones u otros formatos.

En el Modo IA de la Búsqueda, Gemini 3 ofrece experiencias de interfaz generativa, incluyendo diseños visuales inmersivos, herramientas interactivas y simulaciones creadas sobre la marcha, brindando nuevas formas de explorar y comprender información.

El objetivo de Google es que Gemini 3 actúe como un “compañero creativo”, proporcionando nuevas maneras de procesar, analizar y presentar información de forma eficiente e intuitiva.

Gemini 3 crea un juego retro en 3D con un solo prompt.

Google también tiene en camino el modo Deep Think o Pensamiento Profundo de Gemini 3, que en opinión de la compañía «va aún más allá en los límites de la inteligencia». Por ahora este modelo se encuentra en fase de pruebas para realizar evaluaciones de seguridad antes de ponerlo a disposición de los suscriptores de Google AI Ultra en las próximas semanas.

Google lanza Gemini 3: su IA más inteligente con mejoras en razonamiento y comprensión multimodal

Google lanza Gemini 3: su IA más avanzada reta a OpenAI y GPT-5

Gemini 3: la IA multimodal de Google que combina texto, imágenes, vídeo y audio

¡Recibe las noticias más importantes al instante!

Deja una respuesta Cancelar la respuesta

Noticias de la semana (#18 2026)

Apple habría alcanzado un acuerdo preliminar con Intel para fabricar parte de sus chips

PlayStation apuesta por la IA para acelerar el desarrollo de juegos y potenciar la creatividad

Nintendo Switch 2 roza los 20 millones de consolas vendidas, pero Nintendo prevé una caída en el segundo año