
Google lanza Gemini 3: su IA más avanzada reta a OpenAI y GPT-5
Google ha dado hoy otro gran paso hacia la inteligencia artificial general con el lanzamiento de Gemini 3, descrito por la compañía como “nuestro modelo más inteligente”. Con esta nueva versión, la filial de Alphabet se coloca en competencia directa con OpenAI y GPT-5, que recientemente presentó su versión 5.1 con mejoras en capacidad y estilo de comunicación.
Además de Gemini 3, Google ha presentado Gemini 3 Deep Think, un modelo con razonamiento avanzado diseñado para tareas más complejas, aunque por el momento permanece en fase de pruebas.
El equipo de DeepMind, liderado por Demis Hassabis, describe a Gemini 3 como el mejor modelo del mundo en comprensión multimodal y su sistema de programación más potente hasta la fecha. Entre sus capacidades destacan visualizaciones más completas, mayor interactividad y razonamiento de vanguardia, lo que abre nuevas posibilidades para aplicaciones que combinan texto, imágenes y datos.
Los interesados en probar el modelo pueden acceder a Gemini 3 Pro a través de la aplicación de Gemini. Los suscriptores de Google AI Pro y Ultra también podrán utilizarlo en Modo IA dentro del buscador de Google, integrando estas funciones directamente en la experiencia de búsqueda.
Gemini 3: la IA multimodal de Google que combina texto, imágenes, vídeo y audio
Gemini 3 destaca por sus capacidades multimodales, lo que le permite procesar simultáneamente texto, imágenes, código, vídeo y audio, además de demostrar un razonamiento avanzado. Según Google, el modelo “demuestra un razonamiento de nivel de doctorado” y su versión Pro es capaz de resolver problemas complejos en una amplia gama de temas con un alto grado de fiabilidad.
Entre sus características principales se incluyen:
- Respuestas inteligentes, concisas y directas.
- Capacidad de agente, para completar tareas complejas y planificar a largo plazo.
- Procesamiento multimodal, integrando información de distintos formatos para generar soluciones creativas.
Por ejemplo, Gemini 3 puede descifrar y traducir recetas escritas a mano en varios idiomas, ayudando a crear un libro de cocina familiar. También puede analizar artículos académicos, vídeos de clases o tutoriales y generar código para tarjetas interactivas, visualizaciones u otros formatos.
En el Modo IA de la Búsqueda, Gemini 3 ofrece experiencias de interfaz generativa, incluyendo diseños visuales inmersivos, herramientas interactivas y simulaciones creadas sobre la marcha, brindando nuevas formas de explorar y comprender información.
El objetivo de Google es que Gemini 3 actúe como un “compañero creativo”, proporcionando nuevas maneras de procesar, analizar y presentar información de forma eficiente e intuitiva.
Google también tiene en camino el modo Deep Think o Pensamiento Profundo de Gemini 3, que en opinión de la compañía «va aún más allá en los límites de la inteligencia». Por ahora este modelo se encuentra en fase de pruebas para realizar evaluaciones de seguridad antes de ponerlo a disposición de los suscriptores de Google AI Ultra en las próximas semanas.