La nueva versión registra avances multimodales que permiten desarrollar agentes capaces de pensar, recordar y tomar decisiones guiados por los usuarios
Google continúa desarrollando su Inteligencia Artificial y registró un nuevo adelanto con la presentación de Gemini 2.0, el último modelo de IA de la empresa y el más capaz hasta el momento.
El lanzamiento se realizó el miércoles e incluye mejoras en el rendimiento con nuevas capacidades y avances multimodales, como la generación nativa de imágenes y audio multilingüe, y el uso nativo de herramientas inteligentes.
«Los nuevos avances multimodales permiten construir agentes que pueden pensar, recordar y tomar acciones guiados por las personas», precisaron desde la firma.
Basados en todos los adelantos de Gemini 1.0, que fue lanzado hace un año, Gemini 2.0 mejora su rendimiento, e incorpora capacidades que se conectan directamente a productos de Google como el Buscador y hasta puede ejecutar código.
De esta forma, Gemini 2.0 impulsará nuevas experiencias de IA en todos los productos de Google, al hacerlos más útiles e intuitivos para todos.
Proyectos destacados basados en Gemini 2.0
Gemini 2.0 Flash: Versión experimental que genera o edita imágenes y textos en distintos tonos. Estará disponible para desarrolladores en AI Studio y Vertex AI.
Proyecto Astra: Un prototipo que combina imágenes, videos y voz en una línea de tiempo, mejorando la recuperación de información y la interacción natural.
Proyecto Mariner: Reimagina la navegación web mediante capacidades de comprensión multimodal, automatizando tareas y acciones.
Proyecto Jules: Un asistente de codificación experimental que ayuda a desarrolladores a resolver errores y desafíos de programación.
Deep Research: Utiliza la IA para explorar temas complejos y generar informes completos para los usuarios de Gemini Advanced.
Innovaciones en Android
Google también presentó nuevas funciones de Android potenciadas por IA, como descripciones de imágenes detalladas, toma de notas inteligente, transferencia de archivos mediante códigos QR y escaneo mejorado de documentos.