Andina

Google lanza Gemini 2.0, su modelo de inteligencia artificial con nuevas actualizaciones

Modelo de IA con nuevas capacidades para la generación nativa de imágenes y audio multilingüe.

Con el fin de que la inteligencia artificial (IA) sea más útil y accesible para las personas, Google presenta Gemini 2.0, el último modelo de IA de la compañía y el más capaz hasta el momento, diseñado en la era de los agentes autónomos.

Con el fin de que la inteligencia artificial (IA) sea más útil y accesible para las personas, Google presenta Gemini 2.0, el último modelo de IA de la compañía y el más capaz hasta el momento, diseñado en la era de los agentes autónomos.

06:41 | Lima, dic. 12.

Con el fin de que la inteligencia artificial (IA) sea más útil y accesible para las personas, Google presenta Gemini 2.0, el último modelo de IA de la compañía y el más capaz hasta el momento, diseñado en la era de los agentes autónomos. Descubre cuál es su potencial y cómo se diferencia de su versión anterior.

Basados en todos los adelantos de Gemini 1.0 -lanzado hace un año-, Gemini 2.0 mejora su rendimiento e incluye nuevas capacidades, como la generación nativa de imágenes y audio multilingüe, y el uso nativo de herramientas inteligentes, que se conectan directamente a productos de Google como el Buscador y hasta puede ejecutar códigos.

Estas funciones hacen posible construir agentes que pueden pensar, recordar, planificar e incluso tomar acciones. De esta forma, Gemini 2.0 impulsará nuevas experiencias de IA en todos los productos de Google. A continuación, conoce estas actualizaciones:

Gemini 2.0 Flash

Esta es la primera versión experimental de los modelos 2.0 que pueden crear o editar imágenes o generar texto en diferentes tonos. Admite salidas multimodales como imágenes generadas de forma nativa mezcladas con texto y audio multilingüe de texto a voz (TTS). 

Lee también: Proyectos peruanos de inteligencia artificial en beneficio de los niños ganaron hackatón

También puede utilizar herramientas de forma nativa como la Búsqueda de Google, la ejecución de código, así como funciones de terceros definidas por el usuario. 

Gemini 2.0 Flash ahora está disponible como un modelo experimental para los desarrolladores a través de la API de Gemini en Google AI Studio y Vertex AI con entradas multimodales, salidas de texto, y generación de imágenes nativas y de texto a voz disponible para los socios con acceso anticipado. Seguirá la disponibilidad general en enero, junto con más tamaños de modelos. 

Las capacidades de acción de la interfaz de usuario nativa de Gemini 2.0 Flash, junto con otras mejoras, trabajan en conjunto para habilitar una clase nueva de experiencias de agentes. La aplicación práctica de agentes de IA es un área de investigación repleta de posibilidades emocionantes. Con esto, Google está explorando una nueva frontera con una serie de prototipos que pueden ayudar a las personas a realizar y completar tareas.

Lee también: Empresa digital: Oportunidades y desafíos de la inteligencia artificial en tu negocio

Proyecto Astra

Google compartió las actualizaciones de su prototipo de investigación de lo que puede ser un asistente universal de IA. Astra combina imágenes, videos y voz en una línea de tiempo de eventos para conversaciones más naturales y una recuperación de información eficiente. 

- Mejor diálogo: Project Astra ahora tiene la capacidad de conversar en varios idiomas y en idiomas mezclados, con una mejor comprensión de acentos y palabras poco comunes. 

- Uso de la herramienta nueva: Con Gemini 2.0, Project Astra puede usar la Búsqueda de Google, Lens y Maps, lo que lo hace más útil como un asistente en tu vida cotidiana. 

- Mejor memoria: Mejoramos la capacidad de Project Astra para recordar cosas mientras que tú te mantienes al control. Ahora tiene hasta 10 minutos de memoria durante la sesión y puede recordar más conversaciones que hayas tenido con ella en el pasado, así que está más personalizada para ti. 

- Latencia mejorada: Con nuevas funciones de transmisión y compresión de audio nativo, el agente puede entender el idioma aproximadamente a la latencia de una conversación humana.


Lee también: Inteligencia artificial: conoce las 4 áreas que se transforman al usarla

Proyecto Mariner

Se trata de un nuevo prototipo de investigación temprana basada en Gemini 2.0. Mariner reimagina cómo las personas interactúan con la web, combinando las capacidades de comprensión multimodal de Gemini con la interacción web para automatizar tareas y tomar acciones en tu nombre. 

Para desarrollar esta herramienta de manera segura y responsable, Google está realizando una investigación activa de los nuevos tipos de riesgos y cómo mitigarlos, siempre manteniendo a las personas en en loop. Por ejemplo, Project Mariner solo puede escribir, desplazarse o hacer clic en la pestaña activa del navegador y le pide a los usuarios la confirmación final antes de realizar ciertas acciones sensibles, como hacer una compra.

Actualmente, los verificadores de confianza están comenzando a probar Project Mariner con la extensión experimental de Chrome.


Proyecto Jules

El gigante tecnológico está explorando cómo agentes de IA pueden apoyar de formas más directa a los desarrolladores. 

En ese sentido, Jules es un agente de código experimental impulsado por IA al que se le puede delegar tareas, como resolver errores y desafíos de codificación. Por el momento, este prototipo estará disponible para un grupo selecto de personas.

Lee también: Con tecnología e inteligencia artificial buscan optimizar producción de palta en Apurímac

Deep Research

Se trata de una nueva capacidad para los usuarios de Gemini Advanced que utiliza la IA para explorar temas complejos en nombre de quien lo esté ejecutando, y le proporcione hallazgos en un informe completo.

Estas nuevas funciones de Android potenciadas por inteligencia artificial (IA) que mejoran la accesibilidad, la creatividad y la productividad. Las innovaciones incluyen descripciones de imágenes más detalladas, toma de notas inteligente, transferencia de archivos sin problemas mediante códigos QR y capacidades mejoradas de escaneo de documentos. 

Los lanzamientos marcan un nuevo capítulo para el modelo de Gemini. Con el lanzamiento de Gemini 2.0 Flash y la serie de prototipos de investigación que exploran las posibilidades de los agentes, Google quiere alcanzar un logro muy importante en la era de Gemini.

Revisa más noticias sobre ciencia, tecnología e innovación en la Agencia Andina y escucha historias inspiradoras en Andina Podcast.

Más en Andina:


(FIN) NDP/ MFR

Published: 12/12/2024