Andina

Inteligencia artificial de ChatGPT reconoce audio e imágenes y te responde con voz

Estará disponible para usuarios del servicio Plus y Enterprise de ChatGPT, y se extenderá próximamente al resto.

Con estas nuevas funciones y una interfaz renovada, los usuarios podrán tener conversaciones habladas y enviarle fotografías a ChatGPT. Foto: AFP

Con estas nuevas funciones y una interfaz renovada, los usuarios podrán tener conversaciones habladas y enviarle fotografías a ChatGPT. Foto: AFP

15:08 | Lima, set. 29.

ChatGPT está llevando a otro nivel su tecnología basada en inteligencia artificial y apunta a convertirse en un asistente virtual. OpenAI anunció una nueva actualización que permitirá que este popular chatbot conversacional pueda “ver, oír y hablar”.

Con estas nuevas funciones y una interfaz renovada, los usuarios podrán tener conversaciones habladas y enviarle fotografías a ChatGPT.

La compañía anunció que el reconocimiento de voz e imágenes para ChatGPT estará disponible para usuarios que paguen el servicio Plus y Enterprise durante las próximas dos semanas. Pronto la compañía evalúa ampliar el acceso a otros grupos de usuarios. 

La funcionalidad de voz estará disponible para las aplicación móviles en iOS y Android. Las imágenes funcionarán en todas las plataformas.

Ahora podrás hablar con ChatGPT 

La nueva actualización de Chat GPT permitirá usar la voz para tener una conversación con este asistente.Por ejemplo, un usuario podría pedirle que le narre un cuento para dormir o podría entablar un diálogo sobre un tema de su interés.

Para activar esta herramienta en la aplicación móvil de Chat GPT, ve al menú de Configuración, haz clic en “Nuevas funciones” y selecciona las conversaciones con voz. Luego,  ve al ícono de auriculares ubicado en la esquina superior derecha de la pantalla de inicio y selecciona tu voz preferida dentro de las cinco alternativas. 
Esta nueva funcionalidad de voz está impulsada por un nuevo modelo de conversión de texto a voz, que tiene la capacidad generar audio similar al humano a partir de solo texto y unos pocos segundos de muestra de voz. 

OpenAI trabajó con actores de doblaje profesionales para crear cada una de las voces. Además, usaron su sistema de reconocimiento de voz de código abierto llamado Whisper para transcribir las palabras habladas en texto.

Reconocimiento de imágenes con IA

Esta nueva herramienta permitirá que los usuarios puedan mostrarle a Chat GPT una o más imágenes. Así, por ejemplo, los usuarios podrían mandarle una fotografía del contenido de su refrigerador y el asistente analizara el gráfico para ofrecer ideas de qué podría cocinar con esos ingredientes.

Para indicarle al Chat GPT que se centre en una parte específica de la imagen, los usuarios pueden utilizar la herramienta de dibujo en la aplicación móvil.


Para acceder a esta herramienta selecciona el ícono de de foto para capturar o elegir una imagen. En dispositivos iOS o Android, se debe elegir primero el botón “más”. 

Esta función de reconocimiento de imágenes funciona con GPT-3.5 y GPT-4. Estos modelos de IA aplican sus habilidades de razonamiento lingüístico a una amplia gama de imágenes, como fotografías, capturas de pantalla y documentos que contienen texto e imágenes.

Revisa más noticias sobre ciencia, tecnología e innovación en la Agencia Andina y escucha historias inspiradoras en Andina Podcast.

Más en Andina (FIN) NDP/KCP/SPV

Publicado: 29/9/2023