ChatGPT está llevando a otro nivel su tecnología basada en inteligencia artificial y apunta a convertirse en un asistente virtual. OpenAI anunció una nueva actualización que permitirá que este popular chatbot conversacional pueda “ver, oír y hablar”.
Con estas nuevas funciones y una interfaz renovada, los usuarios podrán tener
conversaciones habladas y enviarle fotografías a ChatGPT.
La compañía anunció que el reconocimiento de voz e imágenes para
ChatGPT estará disponible para usuarios que paguen el s
ervicio Plus y Enterprise durante las próximas dos semanas. Pronto la compañía evalúa ampliar el acceso a otros grupos de usuarios.
Ahora podrás hablar con ChatGPT
La nueva actualización de Chat GPT permitirá usar la voz para tener una conversación con este asistente.Por ejemplo, un usuario podría pedirle que le narre un cuento para dormir o podría entablar un diálogo sobre un tema de su interés.
Para activar esta herramienta en la aplicación móvil de
Chat GPT, ve al menú de Configuración, haz clic en
“Nuevas funciones” y selecciona las conversaciones con voz. Luego, ve al ícono de auriculares ubicado en la esquina superior derecha de la pantalla de inicio y selecciona tu voz preferida dentro de las cinco alternativas.
Esta nueva funcionalidad de voz está impulsada por un nuevo modelo de conversión de texto a voz, que tiene la capacidad generar audio similar al humano a partir de solo texto y unos pocos segundos de muestra de voz.
OpenAI trabajó con actores de doblaje profesionales para crear cada una de las voces. Además, usaron su sistema de reconocimiento de voz de código abierto llamado Whisper para transcribir las palabras habladas en texto.
Reconocimiento de imágenes con IA
Esta nueva herramienta permitirá que los usuarios puedan mostrarle a Chat GPT una o más imágenes. Así, por ejemplo, los usuarios podrían mandarle una fotografía del contenido de su refrigerador y el asistente analizara el gráfico para ofrecer ideas de qué podría cocinar con esos ingredientes.
Para indicarle al Chat GPT que se centre en una parte específica de la imagen, los usuarios pueden utilizar la herramienta de dibujo en la aplicación móvil.
Para acceder a esta herramienta selecciona el ícono de de foto para capturar o elegir una imagen. En dispositivos iOS o Android, se debe elegir primero el botón “más”.
Esta función de reconocimiento de imágenes funciona con GPT-3.5 y GPT-4. Estos modelos de IA aplican sus habilidades de razonamiento lingüístico a una amplia gama de imágenes, como fotografías, capturas de pantalla y documentos que contienen texto e imágenes.
Más en Andina (FIN) NDP/KCP/SPV
Publicado: 29/9/2023