Andina

Eva, el bot creado por peruanos que transcribe y resume los audios de WhatsApp

Con inteligencia artificial genera transcripciones, resúmenes o responde preguntas de los audios

En su primera semana de lanzamiento, logró más de 1000 usuarios activos y ahora cuentan con más de 1500 usuarios únicos.

20:50 | Lima, abr. 24.

EVA (enhanced voice assistant) es el primer bot en Latinoamérica, creado por la startup peruana Curador, que se sirve de la inteligencia artificial para procesar audios y mensajes de voz a través de WhatsApp, y genera transcripciones, resúmenes o responde preguntas sobre estos.

Se trata de un asistente virtual diseñado para ahorrarnos tiempo con los mensajes de voz. Por ejemplo, si estás en una reunión o realizando una actividad y no puedes escuchar el audio, entonces puedes usar el bot EVA para que realice la transcripción o resuma los audios.

¿Cómo usarlo?

Su uso es muy fácil, el primer paso es agregar a Eva a WhatsApp, como si se tratara de cualquier otro contacto. El usuario solamente tiene que enviar un audio a EVA y enseguida seleccionar entre las alternativas “transcribir”, “generar un resumen” o “responder una pregunta”, según la acción que quiera que realice.  Para llevar a cabo estas tareas, el bot se apoya en el modelo GPT-4 de Open AI. y para empezar a usarlo ingresa aquí 


“Lo que hace EVA es, una vez que recibe un mensaje de voz por WhatsApp, utiliza los servicios de OpenAI para transcribir los mensajes, generar un resumen o responder preguntas dentro del contexto del audio y luego reenvía esa información a WhatsApp (Meta) para que la muestre como un mensaje al usuario en la misma conversación de WhatsApp”, señala a la Agencia Andina, Christian Pasquel, CTO de la startup Curador.

Lee también Dall-E y Midjourney, las plataformas para crear imágenes con inteligencia artificial

Otro trabajo de EVA es hacer toda esta mediación de información de manera rápida, manteniendo una buena experiencia de usuario. Cuando EVA está enviando la información a OpenAI, WhatsApp le da un límite de tiempo (en segundos) para responder. Eso limita, por ejemplo, la duración máxima de los mensajes de voz que se pueden procesar por el momento. 

Una razón es porque los servidores de OpenAI se congestionan ya que la cantidad de sus usuarios superan los 100 millones en todo el mundo. Para ello, EVA también intenta optimizar la cantidad de data que se le envía a GPT-4 para lograr agilizar el proceso.

¿Por qué usar Whatsapp?


Por su parte, Santiago Tapia, CEO de Curador, precisa que hacerlo a través de WhatsApp no es casualidad: “WhatsApp es la aplicación más usada en Latinoamérica ¿Para qué pedirles a los usuarios que vayan a una página web a interactuar con una interfaz que no conocen o a bajarse una app específica, si pueden hacerlo desde una aplicación con la que ya están familiarizados?”

EVA en su versión actual (0.3 en producción y 0.4 en pre-lanzamiento) puede transcribir audios, resumir audios y responder preguntas en el contexto del audio. Adicionalmente, el bot ya puede procesar audios en inglés, portugués y alemán (a través de un mensaje de voz especial que desbloquea estas opciones).

Respondiendo preguntas

Christian Pasquel, CTO de la startup Curador, señala que una parte importante es poder hacerle preguntas acerca del audio. Por ejemplo, yo se que mi mamá quiere que compre productos en el supermercado, pero no quiero ni escuchar todo el audio para saber qué quiere, ni leer toda la transcripción. Entonces, le pregunto a EVA: ¿Me haces por favor una lista de lo que tengo que comprar en el supermercado? Y EVA me va a listar exactamente eso, omitiendo todo el contenido extra del mensaje de voz.

Hay otras cosas interesantes que se pueden hacer con las preguntas. Por ejemplo, sin escuchar el audio yo le puedo preguntar a EVA ¿Hay algo urgente en el mensaje? o ¿La persona necesita ayuda? Y si efectivamente el mensaje de audio incluye algo que indique eso, es muy probable que EVA me responda mi pregunta y me ayude a priorizar el mensaje.

Lee también Así puedes usar ChatGPT como asistente IA para personas con discapacidad

Planes a futuro

Christian Pasquel, CTO de la startup Curador, explica que a futuro están desarrollando una aplicación de EVA que responde a la necesidad que tenemos de ordenar nuestras ideas.

“Al trabajar con tantas personas creativas, un problema que se genera es que a veces sobran las ideas y no siempre hay tiempo para procesarlas y discutirlas todas durante un día típico. Entonces, con esta funcionalidad interna de EVA lo que hacemos es enviar nuestras lluvias de ideas a EVA y ella se encarga de clasificarlas, transcribirlas y resumirlas en un documento para que nos sea más fácil decidir en cuáles ideas nos enfocamos. En una siguiente versión, EVA también se encargará de sugerir acciones sobre esas ideas y priorizarlas”, precisa.

¿Están protegidas nuestras conversaciones?

Pasquel enfatiza que EVA actúa únicamente de mediadora entre WhatsApp y OpenAI y los archivos de audio que recibe de los usuarios no son almacenados en los servidores.

Solo se almacenan métricas de uso de EVA, como por ejemplo la cantidad de personas que piden una transcripción o un resumen, interacciones por día, por hora, etc. Tampoco se hace análisis de datos del contenido de las conversaciones ni se asocian con ninguna persona. Nuestros servidores procesan la información de manera encriptada y las personas del equipo no tienen acceso a ella. Cuando las personas envían un mensaje de audio o texto a WhatsApp, Instagram, Messenger, Meta (Facebook) están almacenando toda esa información y utilizándola, entre otras cosas, para vender publicidad. Nosotros no hacemos eso. Las métricas que almacenamos las utilizamos para mejorar el producto”, concluye.

Revisa más noticias sobre ciencia, tecnología e innovación en la Agencia Andina y escucha historias inspiradoras en Andina Podcast.

Más en Andina:
(FIN) MFA

Publicado: 24/4/2023