Andina

¿Qué es DeepSeek y cómo usar el modelo de inteligencia artificial que compite con ChatGPT?

Necesitas una cuenta registrada para comenzar a usar el chatbot, cuya plataforma es similar a ChatGPT.

Foto:AFP

Foto:AFP

17:23 | Lima, ene. 29.

DeepSeek V-3 es el nuevo modelo de inteligencia artificial de origen chino que se ha convertido en tendencia global debido a que ha demostrado el mismo potencial (o superior en algunas categorías) que otros como ChatGPT (GPT-4o) de OpenAI o Llama 3.1 de Meta. Descubre cuáles son sus ventajas y coincidencias, y cómo puedes comenzar a usar esta herramienta IA.

Un informe técnico compartido por DeepSeek AI revela que DeepSeek V-3 supera a otros modelos de código abierto y logra un rendimiento comparable al de los principales modelos con código fuente privado. Además, este modelo solo requiere 2.788 millones de horas GPU H800 para su entrenamiento.

En comparación, ChatGPT utiliza la unidad de procesamiento gráfico (GPU) Nvidia H100, que es mucho más potente en ancho de banda y rendimiento que la versión H800, disponible en China debido a las restricciones establecidas por Estados Unidos. 

Aún así, según el informe técnico, el rendimiento de DeepSeek V-3 es superior a ChatGPT en su versión en inglés para aspectos como MMLU Redux, una versión simplificada del benchmark Comprensión Masiva de Lenguaje Multitarea (MMLU en inglés), diseñado para evaluar la capacidad de los modelos de IA para comprender y responder preguntas en una amplia variedad de temas, como humanidades, ciencias, matemáticas y más. Además, incluye preguntas de opción múltiple en más de 50 disciplinas diferentes.

Asimismo, DeepSeek V-3 destaca en DROP (3-shot F1),  "Discrete Reasoning Over Paragraphs" o Razonamiento Discreto sobre Párrafos, que es otro benchmark que evalúa la capacidad de un modelo para responder preguntas basadas en la comprensión de textos largos y para realizar razonamientos discretos (como sumas, restas o comparaciones).  Este modelo recibe tres ejemplos o shots tanto de preguntas como respuestas y luego se enfrenta a nuevas preguntas.  Además, la métrica F1 combina precisión (cuántas respuestas son correctas) y recuperación (cuántas respuestas correctas fueron identificadas).  

La ventaja más evidente del modelo chino está en su idioma original, así como en las métricas de código y matemáticas donde casi todos los indicadores son superiores a GPT-4o. 

Sin embargo, ChatGPT tiene mejor desempeño en inglés para rubros como SimpleAQ, "Simple Answer Quality" o  Calidad de Respuesta Simple), una métrica o enfoque utilizado para evaluar la calidad de las respuestas generadas por modelos de IA en tareas de preguntas y respuestas (QA, por sus siglas en inglés). Se centra en respuestas cortas y directas, en lugar de respuestas largas o elaboradas.

De igual manera, en FRAMES, que se utiliza para entrenar y evaluar modelos en tareas de diálogo conversacional, con un enfoque en la resolución de problemas y la coherencia en interacciones complejas.

Lo cierto es que GPT-4o no es el único modelo IA facilitado por Open AI, ya que también cuenta con versiones especializadas, que no forman parte del estudio técnico. Asimismo, DeepSeek R-1 es el modelo especializado de IA de la compañía china. 

¿DeepSeek es el mejor modelo IA gratuito?

De acuerdo con el informe técnico, DeepSeek IA requirió una inversión de 5,576 millones de dólares para su entrenamiento, una cifra considerablemente inferior a los miles de millones que la competencia ha destinado a estos modelos de IA. 

Al respecto, Edwin Huaynate, docente de la Universidad de Lima, subraya que esta eficiencia en el uso de recursos representa un cambio disruptivo que podría democratizar el acceso a la IA, además de permitir a más organizaciones y regiones experimentar y personalizar esta tecnología según sus necesidades.

Al ser un modelo de código abierto, DeepSeek también ofrece a las empresas la posibilidad de adaptar y mejorar el sistema de manera flexible, algo que contrasta con las restricciones impuestas por las licencias de muchas IA occidentales. “Esto podría impulsar una ola de innovación en sectores que antes no podían permitirse adoptar estas tecnologías”, asegura Huaynate.

Para esto, las empresas pueden usar DeepSeek R-1 revisando los documentos técnicos que están colgados en GitHub. Además, el modelo DeepSeek V-3 está disponible gratuitamente con una cuenta registrada. 

Incluso, debido a su popularidad, AMD publicó en su blog un tutorial para ejecutar los modelos Reasoning DeepSeek R1 Distilled en procesadores AMD Ryzen™ AI y tarjetas gráficas Radeon™. Los modelos de razonamiento son una nueva clase de modelos de lenguaje (LLMs), diseñados para abordar tareas altamente complejas mediante la inferencia de cadena de pensamientos (CoT).

Según la compañía, "implementar estos modelos DeepSeek R1 optimizados en procesadores AMD Ryzen™ AI y tarjetas gráficas Radeon™ es muy sencillo y ya está disponible a través de LM Studio".

Por otro lado, el modelo chino tiene datos de entrenamiento hasta julio de 2023, mientras que ChatGPT -en su versión gratuita- cuenta con datos hasta abril de 2023. Además, DeepSeek puede incluir respuestas basadas en contenido en tiempo real, sin costo adicional, a diferencia del modelo de Open AI.

A inicios de esta semana, el modelo chino ya ha generado efectos en el mercado, como la caída de más de 600 000 millones de dólares del valor total de mercado de la empresa Nvidia, una de las mayores productoras de chips especializados en el mundo, y el retroceso del índice Nasdaq en un 3,07 %, es decir, una disminución en el valor promedio de las acciones de las principales empresas tecnológicas que cotizan en este mercado. Todo en cuestión de horas.  Lo cierto es que la empresa también se va recuperando.

¿Cómo usar DeepSeek gratis?

Para usar el modelo de IA DeepSeek como chatbot solo necesitas ingresar a la web oficial de DeepSeek o instalar la aplicación en Google Play. Posteriormente, podrás registrarte con un email o ingresar con tu cuenta de Google. 

Como observación, debido a su éxito reciente, la plataforma presenta lentitud en ocasiones, así como restricciones de creación de nuevas cuentas en momentos de alto tráfico de uso.

Con tu cuenta creada podrás ingresar una consulta o petición, al estilo de ChatGPT. Por ejemplo, puedes preguntarle sobre las diferencias de ambos modelos de IA o incluso pedirle que haga una tabla que incluya sus diferencias y coincidencias. 

Los usuarios pueden escribir en español para recibir las respuestas en el mismo idioma. 



Revisa más noticias sobre ciencia, tecnología e innovación en la Agencia Andina y escucha historias inspiradoras en Andina Podcast.

Más en Andina: (FIN) SPV
JRA

Publicado: 29/1/2025