Deepseek

Qué es Deepseek, la IA china que ha sacudido las bolsas y ha provocado que Nvidia pierda 400.000 millones de dólares

Se trata de un asistente de IA que ocupa la primera posición en la tienda de Apple en Estados Unidos, por delante de ChatGPT.

Imagen de archivo de la aplicación de Deepseek

Deepseek es la última alternativa para el desarrollo de la Inteligencia Artificial (IA). Llegó a App Store el pasado 11 de enero y desde entonces ha escalado hasta llegar a la primera posición. Lidera las listas de descargas gracias a una innovadora apuesta por el código abierto, bajos costes y eficiencia. Se trata de una irrupción inesperada que podría desafiar a los modelos estadounidenses.

Esta IA, de firma china, puede responder preguntas en un formato conversacional, puede navegar por la web para ofrecer respuestas actualizadas, resumir documentos de texto de manera rápida y utilizar el razonamiento para resolver problemas complejos. DeepSeek-R1 se ha situado en el primer puesto en las listas de descargas gratuitas de la tienda de aplicaciones móviles App Store tanto en China como en Estados Unidos, superando al popular ChatGPT.

¿Qué es Deepseek?

El modelo que se está descargando de esta IA es el R1. Según los expertos es comparable con el o1 de OpenAI, la firma creadora del ChatGPT. En su base se encuentra el modelo DeepSeek V3, que se lanzó en diciembre. Este ha sido entrenado con 671.000 millones de parámetros con arquitectura Mixture of Experts (MoE), que divide un modelo de IA en pequeñas redes neuronales para que actúen de forma separada como si fueran distintos expertos.

Deepseek está respaldada por la empresa de inversión Huanfang Quant. Su modelo es de código abierto, con lo que cualquiera puede examinarlo, modificarlo y desarrollarlo en función de sus necesidades. Se trata de algo que ha generado un gran impacto en la comunidad de desarrolladores.

Su lanzamiento se produce en el tiempo en que el presidente estadounidense, Donald Trump, anunciaba el proyecto Stargate, que invertirá 500.000 millones de dólares en los próximos cuatro años para construir nuevos centros de datos para apoyar proyectos de IA. Además, llega en el momento en que Washington ha impuesto restricciones a la exportación a China de chips de alto rendimiento.

Según la empresa china, su modelo fue entrenado durante 55 días con un presupuesto de 5,57 millones de dólares utilizando procesadores gráficos H800 de Nvidia, una versión de capacidad reducida diseñada para el mercado chino. Este costo representa menos de una décima parte del gasto en el entrenamiento del modelo 4o de OpenAI, según The Paper.

La compañía tecnológica ha empleado 14,8 billones de tokens "diversos y de alta calidad" junto con un ajuste supervisado y aprendizaje de refuerzo por fases. Aseguran, además, que cada token ha requerido para su entrenamiento 3,7 días con 2.048 GPU Nvidia H800, lo que hace que el entrenamiento total alcance los 2,788 millones de horas de GPU y un coste total de 5,576 millones de dólares.

Además, Deepseek señala que su R1 utiliza técnicas avanzadas de aprendizaje automático, lo que le permite "mejorar notablemente" su capacidad para realizar tareas complejas con menos datos previos.

¿Qué es Nvidia y por qué tambalea su liderazgo?

La irrupción de Deepseek ha hecho tambalear el liderazgo de empresas estadounidenses como Nvidia, cuyas acciones se hunden más del 12% en bolsa antes de la apertura de Wall Street. Las fuertes pérdidas que registran las empresas relacionadas con este sector llevan al tecnológico Nasdaq a caer a media sesión hasta el 3,3%.

En la Bolsa de Nueva York, el Nasdaq era el indicador más perjudicado, seguido por el S&P 500, que bajaba un 1,9% y el Dow Jones de Industriales, que cedía solo un 0,15%.

La competencia de Deepseek en el mercado estadounidense afecta, sobre todo, a Nvidia, líder de la IA en Estados Unidos y una de las mayores beneficiadas en bolsa de los últimos años, que borraba unos 400.000 millones de dólares de valor.

Nvidia se enfrenta a una amenaza inesperada con la llegada de Deepseek. Desde que se fundó en 1993, ha liderado el desarrollo de unidades de procesamiento gráfico (GPU) fundamentales para la creación de videojuegos, inteligencia artificial, procesamiento de datos y, más recientemente, tecnologías relacionadas con la conducción autónoma y el metaverso.

Síguenos en nuestro canal de WhatsApp y no te pierdas la última hora y toda la actualidad de antena3noticias.com