DeepSeek, la compañía china detrás del modelo de inteligencia artificial gratuito que sacudió al mundo tecnológico, enfrenta una serie de acusaciones negativas, incluido el uso de GPU Nvidia de contrabando para entrenar y ejecutar su modelo de inteligencia artificial homónimo.
En consecuencia, el Departamento de Comercio de EE. UU. está considerando investigar si DeepSeek accedió y recopiló ilegalmente GPU de Nvidia a través de intermediarios en Singapur. En los últimos años, Estados Unidos ha mantenido estrictas restricciones a la exportación de chips avanzados a China, con el objetivo de mantener su posición de liderazgo en tecnología y frenar el rápido desarrollo de su rival.
DeepSeek recientemente fue noticia por el lanzamiento de su modelo de inferencia R1. Se dice que este modelo tiene un rendimiento cercano al modelo o1 de OpenAI, que solo está disponible en el plan de suscripción ChatGPT Pro que requiere una suscripción paga. Lo que hace que DeepSeek sea tan valioso es que no sólo tiene un rendimiento similar, sino que además se publica como código abierto y gratuito para todos. Aquellos que nunca han tenido la oportunidad de experimentar el modelo de inferencia de vanguardia de OpenAI ahora tienen DeepSeek R1 como una alternativa digna.
DeepSeek fue tan popular que la aplicación llegó al puesto número 1 en las listas de la App Store de EE. UU., lo que provocó que el mercado de valores de ese país se desplomara y se perdieran 2 billones de dólares de capitalización de mercado en solo unos días.
Cabe destacar que DeepSeek afirma que hizo todo esto con solo 2.000 GPU Nvidia H800 y unos costos de inversión estimados de 6 millones de dólares, una cantidad pequeña en comparación con las enormes inversiones realizadas en OpenAI y muchos otros modelos de IA similares.
Según Citigroup, gigantes tecnológicos estadounidenses como Microsoft, Meta, Amazon y Alphabet gastaron el año pasado un total de unos 209.000 millones de dólares en infraestructura de datos, de los cuales el 80% se destinó a centros de datos. Esto ha dejado a muchos preguntándose si DeepSeek realmente está haciendo algo diferente a OpenAI y otras empresas de IA de Estados Unidos, y si es realmente posible entrenar modelos de IA con tantos menos recursos.

David Sacks, ex funcionario de inteligencia artificial del presidente Donald Trump, dijo en una entrevista reciente que hay “evidencia sustancial” de que DeepSeek destiló los resultados de OpenAI para entrenar su propio modelo. Este proceso de destilación implica un “modelo hijo” (DeepSeek) que imita el razonamiento del “modelo padre” (OpenAI), de forma similar a cómo aprenden los humanos, al hacer millones de preguntas. Microsoft y OpenAI también han iniciado sus propias investigaciones sobre el asunto, principalmente para aclarar si DeepSeek accedió a los datos de OpenAI de forma inapropiada.
DeepSeek dijo que utiliza el chip H800, un chipset de inteligencia artificial que Nvidia desarrolló específicamente para el mercado chino después de que se impusieran por primera vez los controles de exportación. No está claro cómo DeepSeek adquirió las Nvidia H800, pero la compañía podría comprarlas a fines de 2022 o 2023.
Actualmente no hay evidencia de que DeepSeek utilizara chips de contrabando. Pero se dice que muchas empresas chinas de inteligencia artificial lo han hecho. Se ha detectado un contrabando organizado de chips de inteligencia artificial hacia China en varios países, incluidos Malasia, Singapur y los Emiratos Árabes Unidos.