loader image

 

El desafío DeepSeek

 

La contingencia domina el campo de las nuevas tecnologías. Apenas unos días antes que DeepSeek alcanzara un interés mundial, la industria estadounidense de IA se consideraba líder global de ese sector, pero eso quedó en entredicho al comprobar que DeepSeek logró un LLM potente que compite, e incluso supera, al más desarrollado de OpenAI (el 4º de GPT). Comento a continuación algunos aspectos que quiero destacan sobre este barullo de DeepSeek:

1. Inmediatamente después de que las descargas de DeepSeek se masificaron, surgieron exclamaciones de admiración porque China muestra tal capacidad, por encontrar la manera de construir modelos competentes con pocos recursos; después vinieron los cuestionamientos y ataques.

Las restricciones estadounidenses a la exportación de chips obligaron a los desarrolladores de DeepSeek a conformar algoritmos potentes, inteligentes y eficientes energéticamente para compensar su falta de potencia de cálculo. Se dice que ChatGPT requiere 10.000 GPU de Nvidia para procesar los datos de entrenamiento; los ingenieros de DeepSeek afirman haber conseguido resultados similares con sólo 2.000 GPU. Se destacó que había dado paso a un modelo con capacidades superiores en algunos aspectos a los de las IA estadounidenses, con una inversión —de acuerdo con las fuentes chinas— que no llegó a los 6 millones de dólares, muy inferior a los miles de millones que están detrás de los modelos estadounidenses.

2. Después de la consternación se pasó a los cuestionamientos: que DeepSeek violenta la privacidad y que cualquier pregunta y dato generado en esa IA se almacena en servidores chinos. No olvidemos que DeepSeek, al igual que otros servicios, requiere datos de usuario, que probablemente se almacenan en servidores en China, como los de las empresas de Estados Unidos se resguardan fundamentalmente en servidores que están en dicha nación. Ahora bien, en un caso el almacenamiento de datos privados puede ser accesible por el gobierno, el chino, en el otro en servidores de empresa como Meta, Alphabet o OpenAI, pero sin garantía plena de cómo se usan. La ética en ambos casos no es algo que cultiven mucho.

3. Se dice que DeepSeek no es resultado de la inversión y del esfuerzo del capital privado sino de la inversión pública. Aunque eso no está completamente claro, pero sería ingenuo pensar que detrás de esa IA esté sólo una inversión privada. Para nadie es un secreto que el gobierno chino es el financiador principal de su tecnología de punta; su líder máximo, Xi Jinping, expresó hace algunos años su intención de convertir a China en líder en IA para 2030 —de hecho existe un programa—, lo cual implica que al existir una estrategia nacional para alcanzar ese liderazgo se apoye con dinero público a empresas en IA.

Tal vez lo malo no es que sean recursos públicos, ya que como bien dice Mariana Mazzucato el Estados también crea mercado con sus inversiones científicas y tecnológicas. Lo cuestionable detrás de la inversión china es que la haga un gobierno no democrático que no respeta los derechos humanos. Para ubicar lo que priva en China, las maneras poco claras en que se manejan las cosas, de su poca transparencia, y que por ahora es más preocupantes que la discusión que se da en torno a la IA, traigo a colación un ejemplo: en 2018 cuando se difundió que un científico chino, He Jiankui, había modificado genéticamente a dos niñas (Lulu y Nana); Jiankui uso la revolucionaria técnica de edición genética CRISPR-Cas9 para modificar el gen CCR5, con el objetivo de que las niñas fueran resistentes al virus del VIH. Eso despertó indignación, controversia y una profunda preocupación a escala internacional. Se dijo que el gobierno chino envió a prisión al científico, que lo suspendió para ejercer su profesión de por vida. Pero como eso se maneja en la secrecía, en realidad no se sabe qué pasó, pero tampoco se tiene información de lo acontecido con las niñas, en qué situación se encuentran o si tuvieron mutaciones genéticas. Entonces no podemos pedir que las empresas chinas vayan a contrapelo de las políticas gubernamentales y por ello no esperemos que DeepSeek ofrezca respuestas críticas a preguntas sobre la situación que prevalece en China en materia de derechos humanos y en su sistema político.

El auge de DeepSeek deja lecciones para estos tiempos que Estados Unidos pone en marcha esquemas proteccionistas. Si Estados Unidos considera que una vía eficaz para frenar el avance de los asiáticos es prohibir la exportación y/o venta de chips de alta gama a China, está equivocado. En China ya se trabaja desde hace años con LLMs, pero hoy DeepSeek a pesar de haber surgido recientemente ya se compara con otras empresas líderes en el campo de la IA, como OpenAI y Google. Para los asiáticos no importa si se copia ya que se trata de superar lo copiado, tal como lo decían desde los años ochenta en La Quinta Generación Edward Feigenbaum y Pamela McCorduck. El problema es rasgarse las vestiduras, decir que China robó propiedad intelectual de OpenAI, obvia que Sam Altman enfrenta la misma acusación en Estados Unidos, de que sus modelos de entrenamiento usan millones de artículos protegidos por derechos de autor.

Lo interesante es que las empresas chinas erosionan, o al menos cuestionan, el modelo de IA de los titanes estadounidenses. DeepSeek ha optado porque la mayor parte de su DeepSeek-R1 esté disponible de manera gratuita, que sea de código abierto. Eso significa que cualquier desarrollador o programador puede acceder al código y usarlo para personalizar el LLM. Aunque los datos de entrenamiento están protegidos, y que se cuestionan porque se dice que fueron tomados de OpenAI. La gratuidad sirve para mostrar músculo, de poner en predicamento el modelo de IA Estadounidense, demostrar que China está a la vanguardia como ya lo evidencian libros como AI 2041 de Kai-Fu Lee y At the Speed of Irrelevance de Al Naqvi y Mani Janakiram. Por tanto, DeepSeek hará que los titanes de la IA de Estados Unidos cambien sus políticas.

Hoy estamos, pues, viviendo un capítulo más de una disputa geopolítica, de una confrontación entre modelos que luchan por la hegemonía, en donde el desarrollo tanto de la ciencia como de tecnologías, contribuirán a trazar las posiciones de liderazgo, de dominación económica y política a escala planetaria. DeepSeek, es la evidencia de que no existe una única ruta para alcanzar la conformación de lenguajes de Deep Learning potentes; ha revocado el credo de que para desarrollar un LLM robusto es necesario contar únicamente con chips de gama alta, ya que ha demostrado que una combinación de chips de gama alta y baja son suficientes, que la clave es contar con el diseño de algoritmos de alta calidad, al grado que eso le ha valido desafiar el dominio de gigantes como OpenAI, Alphabet/Google y Meta.

@tulios41

Antulio Sánchez