DeepSeek: el modelo chino que desafía a Silicon Valley con código abierto y bajo costo
DeepSeek ha sacudido el mundo de la inteligencia artificial al demostrar que se pueden construir modelos de clase mundial con una fracción del presupuesto de OpenAI o Google. Su apuesta por el código abierto y la eficiencia técnica está reconfigurando el mapa geopolítico de la IA.
Cuando DeepSeek lanzó su modelo V3 a finales de 2024, pocos fuera de los círculos especializados le prestaron atención. Un año y medio después, el panorama es radicalmente distinto. La startup china —respaldada por el fondo cuantitativo High-Flyer— ha logrado lo que muchos consideraban improbable: construir modelos de lenguaje que compiten con GPT-4 y Claude, con presupuestos de entrenamiento diez veces menores y con licencias de código abierto.
El impacto ha sido tan fuerte que, en enero de 2026, el lanzamiento de DeepSeek R1 provocó una caída temporal de casi seiscientos mil millones de dólares en la capitalización bursátil de Nvidia, al cuestionar la narrativa de que solo con inversiones masivas en hardware se puede liderar la carrera de la inteligencia artificial.
La clave técnica de DeepSeek reside en lo que los ingenieros llaman “mezcla de expertos”. En lugar de activar todos los parámetros del modelo para cada consulta —como hace un modelo denso tradicional—, DeepSeek activa solo los módulos relevantes. Esta arquitectura, combinada con innovaciones como la atención multinivel y compresión de contexto, permite que modelos de cientos de miles de millones de parámetros se ejecuten con costos computacionales equivalentes a modelos mucho más pequeños.
El resultado más tangible: DeepSeek cobra aproximadamente dos centavos de dólar por millón de tokens de entrada, mientras que GPT-4 cuesta más de un dólar. Para empresas latinoamericanas con presupuestos ajustados, esto puede representar la diferencia entre usar IA de punta o quedarse fuera.
La decisión de liberar los pesos de los modelos bajo licencias permisivas —MIT para algunos, licencias propias restrictivas para otros— ha sido un movimiento estratégico calculado. Por un lado, fomenta la adopción masiva en mercados emergentes y entre desarrolladores independientes. Por otro, construye un ecosistema que depende parcialmente de tecnología china, con todo lo que eso implica en términos geopolíticos.
Las reacciones en Occidente no se han hecho esperar. Estados Unidos ha intensificado los controles de exportación de chips avanzados a China, argumentando que DeepSeek podría haberse beneficiado de hardware adquirido antes de las restricciones. La Unión Europea analiza si los términos de uso de DeepSeek cumplen con el Reglamento General de Protección de Datos, especialmente en lo que respecta al almacenamiento de datos de usuarios europeos en servidores chinos.
Para las empresas y desarrolladores en México, DeepSeek representa una oportunidad y una disyuntiva. Por costo y rendimiento, es una opción atractiva para tareas como generación de contenido, análisis de documentos o chatbots de atención al cliente. Sin embargo, la incertidumbre regulatoria y las preocupaciones sobre privacidad de datos obligan a evaluar cuidadosamente qué tipo de información se procesa con estos modelos.
Lo cierto es que DeepSeek ha cambiado irreversiblemente la conversación. Ya no se trata de si China puede competir en IA, sino de cómo la eficiencia técnica y el código abierto pueden nivelar un campo de juego que parecía dominado por quienes tienen los bolsillos más profundos. La era de la inteligencia artificial de bajo costo ha comenzado, y sus ondas expansivas apenas empiezan a sentirse en América Latina.