DeepSeek AI: qué es y por qué compite con ChatGPT

DeepSeek desarrolla modelos de inteligencia artificial de código abierto con costes de API significativamente inferiores a los de la competencia, desafiando la idea de que la IA de vanguardia requiere inversiones multimillonarias.

DeepSeek es una startup china de inteligencia artificial que en poco más de dos años ha pasado de ser una empresa desconocida a competir directamente con los gigantes occidentales del sector. Desarrollada por High-Flyer Quant, un fondo de inversión cuantitativo con sede en Hangzhou, la plataforma se ha destacado por ofrecer modelos de lenguaje de alto rendimiento a una fracción del coste de sus rivales.

El ecosistema de DeepSeek incluye desde asistentes de chat gratuitos hasta modelos de código abierto bajo licencia MIT, lo que permite a empresas y desarrolladores descargarlos, modificarlos y desplegarlos en sus propios servidores sin restricciones comerciales. Esta apertura contrasta con el enfoque cerrado de competidores como OpenAI o Anthropic, y ha sido clave para su rápida adopción en comunidades técnicas de todo el mundo.

Los modelos V4-Pro y V4-Flash

En abril de 2026, DeepSeek presentó oficialmente su nueva generación de modelos: V4-Pro y V4-Flash. Ambos representan un salto significativo respecto a la anterior generación V3.2, especialmente en capacidad de contexto, eficiencia de costes y modos de razonamiento.

DeepSeek-V4-Pro es el modelo insignia de la compañía. Cuenta con 1,6 billones de parámetros totales, de los cuales se activan aproximadamente 49.000 millones por cada token procesado. Esta arquitectura Mixture-of-Experts (MoE) permite mantener un alto nivel de capacidad sin disparar los costes computacionales. Según la documentación oficial, el modelo ofrece una ventana de contexto de un millón de tokens para entrada y hasta 384.000 tokens para salida, lo que equivale a procesar documentos de aproximadamente 2.500 páginas en una sola consulta.

El modelo incorpora tres modos de pensamiento integrados: Non-Thinking para respuestas rápidas, Think High para análisis profundo y Think Max para razonamiento máximo con autoverificación. En evaluaciones de programación, ha alcanzado un percentil Codeforces del 51,6%, superando a modelos como Claude-3.5-Sonnet (20,3%) y GPT-4o (23,6%).

DeepSeek-V4-Flash, por su parte, se posiciona como la opción rápida y económica. Con 284.000 millones de parámetros y 13.000 millones activos, mantiene la misma ventana de contexto de un millón de tokens pero a un coste aproximadamente doce veces inferior al de la versión Pro. La compañía indica que está orientado a tareas en streaming, chatbots masivos y procesamiento de documentos a gran escala.

Comparativa de costes y acceso

Uno de los argumentos más sólidos de DeepSeek frente a la competencia es su política de precios. Según los datos publicados en su documentación oficial, el modelo V4-Flash tiene un coste de 0,14 dólares por millón de tokens de entrada y 0,28 dólares por millón de salida. En contraste, modelos comparables de la competencia occidental pueden costar entre 5 y 25 dólares por millón de tokens, dependiendo del proveedor y la tarea.

La versión V4-Pro opera con dos tarifas: una promocional con descuento del 75% vigente hasta el 31 de mayo de 2026, y una tarifa estándar que se aplicará a partir de esa fecha. Los precios promocionales son de 0,44 dólares por millón de entrada y 0,87 por millón de salida.

Además del acceso mediante API, DeepSeek mantiene una interfaz web gratuita en chat.deepseek.com que incluye el modo de razonamiento profundo sin coste para el usuario. La plataforma es accesible desde España y Latinoamérica sin necesidad de herramientas adicionales.

Cambios en la API y compatibilidad

La documentación oficial de DeepSeek anunció en abril de 2026 que los identificadores heredados deepseek-chat y deepseek-reasoner serán descontinuados el 24 de julio de 2026. Durante el período de transición, estos nombres redirigen respectivamente al modo no-thinking y al modo thinking de V4-Flash. Los desarrolladores que utilicen la API deberán actualizar sus integraciones para usar los nuevos identificadores deepseek-v4-pro o deepseek-v4-flash.

Un aspecto relevante para el ecosistema de desarrolladores es que DeepSeek mantiene compatibilidad con los formatos de API de OpenAI y Anthropic, lo que facilita la migración de aplicaciones ya existentes sin reescribir la lógica de integración.

Limitaciones y consideraciones

A pesar de sus fortalezas, DeepSeek presenta limitaciones que conviene tener en cuenta. El modelo principal V4 es textual; la multimodalidad se gestiona a través de herramientas separadas como Janus-Pro-7B para generación de imágenes, que opera a una resolución limitada de 384×384 píxeles. Los competidores occidentales ofrecen integración multimodal nativa con resoluciones superiores.

En materia de seguridad de contenido, los filtros de DeepSeek han sido calificados como más permisivos que los de ChatGPT o Claude, lo que puede resultar en una mayor facilidad para generar respuestas no deseadas. Adicionalmente, al tratarse de una empresa con sede en China, algunas organizaciones pueden tener preocupaciones sobre la protección de datos. La licencia MIT y la posibilidad de despliegue on-premise mitigan este riesgo para empresas que necesiten cumplir con regulaciones como el RGPD en la Unión Europea.

Por último, la estabilidad del servicio de API puede verse afectada durante horas punta, con retrasos y rechazos ocasionales. Para entornos de producción críticos, la documentación oficial recomienda considerar proveedores proxy como DeepInfra, Together.ai o OpenRouter.

Contexto en el mercado de IA

El ascenso de DeepSeek se enmarca en una tendencia más amplia del sector: la demostración de que los modelos de inteligencia artificial de alto rendimiento pueden desarrollarse con presupuestos de entrenamiento significativamente menores a los de los laboratorios estadounidenses. Este enfoque ha obligado a la competencia a revisar sus estrategias de precios y eficiencia.

La compañía también ha estado en el centro de controversias. En febrero de 2026, Anthropic acusó a DeepSeek de utilizar miles de cuentas fraudulentas para generar millones de conversaciones con Claude con el fin de entrenar sus propios modelos. Esta acusación, reportada por The New York Times, no ha sido confirmada ni desmentida oficialmente por DeepSeek, y añade una capa de tensión geopolítica y ética al debate sobre el desarrollo de la IA. Hasta la fecha, no hay consecuencias legales conocidas derivadas de esta denuncia.

¿Para quién es DeepSeek?

La plataforma resulta especialmente atractiva para tres perfiles de usuario. Los desarrolladores y equipos técnicos pueden beneficiarse de los modelos de código abierto bajo licencia MIT, que permiten despliegue local sin costes de API recurrentes ni dependencia de servicios externos. Las empresas con presupuestos ajustados encuentran en la API de DeepSeek una alternativa económica para integrar capacidades de lenguaje en sus productos, con costes que pueden representar entre un 5% y un 10% de los de proveedores occidentales para tareas de volumen elevado.

Para los usuarios individuales, la interfaz web gratuita ofrece acceso a razonamiento profundo sin registro de pago, aunque con limitaciones de uso en horas punta. No obstante, quienes requieran integración multimodal nativa, cumplimiento estricto de filtros de seguridad o estabilidad garantizada en entornos de producción críticos probablemente deberán considerar alternativas como Claude 4.5 o GPT-5.

Tecnología