21 de enero, noticias: según informa Wedoany, DeepSeek planea lanzar a mediados de febrero de este año, durante el Año Nuevo Lunar, su nueva generación de modelo insignia de IA, DeepSeek V4. Este modelo incorporará una nueva arquitectura tecnológica, y se espera que su capacidad para escribir código mejore significativamente, lo que ha generado una amplia atención en la industria.

El 20 de enero, coincidiendo con el primer aniversario del lanzamiento del modelo DeepSeek-R1, algunos desarrolladores descubrieron en la plataforma GitHub que DeepSeek había actualizado una serie de códigos relacionados con FlashMLA. Entre los 114 archivos involucrados, en 28 lugares se mencionaba explícitamente un identificador de modelo grande desconocido llamado "MODEL1", y este identificador se citaba junto o en contraste con el modelo existente "V32" (es decir, DeepSeek-V3.2). Analizando el contexto del código, expertos técnicos especulan que "MODEL1" probablemente corresponda a un modelo de IA que utiliza una arquitectura completamente nueva, cuyas características técnicas clave difieren notablemente de los modelos actuales.
En concreto, la nueva arquitectura ha optimizado y ajustado aspectos tecnológicos clave como la disposición de la caché de clave-valor (KV), el manejo de la dispersión y el soporte de decodificación en formato de datos FP8. Estas innovaciones técnicas abordan específicamente problemas de uso de memoria y eficiencia computacional durante la ejecución del modelo, sentando las bases para mejorar su rendimiento.
Vale la pena destacar que el equipo de investigación de DeepSeek ya había publicado previamente dos artículos técnicos consecutivos, proponiendo respectivamente un método de entrenamiento innovador de "conexiones residuales optimizadas (mHC)" y un "módulo de memoria de IA (Engram)" inspirado en la biología. En la industria se especula ampliamente que el próximo DeepSeek V4 probablemente integrará estos últimos avances de investigación, liberando aún más el potencial de los modelos de IA en el manejo de tareas complejas.









