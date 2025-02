China ha dado un paso significativo en el desarrollo de tecnologías de inteligencia artificial al encontrar una alternativa a los aceleradores de IA “limitados” de NVIDIA.

Según informes recientes, el último proyecto de DeepSeek, denominado FlashMLA, ha logrado multiplicar por ocho los TFLOPS (operaciones de coma flotante por segundo) en comparación con los aceleradores Hopper H800 de NVIDIA.

DeepSeek, una empresa china especializada en inteligencia artificial, ha demostrado que no es necesario depender exclusivamente de mejoras de hardware para alcanzar un rendimiento superior.

A través de su herramienta FlashMLA, la compañía ha logrado optimizar el consumo de memoria y la asignación de recursos en las GPU Hopper H800 de NVIDIA, lo que ha permitido extraer un rendimiento significativamente mayor.

Este enfoque basado en software ha revolucionado la forma en que se utilizan estos aceleradores de IA, especialmente en tareas de inferencia.

🚀 Day 1 of #OpenSourceWeek: FlashMLA

Honored to share FlashMLA – our efficient MLA decoding kernel for Hopper GPUs, optimized for variable-length sequences and now in production.

✅ BF16 support

✅ Paged KV cache (block size 64)

⚡ 3000 GB/s memory-bound & 580 TFLOPS…

— DeepSeek (@deepseek_ai) February 24, 2025