DeepSeek-Coder-V2 Lite (16B) tiene 16 mil millones de parámetros. Con cuantización estándar de 4 bits y 8K de contexto, necesita aproximadamente 12.7 GB de VRAM — pesos más caché y sobrecarga del runtime.

VRAM por cuantización

PrecisiónPesosCaché/BúferVRAM total
2-bit (IQ2_XXS)5.1 GB1.9 GB9.0 GB
4-bit (Q4_K_M)8.8 GB1.9 GB12.7 GB
8-bit (Q8_0)16.8 GB1.9 GB20.7 GB
16-bit (FP16)32.0 GB1.9 GB35.9 GB

¿Qué GPU puede ejecutar DeepSeek-Coder-V2 Lite (16B) (a 4 bits)?

Clase de GPUVRAMDeepSeek-Coder-V2 Lite (16B) (12.7 GB)
8 GB · RTX 5060 / 40608 GBNo cabe
12 GB · RTX 5070 / 306012 GBJusto
16 GB · RTX 5070 Ti / 408016 GBSí cabe
24 GB · RTX 4090 / 309024 GBSí cabe
32 GB · RTX 509032 GBSí cabe
48 GB · 2×24 / RTX 6000 Ada48 GBSí cabe
128 GB · M-series / RTX Spark128 GBSí cabe
Obtén el número exacto para tu equipo
Elige tu modelo, cuantización y longitud de contexto — la calculadora muestra toda la matemática de VRAM y te dice exactamente qué hardware encaja.
Abrir la calculadora de IA local
Guías relacionadas
Best GPU for Llama 3 70B How Much VRAM for DeepSeek-R1 Q4 vs Q8 Quantization Explained Apple Silicon for Local AI RTX Spark: 128GB Unified Memory

Las cifras de VRAM son estimaciones reproducibles (pesos + caché KV + sobrecarga) y varían según el runtime y el formato de cuantización. Datos vigentes al 2026-06-18.