La Nvidia RTX 4070 Super tiene 12 GB de memoria. Con cuantización de 4 bits (contexto de 8K), 44 de 78 LLMs locales populares caben cómodamente. Lista completa abajo, de menor a mayor.
"Justo" significa que cabe con poco margen — cierra otras apps que usen la GPU o espera algo de descarga a la RAM del sistema. Para los modelos que no caben, baja a un modelo más pequeño, usa 2 bits o sube de VRAM.
Obtén el número exacto para tu equipo
Elige tu modelo, cuantización y longitud de contexto — la calculadora muestra toda la matemática de VRAM y te dice exactamente qué hardware encaja.
Abrir la calculadora de IA local →
Las cifras de VRAM son estimaciones reproducibles (pesos + caché KV + sobrecarga) y varían según el runtime y el formato de cuantización. Datos vigentes al 2026-06-18.