La Intel Arc A770 (16GB) tiene 16 GB de memoria. Con cuantización de 4 bits (contexto de 8K), 48 de 78 LLMs locales populares caben cómodamente. Lista completa abajo, de menor a mayor.

ModeloParámetrosVRAM (Q4)En 16 GB
nomic-embed-text v1.5 (137M)0.137B2.1 GBSí cabe
jina-reranker-v2 (300M)0.3B2.2 GBSí cabe
EmbeddingGemma (308M)0.308B2.2 GBSí cabe
bge-large-en-v1.5 (335M)0.335B2.2 GBSí cabe
bge-reranker-large (335M)0.335B2.2 GBSí cabe
stella-en-400M (435M)0.435B2.3 GBSí cabe
nomic-embed-text v2 MoE (475M)0.475B2.3 GBSí cabe
Qwen 2.5 Coder (0.5B)0.5B2.3 GBSí cabe
bge-m3 (567M)0.567B2.4 GBSí cabe
jina-embeddings-v3 (570M)0.57B2.4 GBSí cabe
Qwen 3 (0.6B)0.6B2.4 GBSí cabe
Qwen 3 Embedding (0.6B)0.6B2.4 GBSí cabe
Qwen 3 Reranker (0.6B)0.6B2.4 GBSí cabe
Gemma 3 (1B)1B2.7 GBSí cabe
DeepSeek-R1 Distill (1.5B)1.5B3.0 GBSí cabe
Qwen 2.5 Coder (1.5B)1.5B3.0 GBSí cabe
Qwen 3 (1.7B)1.7B3.1 GBSí cabe
Gemma 3n (E2B)2B3.3 GBSí cabe
SmolLM3 (3B)3B4.0 GBSí cabe
Llama 3.2 (3B)3B4.0 GBSí cabe
Qwen 2.5 Coder (3B)3B4.0 GBSí cabe
StarCoder 2 (3B)3B4.0 GBSí cabe
Qwen 2.5 VL (3B)3B4.0 GBSí cabe
Phi-4 Mini (3.8B)3.8B4.5 GBSí cabe
Gemma 3 (4B)4B4.7 GBSí cabe
Qwen 3 (4B)4B4.7 GBSí cabe
Qwen 3 VL (4B)4B4.7 GBSí cabe
Phi-4 Multimodal (5.6B)5.6B5.8 GBSí cabe
DeepSeek-R1 Distill (7B)7B6.7 GBSí cabe
StarCoder 2 (7B)7B6.7 GBSí cabe
Qwen 2.5 Coder (7B)7.2B6.8 GBSí cabe
Qwen 2.5 VL (7B)7.2B6.8 GBSí cabe
Llama 3.1 (8B)8B7.4 GBSí cabe
DeepSeek-R1 Distill (8B)8B7.4 GBSí cabe
Qwen 3 VL (8B)8B7.4 GBSí cabe
InternVL3 (8B)8B7.4 GBSí cabe
LLaVA 1.6 (8B)8B7.4 GBSí cabe
Qwen 3 (8B)8.2B7.5 GBSí cabe
Gemma 2 (9B)9.2B8.2 GBSí cabe
Llama 3.2 Vision (11B)11B9.4 GBSí cabe
Gemma 3 (12B)12B10.0 GBSí cabe
Pixtral (12B)12B10.0 GBSí cabe
DeepSeek-R1 Distill (14B)14B11.4 GBSí cabe
Phi-4 (14B)14B11.4 GBSí cabe
Qwen 3 (14B)14.8B11.9 GBSí cabe
Qwen 2.5 Coder (14B)14.8B11.9 GBSí cabe
StarCoder 2 (15B)15B12.1 GBSí cabe
DeepSeek-Coder-V2 Lite (16B)16B12.7 GBSí cabe
gpt-oss (20B MoE)21B16.1 GBJusto
Devstral Small (24B)24B18.1 GBNo cabe
Codestral 25.01 (24B)24B18.1 GBNo cabe
Gemma 4 (26B MoE)26B19.4 GBNo cabe
Gemma 3 (27B)27B20.1 GBNo cabe
Qwen 3 (30B-A3B MoE)30.5B22.4 GBNo cabe
Qwen 3 Coder (30B-A3B MoE)30.5B22.4 GBNo cabe
DeepSeek-R1 Distill (32B)32B23.4 GBNo cabe
Qwen 3 VL (32B)32B23.4 GBNo cabe
Qwen 2.5 (32B)32.5B23.8 GBNo cabe
Qwen 2.5 Coder (32B)32.5B23.8 GBNo cabe
Qwen 3 (32B)32.8B24.0 GBNo cabe
Qwen 3.6 (35B-A3B MoE)35B25.4 GBNo cabe
Llama 3.3 (70B)70.6B49.3 GBNo cabe
DeepSeek-R1 (70B Distill)70.6B49.3 GBNo cabe
Qwen 2.5 VL (72B)72B50.2 GBNo cabe
InternVL3 (78B)78B54.3 GBNo cabe
Llama 3.2 Vision (90B)90B62.3 GBNo cabe
GLM-4.5 Air (106B-A12B)106B73.0 GBNo cabe
Llama 4 Scout (109B MoE)109B75.0 GBNo cabe
gpt-oss (120B MoE)117B80.4 GBNo cabe
Mistral Large 2 (123B)123B84.4 GBNo cabe
DeepSeek-Coder-V2 (236B)236B160.1 GBNo cabe
GLM-4.6 (355B-A32B)355B239.9 GBNo cabe
Llama 4 Maverick (400B MoE)400B270.0 GBNo cabe
Llama 3.1 (405B)405B273.4 GBNo cabe
Qwen 3 Coder (480B-A35B)480B323.6 GBNo cabe
DeepSeek-V3.1 (671B)671B451.6 GBNo cabe
DeepSeek-R1 (671B Full)671B451.6 GBNo cabe
Kimi K2 (1T MoE)1000B672.0 GBNo cabe

"Justo" significa que cabe con poco margen — cierra otras apps que usen la GPU o espera algo de descarga a la RAM del sistema. Para los modelos que no caben, baja a un modelo más pequeño, usa 2 bits o sube de VRAM.

Obtén el número exacto para tu equipo
Elige tu modelo, cuantización y longitud de contexto — la calculadora muestra toda la matemática de VRAM y te dice exactamente qué hardware encaja.
Abrir la calculadora de IA local
Guías relacionadas
Best GPU for Llama 3 70B How Much VRAM for DeepSeek-R1 Q4 vs Q8 Quantization Explained Apple Silicon for Local AI RTX Spark: 128GB Unified Memory

Las cifras de VRAM son estimaciones reproducibles (pesos + caché KV + sobrecarga) y varían según el runtime y el formato de cuantización. Datos vigentes al 2026-06-18.