Meta🧠 Dense
Llama 3.2 1B
1B
Параметры
2 ГБ
Мин. VRAM (Q4)
2 ГБ
Мин. VRAM (FP16)
128K
Контекст
💵 Цены API (OpenRouter)
Вход: $0.03/1M ток.Выход: $0.20/1M ток.
🖥 Совместимые GPU (34)
GPU с ≥2 ГБ VRAM для запуска Llama 3.2 1B в квантизации Q4_K_M
| GPU | VRAM | Пропускная | tok/s | Цена (новая) | $/tok/s |
|---|---|---|---|---|---|
| Gaudi 3 128GBIntel | 128 ГБ | 3700 ГБ/с | 552.2 | $15,000 | $27 |
| MI300X 192GBAMD | 192 ГБ | 5300 ГБ/с | 550.0 | $15,000 | $27 |
| H100 SXM 80GBNVIDIA | 80 ГБ | 3350 ГБ/с | 500.0 | $30,000 | $60 |
| H200 141GBNVIDIA | 141 ГБ | 4800 ГБ/с | 498.1 | $30,000 | $60 |
| MI250X 128GBAMD | 128 ГБ | 3200 ГБ/с | 477.6 | $12,000 | $25 |
| H100 PCIe 80GBNVIDIA | 80 ГБ | 2039 ГБ/с | 425.0 | $25,000 | $59 |
| A100 80GBNVIDIA | 80 ГБ | 2039 ГБ/с | 320.0 | $15,000 | $47 |
| RTX 5090 32GBNVIDIA | 32 ГБ | 1792 ГБ/с | 310.0 | $1,999 | $6 |
| A100 40GBNVIDIA | 40 ГБ | 1555 ГБ/с | 280.0 | $10,000 | $36 |
| RTX 5070 Ti 16GBNVIDIA | 16 ГБ | 896 ГБ/с | 228.1 | $749 | $3 |
| RTX 4090 24GBNVIDIA | 24 ГБ | 1008 ГБ/с | 220.0 | $1,600 | $7 |
| L40S 48GBNVIDIA | 48 ГБ | 864 ГБ/с | 220.0 | $8,000 | $36 |
| L40 48GBNVIDIA | 48 ГБ | 864 ГБ/с | 220.0 | $6,500 | $30 |
| RX 7900 XT 20GBAMD | 20 ГБ | 800 ГБ/с | 190.2 | $799 | $4 |
| Mac M2 UltraApple | 192 ГБ | 800 ГБ/с | 190.2 | $7,000 | $37 |
| Mac M3 Ultra 192GBApple | 192 ГБ | 800 ГБ/с | 190.2 | $6,999 | $37 |
| RTX 3080 10GBNVIDIA | 10 ГБ | 760 ГБ/с | 180.7 | $600 | $3 |
| RTX 4080 SUPER 16GBNVIDIA | 16 ГБ | 736 ГБ/с | 175.0 | $999 | $6 |
| RTX 4080 16GBNVIDIA | 16 ГБ | 717 ГБ/с | 170.5 | $1,000 | $6 |
| A40 48GBNVIDIA | 48 ГБ | 696 ГБ/с | 165.7 | $5,000 | $30 |
| RTX 5070 12GBNVIDIA | 12 ГБ | 672 ГБ/с | 160.0 | $549 | $3 |
| RTX 4070 Ti SUPER 16GBNVIDIA | 16 ГБ | 672 ГБ/с | 160.0 | $799 | $5 |
| RTX 5080 16GBNVIDIA | 16 ГБ | 960 ГБ/с | 153.8 | $999 | $6 |
| RX 7900 XTX 24GBAMD | 24 ГБ | 960 ГБ/с | 153.8 | $900 | $6 |
| RTX 3090 24GBNVIDIA | 24 ГБ | 936 ГБ/с | 150.0 | $900 | $6 |
| A30 24GBNVIDIA | 24 ГБ | 933 ГБ/с | 149.5 | $4,500 | $30 |
| RX 7800 XT 16GBAMD | 16 ГБ | 624 ГБ/с | 148.6 | $499 | $3 |
| A10 24GBNVIDIA | 24 ГБ | 600 ГБ/с | 120.9 | $3,500 | $29 |
| Mac M4 MaxApple | 64 ГБ | 546 ГБ/с | 110.0 | $4,000 | $36 |
| RTX 4070 Ti 12GBNVIDIA | 12 ГБ | 504 ГБ/с | 101.5 | $700 | $7 |
| RTX 4070 SUPER 12GBNVIDIA | 12 ГБ | 504 ГБ/с | 101.5 | $599 | $6 |
| RTX 4060 Ti 16GBNVIDIA | 16 ГБ | 288 ГБ/с | 94.9 | $499 | $5 |
| Mac M4 ProApple | 24 ГБ | 273 ГБ/с | 90.0 | $2,500 | $28 |
| Mac M4 16GBApple | 16 ГБ | 120 ГБ/с | 39.6 | $1,199 | $30 |