Meta🧠 Dense

Llama 3.2 1B

1B
Параметры
2 ГБ
Мин. VRAM (Q4)
2 ГБ
Мин. VRAM (FP16)
128K
Контекст

💵 Цены API (OpenRouter)

Вход: $0.03/1M ток.Выход: $0.20/1M ток.

🖥 Совместимые GPU (34)

GPU с ≥2 ГБ VRAM для запуска Llama 3.2 1B в квантизации Q4_K_M

GPUVRAMПропускнаяtok/sЦена (новая)$/tok/s
Gaudi 3 128GBIntel128 ГБ3700 ГБ/с552.2$15,000$27
MI300X 192GBAMD192 ГБ5300 ГБ/с550.0$15,000$27
H100 SXM 80GBNVIDIA80 ГБ3350 ГБ/с500.0$30,000$60
H200 141GBNVIDIA141 ГБ4800 ГБ/с498.1$30,000$60
MI250X 128GBAMD128 ГБ3200 ГБ/с477.6$12,000$25
H100 PCIe 80GBNVIDIA80 ГБ2039 ГБ/с425.0$25,000$59
A100 80GBNVIDIA80 ГБ2039 ГБ/с320.0$15,000$47
RTX 5090 32GBNVIDIA32 ГБ1792 ГБ/с310.0$1,999$6
A100 40GBNVIDIA40 ГБ1555 ГБ/с280.0$10,000$36
RTX 5070 Ti 16GBNVIDIA16 ГБ896 ГБ/с228.1$749$3
RTX 4090 24GBNVIDIA24 ГБ1008 ГБ/с220.0$1,600$7
L40S 48GBNVIDIA48 ГБ864 ГБ/с220.0$8,000$36
L40 48GBNVIDIA48 ГБ864 ГБ/с220.0$6,500$30
RX 7900 XT 20GBAMD20 ГБ800 ГБ/с190.2$799$4
Mac M2 UltraApple192 ГБ800 ГБ/с190.2$7,000$37
Mac M3 Ultra 192GBApple192 ГБ800 ГБ/с190.2$6,999$37
RTX 3080 10GBNVIDIA10 ГБ760 ГБ/с180.7$600$3
RTX 4080 SUPER 16GBNVIDIA16 ГБ736 ГБ/с175.0$999$6
RTX 4080 16GBNVIDIA16 ГБ717 ГБ/с170.5$1,000$6
A40 48GBNVIDIA48 ГБ696 ГБ/с165.7$5,000$30
RTX 5070 12GBNVIDIA12 ГБ672 ГБ/с160.0$549$3
RTX 4070 Ti SUPER 16GBNVIDIA16 ГБ672 ГБ/с160.0$799$5
RTX 5080 16GBNVIDIA16 ГБ960 ГБ/с153.8$999$6
RX 7900 XTX 24GBAMD24 ГБ960 ГБ/с153.8$900$6
RTX 3090 24GBNVIDIA24 ГБ936 ГБ/с150.0$900$6
A30 24GBNVIDIA24 ГБ933 ГБ/с149.5$4,500$30
RX 7800 XT 16GBAMD16 ГБ624 ГБ/с148.6$499$3
A10 24GBNVIDIA24 ГБ600 ГБ/с120.9$3,500$29
Mac M4 MaxApple64 ГБ546 ГБ/с110.0$4,000$36
RTX 4070 Ti 12GBNVIDIA12 ГБ504 ГБ/с101.5$700$7
RTX 4070 SUPER 12GBNVIDIA12 ГБ504 ГБ/с101.5$599$6
RTX 4060 Ti 16GBNVIDIA16 ГБ288 ГБ/с94.9$499$5
Mac M4 ProApple24 ГБ273 ГБ/с90.0$2,500$28
Mac M4 16GBApple16 ГБ120 ГБ/с39.6$1,199$30

📊 Рассчитайте ваш профит

Оцените заработок на локальном инференсе Llama 3.2 1B

Открыть калькулятор →