Meta🧠 Dense

Llama 3.2 3B

3B
Параметры
4 ГБ
Мин. VRAM (Q4)
6 ГБ
Мин. VRAM (FP16)
128K
Контекст

💵 Цены API (OpenRouter)

Вход: $0.05/1M ток.Выход: $0.34/1M ток.

🖥 Совместимые GPU (34)

GPU с ≥4 ГБ VRAM для запуска Llama 3.2 3B в квантизации Q4_K_M

GPUVRAMПропускнаяtok/sЦена (новая)$/tok/s
MI300X 192GBAMD192 ГБ5300 ГБ/с450.0$15,000$33
Gaudi 3 128GBIntel128 ГБ3700 ГБ/с441.8$15,000$34
H200 141GBNVIDIA141 ГБ4800 ГБ/с407.5$30,000$74
H100 SXM 80GBNVIDIA80 ГБ3350 ГБ/с400.0$30,000$75
MI250X 128GBAMD128 ГБ3200 ГБ/с382.1$12,000$31
H100 PCIe 80GBNVIDIA80 ГБ2039 ГБ/с340.0$25,000$74
A100 80GBNVIDIA80 ГБ2039 ГБ/с260.0$15,000$58
RTX 5090 32GBNVIDIA32 ГБ1792 ГБ/с250.0$1,999$8
A100 40GBNVIDIA40 ГБ1555 ГБ/с230.0$10,000$43
RTX 5070 Ti 16GBNVIDIA16 ГБ896 ГБ/с186.7$749$4
RTX 4090 24GBNVIDIA24 ГБ1008 ГБ/с180.0$1,600$9
L40S 48GBNVIDIA48 ГБ864 ГБ/с180.0$8,000$44
L40 48GBNVIDIA48 ГБ864 ГБ/с180.0$6,500$36
RX 7900 XT 20GBAMD20 ГБ800 ГБ/с152.2$799$5
Mac M2 UltraApple192 ГБ800 ГБ/с152.2$7,000$46
Mac M3 Ultra 192GBApple192 ГБ800 ГБ/с152.2$6,999$46
RTX 3080 10GBNVIDIA10 ГБ760 ГБ/с144.6$600$4
RTX 4080 SUPER 16GBNVIDIA16 ГБ736 ГБ/с140.0$999$7
RTX 4080 16GBNVIDIA16 ГБ717 ГБ/с136.4$1,000$7
A40 48GBNVIDIA48 ГБ696 ГБ/с134.6$5,000$37
RTX 5070 12GBNVIDIA12 ГБ672 ГБ/с130.0$549$4
RTX 4070 Ti SUPER 16GBNVIDIA16 ГБ672 ГБ/с130.0$799$6
RTX 5080 16GBNVIDIA16 ГБ960 ГБ/с123.1$999$8
RX 7900 XTX 24GBAMD24 ГБ960 ГБ/с123.1$900$7
RX 7800 XT 16GBAMD16 ГБ624 ГБ/с120.7$499$4
RTX 3090 24GBNVIDIA24 ГБ936 ГБ/с120.0$900$8
A30 24GBNVIDIA24 ГБ933 ГБ/с119.6$4,500$38
A10 24GBNVIDIA24 ГБ600 ГБ/с93.4$3,500$37
Mac M4 MaxApple64 ГБ546 ГБ/с85.0$4,000$47
RTX 4070 Ti 12GBNVIDIA12 ГБ504 ГБ/с78.5$700$9
RTX 4070 SUPER 12GBNVIDIA12 ГБ504 ГБ/с78.5$599$8
RTX 4060 Ti 16GBNVIDIA16 ГБ288 ГБ/с73.8$499$7
Mac M4 ProApple24 ГБ273 ГБ/с70.0$2,500$36
Mac M4 16GBApple16 ГБ120 ГБ/с30.8$1,199$39

📊 Рассчитайте ваш профит

Оцените заработок на локальном инференсе Llama 3.2 3B

Открыть калькулятор →