Alibaba🧠 Dense

Qwen 3 8B

8B
Параметры
6 ГБ
Мин. VRAM (Q4)
16 ГБ
Мин. VRAM (FP16)
32K
Контекст

💵 Цены API (OpenRouter)

Вход: $0.05/1M ток.Выход: $0.40/1M ток.

🖥 Совместимые GPU (34)

GPU с ≥6 ГБ VRAM для запуска Qwen 3 8B в квантизации Q4_K_M

GPUVRAMПропускнаяtok/sЦена (новая)$/tok/s
MI300X 192GBAMD192 ГБ5300 ГБ/с280.0$15,000$54
Gaudi 3 128GBIntel128 ГБ3700 ГБ/с276.1$15,000$54
H200 141GBNVIDIA141 ГБ4800 ГБ/с253.6$30,000$118
H100 SXM 80GBNVIDIA80 ГБ3350 ГБ/с250.0$30,000$120
MI250X 128GBAMD128 ГБ3200 ГБ/с238.8$12,000$50
H100 PCIe 80GBNVIDIA80 ГБ2039 ГБ/с213.0$25,000$117
A100 80GBNVIDIA80 ГБ2039 ГБ/с160.0$15,000$94
RTX 5090 32GBNVIDIA32 ГБ1792 ГБ/с150.0$1,999$13
A100 40GBNVIDIA40 ГБ1555 ГБ/с140.0$10,000$71
RTX 5070 Ti 16GBNVIDIA16 ГБ896 ГБ/с134.8$749$6
RTX 4090 24GBNVIDIA24 ГБ1008 ГБ/с130.0$1,600$12
L40S 48GBNVIDIA48 ГБ864 ГБ/с130.0$8,000$62
L40 48GBNVIDIA48 ГБ864 ГБ/с130.0$6,500$50
RX 7900 XT 20GBAMD20 ГБ800 ГБ/с97.8$799$8
Mac M2 UltraApple192 ГБ800 ГБ/с97.8$7,000$72
Mac M3 Ultra 192GBApple192 ГБ800 ГБ/с97.8$6,999$72
RTX 3080 10GBNVIDIA10 ГБ760 ГБ/с92.9$600$6
RTX 4080 SUPER 16GBNVIDIA16 ГБ736 ГБ/с90.0$999$11
RTX 4080 16GBNVIDIA16 ГБ717 ГБ/с87.7$1,000$11
A40 48GBNVIDIA48 ГБ696 ГБ/с82.9$5,000$60
RTX 5080 16GBNVIDIA16 ГБ960 ГБ/с82.1$999$12
RX 7900 XTX 24GBAMD24 ГБ960 ГБ/с82.1$900$11
RTX 5070 12GBNVIDIA12 ГБ672 ГБ/с80.0$549$7
RTX 4070 Ti SUPER 16GBNVIDIA16 ГБ672 ГБ/с80.0$799$10
RTX 3090 24GBNVIDIA24 ГБ936 ГБ/с80.0$900$11
A30 24GBNVIDIA24 ГБ933 ГБ/с79.7$4,500$56
RX 7800 XT 16GBAMD16 ГБ624 ГБ/с74.3$499$7
A10 24GBNVIDIA24 ГБ600 ГБ/с60.4$3,500$58
Mac M4 MaxApple64 ГБ546 ГБ/с55.0$4,000$73
RTX 4070 Ti 12GBNVIDIA12 ГБ504 ГБ/с50.8$700$14
RTX 4070 SUPER 12GBNVIDIA12 ГБ504 ГБ/с50.8$599$12
RTX 4060 Ti 16GBNVIDIA16 ГБ288 ГБ/с47.5$499$11
Mac M4 ProApple24 ГБ273 ГБ/с45.0$2,500$56
Mac M4 16GBApple16 ГБ120 ГБ/с19.8$1,199$61

📊 Рассчитайте ваш профит

Оцените заработок на локальном инференсе Qwen 3 8B

Открыть калькулятор →