Alibaba🧠 DENSE
QwQ 32B
32B
ПАРАМЕТРЫ
20 ГБ
МИН._VRAM (Q4)
64 ГБ
МИН._VRAM (FP16)
128K
КОНТЕКСТ
💵 ЦЕНЫ_API (OPENROUTER)
ВХОД: $0.15/1M ток.ВЫХОД: $0.40/1M ток.
🖥 СОВМЕСТИМЫЕ_GPU (22)
GPU с ≥20 ГБ VRAM для запуска QwQ 32B в квантизации Q4_K_M
| GPU | VRAM | BANDWIDTH | TOK/S | ЦЕНА (НОВАЯ) | $/TOK/S |
|---|---|---|---|---|---|
| Gaudi 3 128GBIntel | 128 ГБ | 3700 ГБ/с | 154.6 | $15,000 | $97 |
| MI300X 192GBAMD | 192 ГБ | 5300 ГБ/с | 150.0 | $15,000 | $100 |
| H100 SXM 80GBNVIDIA | 80 ГБ | 3350 ГБ/с | 140.0 | $30,000 | $214 |
| H200 141GBNVIDIA | 141 ГБ | 4800 ГБ/с | 135.8 | $30,000 | $221 |
| MI250X 128GBAMD | 128 ГБ | 3200 ГБ/с | 133.7 | $12,000 | $90 |
| H100 PCIe 80GBNVIDIA | 80 ГБ | 2039 ГБ/с | 119.0 | $25,000 | $210 |
| A100 80GBNVIDIA | 80 ГБ | 2039 ГБ/с | 85.0 | $15,000 | $176 |
| RTX 5090 32GBNVIDIA | 32 ГБ | 1792 ГБ/с | 74.7 | $1,999 | $27 |
| A100 40GBNVIDIA | 40 ГБ | 1555 ГБ/с | 64.8 | $10,000 | $154 |
| L40S 48GBNVIDIA | 48 ГБ | 864 ГБ/с | 36.0 | $8,000 | $222 |
| L40 48GBNVIDIA | 48 ГБ | 864 ГБ/с | 36.0 | $6,500 | $181 |
| RTX 4090 24GBNVIDIA | 24 ГБ | 1008 ГБ/с | 35.7 | $1,600 | $45 |
| RX 7900 XTX 24GBAMD | 24 ГБ | 960 ГБ/с | 34.0 | $900 | $26 |
| Mac M2 UltraApple | 192 ГБ | 800 ГБ/с | 33.3 | $7,000 | $210 |
| Mac M3 Ultra 192GBApple | 192 ГБ | 800 ГБ/с | 33.3 | $6,999 | $210 |
| RTX 3090 24GBNVIDIA | 24 ГБ | 936 ГБ/с | 33.2 | $900 | $27 |
| A30 24GBNVIDIA | 24 ГБ | 933 ГБ/с | 33.1 | $4,500 | $136 |
| A40 48GBNVIDIA | 48 ГБ | 696 ГБ/с | 29.0 | $5,000 | $172 |
| RX 7900 XT 20GBAMD | 20 ГБ | 800 ГБ/с | 23.3 | $799 | $34 |
| Mac M4 MaxApple | 64 ГБ | 546 ГБ/с | 22.8 | $4,000 | $175 |
| A10 24GBNVIDIA | 24 ГБ | 600 ГБ/с | 21.3 | $3,500 | $164 |
| Mac M4 ProApple | 24 ГБ | 273 ГБ/с | 9.7 | $2,500 | $258 |