Google🧠 Dense

Gemma 3 12B

12B
Параметры
8 ГБ
Мин. VRAM (Q4)
24 ГБ
Мин. VRAM (FP16)
8K
Контекст

💵 Цены API (OpenRouter)

Вход: $0.04/1M ток.Выход: $0.13/1M ток.

🖥 Совместимые GPU (34)

GPU с ≥8 ГБ VRAM для запуска Gemma 3 12B в квантизации Q4_K_M

GPUVRAMПропускнаяtok/sЦена (новая)$/tok/s
Gaudi 3 128GBIntel128 ГБ3700 ГБ/с220.9$15,000$68
MI300X 192GBAMD192 ГБ5300 ГБ/с220.0$15,000$68
H100 SXM 80GBNVIDIA80 ГБ3350 ГБ/с200.0$30,000$150
H200 141GBNVIDIA141 ГБ4800 ГБ/с199.2$30,000$151
MI250X 128GBAMD128 ГБ3200 ГБ/с191.0$12,000$63
H100 PCIe 80GBNVIDIA80 ГБ2039 ГБ/с170.0$25,000$147
A100 80GBNVIDIA80 ГБ2039 ГБ/с130.0$15,000$115
RTX 5090 32GBNVIDIA32 ГБ1792 ГБ/с120.0$1,999$17
A100 40GBNVIDIA40 ГБ1555 ГБ/с110.0$10,000$91
RTX 4090 24GBNVIDIA24 ГБ1008 ГБ/с95.0$1,600$17
RTX 5070 Ti 16GBNVIDIA16 ГБ896 ГБ/с93.3$749$8
L40S 48GBNVIDIA48 ГБ864 ГБ/с90.0$8,000$89
L40 48GBNVIDIA48 ГБ864 ГБ/с90.0$6,500$72
RX 7900 XT 20GBAMD20 ГБ800 ГБ/с76.1$799$10
Mac M2 UltraApple192 ГБ800 ГБ/с76.1$7,000$92
Mac M3 Ultra 192GBApple192 ГБ800 ГБ/с76.1$6,999$92
RTX 4080 SUPER 16GBNVIDIA16 ГБ736 ГБ/с70.0$999$14
RTX 4080 16GBNVIDIA16 ГБ717 ГБ/с68.2$1,000$15
RTX 5080 16GBNVIDIA16 ГБ960 ГБ/с66.7$999$15
RX 7900 XTX 24GBAMD24 ГБ960 ГБ/с66.7$900$13
RTX 3090 24GBNVIDIA24 ГБ936 ГБ/с65.0$900$14
A30 24GBNVIDIA24 ГБ933 ГБ/с64.8$4,500$69
A40 48GBNVIDIA48 ГБ696 ГБ/с62.1$5,000$81
RTX 3080 10GBNVIDIA10 ГБ760 ГБ/с61.4$600$10
RTX 5070 12GBNVIDIA12 ГБ672 ГБ/с60.0$549$9
RTX 4070 Ti SUPER 16GBNVIDIA16 ГБ672 ГБ/с60.0$799$13
RX 7800 XT 16GBAMD16 ГБ624 ГБ/с55.7$499$9
A10 24GBNVIDIA24 ГБ600 ГБ/с49.5$3,500$71
Mac M4 MaxApple64 ГБ546 ГБ/с45.0$4,000$89
RTX 4070 Ti 12GBNVIDIA12 ГБ504 ГБ/с41.5$700$17
RTX 4070 SUPER 12GBNVIDIA12 ГБ504 ГБ/с41.5$599$14
RTX 4060 Ti 16GBNVIDIA16 ГБ288 ГБ/с36.9$499$14
Mac M4 ProApple24 ГБ273 ГБ/с35.0$2,500$71
Mac M4 16GBApple16 ГБ120 ГБ/с15.4$1,199$78

📊 Рассчитайте ваш профит

Оцените заработок на локальном инференсе Gemma 3 12B

Открыть калькулятор →