部署一个Qwen3-32B-FP8模型推理服务
Qwen3
H800x1
32B
FP8
文本生成
在 H800 单卡以 FP8 精度部署一个模型推理服务,相比于 FP16 精度,具备更高吞吐与更快响应,适用于高并发文本生成与问答场景
预估¥13.99 /小时
新用户免费使用 3 小时
一键部署
README
首充活动