英博云 | 高效益、多样化的GPU智算产品及服务

部署一个Qwen3-32B-FP8模型推理服务

Qwen3

H800x1

32B

FP8

文本生成

在 H800 单卡以 FP8 精度部署一个模型推理服务，相比于 FP16 精度，具备更高吞吐与更快响应，适用于高并发文本生成与问答场景

预估¥13.99 /小时

新用户免费使用 3 小时

README

首充活动