部署一个gpt-oss-120b模型推理服务
gpt-oss
H800x1
120B
MXFP4
文本生成
MoE
在 H800 单卡以 FP4 精度部署一个模型推理服务,具备更高吞吐与更快响应,适用于高并发文本生成与问答场景
预估¥13.99 /小时
新用户免费使用 3 小时
一键部署
README
首充活动