部署一个gpt-oss-20b模型推理服务
gpt-oss
4090x1
20B
MXFP4
文本生成
MoE
高性价比之选,在 4090 单卡以 FP4 精度部署一个 gpt-oss-20b 模型推理服务,高吞吐与快响应,适用于模型精度要求不太高的高并发文本生成与问答场景
预估¥1.79 /小时
新用户免费使用 27 小时
一键部署
README
首充活动