英博云 | 高效益、多样化的GPU智算产品及服务

部署一个gpt-oss-20b模型推理服务

gpt-oss

4090x1

20B

MXFP4

文本生成

MoE

高性价比之选，在 4090 单卡以 FP4 精度部署一个 gpt-oss-20b 模型推理服务，高吞吐与快响应，适用于模型精度要求不太高的高并发文本生成与问答场景

预估¥1.99 /小时

新用户免费使用 25 小时

README

首充活动