部署一个qwen3-vl-8b-fp8模型服务
qwen
4090x1
8B
文本生成
图像理解
在单张 RTX 4090 GPU 上部署 Qwen3-VL-8B-FP8 模型服务,支持图像理解,高吞吐与快响应,适用于高并发文本生成与问答场景
预估¥1.79 /小时
新用户免费使用 27 小时
一键部署
README
首充活动