NVIDIA 发布 Nemotron 3 Nano Omni 多模态模型,吞吐量提升 9 倍

Gate News 消息,4 月 28 日——NVIDIA 已发布 Nemotron 3 Nano Omni,这是一款开源的多模态模型,采用 30B-A3B 专家混合(mixture-of-experts)(MoE) 架构,并支持 256K 上下文窗口。该模型在单一框架中统一处理视频、音频、图像和文本输入。

与可比的开源多模态模型相比,Nemotron 3 Nano Omni 实现了 9 倍的吞吐量提升,显著降低推理成本并增强可扩展性。该模型现已在 Hugging Face、OpenRouter 和 NVIDIA NIM 上提供,并已被包括 Aible、Applied Scientific Intelligence 和 H Company 在内的企业采用。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明
评论
0/400
暂无评论