IT之家 3 月 20 日消息,英伟达最新发布 Llama Nemotron 系列开放推理 AI 模型,支持“智能体 AI”系统,可独立推理、规划并执行多步骤任务,适用于机器人、自动化和决策优化等场景,显著降低推理成本,助力企业实现 AI 自主化升级。
Llama Nemotron 系列开放推理 AI 模型共有 Nano、Super 和 Ultra 三种规模,IT之家援引博文简单介绍如下:
Nano:专为 PC 和边缘设备设计,提供高精度推理。
Super:单 GPU 部署,兼顾顶级准确率与处理速度。
Ultra:多 GPU 服务器优化,确保复杂任务的最高精度。
三种不同规模适用于不同部署环境,可按需激活深度推理模式,简化任务时节省算力,降低推理成本。Llama Nemotron 系列开放推理 AI 模型还通过 NVIDIA NIM 微服务,支持从数据中心到边缘计算的全场景应用。
英伟达还介绍了 Cosmos Nemotron 新成员,这是专注视觉语言模型(VLM),可解析图像、视频及传感器数据,扩展 NVIDIA 此前的 Cosmos World Foundation Model(WFM)平台能力,主要应用于自动驾驶、工业机器人等需多模态推理的领域,实现“文本 + 视觉”协同决策。
0 条