手机也能跑的模型来了!阿里宣布开源Qwen2.5-Omni-7B

内容摘要快科技3月27日消息,今天,阿里云宣布通义千问Qwen2.5-Omni-7B正式开源。这是通义系列模型中首个端到端全模态大模型,可同时处理文本、图像、音频和视频等多种输入,并实时生成文本与自然语音合成输出。在权威的多模态融合任务OmniBe

快科技3月27日消息,今天,阿里云宣布通义千问Qwen2.5-Omni-7B正式开源。

这是通义系列模型中首个端到端全模态大模型,可同时处理文本、图像、音频和视频等多种输入,并实时生成文本与自然语音合成输出。

在权威的多模态融合任务OmniBench等测评中,Qwen2.5-Omni刷新业界纪录,全维度远超谷歌的Gemini-1.5-Pro等同类模型。

阿里云表示,相较于动辄数千亿参数的闭源大模型,Qwen2.5-Omni以7B的小尺寸让全模态大模型在产业上的广泛应用成为可能。

即便在手机上,也能部署和应用Qwen2.5-Omni模型。

目前,Qwen2.5-Omni已在魔搭社区和Hugging Face 同步开源,用户也可在Qwen Chat上直接体验。

手机也能跑的模型来了!阿里宣布开源Qwen2.5-Omni-7B

据悉,2023年起,通义团队陆续开发覆盖0.5B、1.5B、3B、7B、14B、32B、72B、110B等参数的200多款全尺寸大模型,囊括文本生成模型、视觉理解/生成模型、语音理解/生成模型、文生图及视频模型等全模态。

开源地址:

https://huggingface.co/Qwen/Qwen2.5-Omni-7B

https://modelscope.cn/models/Qwen/Qwen2.5-Omni-7B

https://github.com/QwenLM/Qwen2.5-Omni

 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
浙ICP备19001410号-1