封面新闻记者 欧阳宏宇
基于全国产算力训练的深度推理大模型再度迎来升级,目前已全面对标OpenAI o1和DeepSeek R1。
4月20日,科大讯飞对外透露,深度推理大模型讯飞星火X1迎来升级。据介绍,升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果显著提升,并在通用任务效果评测中全面对标OpenAI o1和DeepSeek R1,同时强化其在教育、医疗、司法等重点行业份额。
近段时间,国产人工智能技术仍在取得突破,科技公司将升级的方向定位在了应用和商业化上。
上月底,通义千问大模型推出AI助手“超级智能体”,主打深度思考能力和实时信息整合技术。此前,百度发布的文心大模型4.5和文心大模型X1则在多模态的基础上,更强调了其将免费向用户开放。腾讯混元大模型的处境,则在元宝接入DeepSeek后变得有些尴尬。快手人工智能大模型“可灵AI”在几天前宣布了基座模型再次升级,也只针对视频生成和图像生成两个场景。此外,DeepSeek-R2或将于5月发布。
厂商竞逐“最后一公里”让国产人工智能在“软实力”上加速提升。但要在真实的环境中解决那些日常烦琐、但重要的行业需求,靠的不仅是应用落地,更需要AI公司能在技术的“硬实力”上建立护城河。
国产AI迈向自主可控新阶段,也需要在技术路径上进行创新。据业内人士分析,通过全国产算力训练深度推理大模型,需要基于强化学习、模型训练等多个方面创新与可控。
一是提出基于问题难度的大规模多阶段强化学习方法,在复杂推理、数学、代码、语言理解等场景全面提升模型效果及泛化性;同时提出强化学习动态更新算法,基于样本采样长度动态调整强化学习更新速度,进一步提升深度思考强化学习效率及效果。
二是统一模型下的快慢思考混合训练方法,充分发挥快慢思考数据相互促进作用,实现基于系统指令控制模型是否深度思考,支撑下游更高效便捷地部署使用。
三是实现多项工程技术创新,显存动态卸载技术大幅提升长文本推理并发、训推共卡协同实现高效训推资源转换、推理引擎冬眠机制实现快速拉起和恢复,实现国产算力平台上高效和稳定的强化学习训练全流程。
从行业整体来看,金融、教育、文旅、车载、政务等B端场景成为国产AI厂商主要试水地,而大模型企业在商业化上的打法也需要基于研发实力才能在快速迭代进步中,对实际应用场景取得显著效能优势,并在参与国际形势中具备更强战略韧性。
“全国产算力训练的深度推理大模型全面升级,不仅展示了中国人工智能技术在国产算力平台上的创新突破,也为各行各业数字化转型提供了新的可能。”业内人士表示,这一技术之下的代表大模型不断迭代,已证明在技术自主可控的道路上,中国AI已具备与国际顶尖模型同台竞技的实力。
0 条