飞象原创(魏德龄/文)近年来的每一个春节,都成为人工智能的闪耀时刻。随着DeepSeek所带来的蒸馏技术,让本地部署成为了新的热潮,以至于配合RAG,每个人都能在本地终端中构建一个自己的知识库。但在实际测试使用中便会发现,要想让AI的回答符合预期,并不是把自己的文件往库里一甩那么简单,尤其是对于专业知识的理解学习与逻辑推理,并非如想象中的理所当然。
对于早就已经迈向数智化转型的众多企业来说,这一问题更是由来已久。例如“三大行”一词,常规上肯定理解为工农中建交这样的头部银行,然而在某银行的工作对话场景中,却是指北京、上海、深圳的分行。又比如某连锁快餐品牌的内部系统中,“订单数”可能被称为“GC”,但大模型在面对数据表时可能根本无法理解何为“GC”。
Aloudata大应科技创始人 CEO周卫林“经营决策场景下企业知识语义表达的载体就是‘指标’,其管理平台就是‘指标平台’。也因此,指标平台是企业最为确定性的私域知识库。”Aloudata大应科技创始人 CEO周卫林在不久前举行的NoETL指标平台最佳实践研讨会上表示,随着AI技术的不断增强,人才、技术与资本将不再是企业的真正壁垒,而“知本”作为企业的独有认知体系和知识库,一旦形成竞争优势,将难以被复制和超越。这也是为何市场正在对Chat BI表现出强烈关注的原因所在。
然而,如同文章开篇提到的实际知识库应用落地难题,在很多企业的多年数据积累的过程中,本应成为竞争壁垒的数据知识,却甚至成为内部工作中的阻碍。
NoETL破除企业数据管理消费集中痛点
报表口径不统一是很多企业内部人员所头疼的问题。平安证券数据平台产品负责人倪程伟指出,同一个指标可能在不同的报表里呈现不一致,或管理模式调整切换口径后,无法更新全部报表,带来潜在数据差异。原因在于指标定义分散在报表中,无法共享。
他表示,信息呈现多但数据洞察少也是一个经常出现的问题,最终企业内部只是看到了大量的总体数据,但难以理解数据背后的各种维度和变化。也就是说,工具和数据难以支撑深入契合场景,进行多维分析、切片分析、关联分析或归因分析。
还有一点便是重复开发的问题,报表数量众多,但实际业务价值不明确。传统ETL +数据集的生产模式下,开发工作分散在不同团队和人员手中,报表开发周期长、灵活性差,业务需求已经难以被灵活快速满足。
另一个在日常生活中最常见的表象可能就是正在进行促销活动的快餐厅,一场营销活动的目的可能在于提升客户的满意度或拉升月活黏性。然而,如果活动期间餐厅应对猛增的出餐需求不利,却会导致出餐速度变差,或油炸食品品相不佳,又或是取餐系统信息滞后,反而可能出现的是一次负向的营销。这一切表象的背后往往在于指标无法在各部门间形成统一。例如:供应链部门关注物料准备,运营部门负责员工调配,管理层则通过移动驾驶舱查看数据。麦当劳中国数据中台负责人陈润红表示,最后由于数据源和计算逻辑不一致,常常在营销活动进行到一半时,发现各部门的数据对不上,导致决策混乱。
面对不同行业在数据管理和消费过程中所出现的集中痛点,Aloudata在三年前提出了NoETL理念。而在业务取数、用数体感最强烈的场景,即指标的生产、管理、消费场景,Aloudata打造了业界首个“管研用”一体化的NoETL指标平台,通过定义清晰的语义,对数仓中间层和应用层进行建模,然后通过自动化构建和物化加速实现指标的定义、开发、管理、消费的一体化,让业务无需掌握ETL技能,无需等待漫长排期,随时可对全域数据开启自助灵活的分析与洞察。
目前,NoETL指标平台已经成为平安证券、麦当劳中国、华润数科、中国南方航空、lululemon、理想汽车等30余家头部企业的选择,周查询API调用量已达亿级,助力企业内部指标统一性与维度定义的标准化,并实现了数据资产的沉淀,提升指标开发管理的降本增效。
“NoETL就是通过将ETL Engineers驱动的数据工程转变为ETL Agents驱动的数据工程,实现数据处理流程的自动化重构。只有完成这种生产力变革,才能真正满足AI时代的数据分析需求。”周卫林表示,NoETL不仅解决了当下传统BI体系中最根本的供需矛盾,也正在为Chat BI的真正落地扫清障碍。
为Chat BI落地扫清障碍
有人说GPT的爆发恰恰是被前缀的Chat所点燃。通过自然语言的交互让人工智能有机会成为每一个人告别技术门槛的生产力工具。对于企业来说,也自然希望在内部能够构建起Chat BI,BI作为企业数字化进程中最为基础和普遍的应用场景,与AI的结合已经是必然趋势。
而通过上文内容不难发现,Chat BI的关键恰恰在于数据,解决业务日常沟通指标口径与AI获取指标语义保持一致的关键正在于Chat BI与数据仓库之间必然依赖指标平台实现语义层中介,从而实现数据的AI-Ready。
“我们的口号是‘Less cost, more intelligence’,即以更低的人力成本、存算成本和应用接入门槛,实现数据的AI-Ready,以高度自动化的数据工程体系推动企业智能生态的繁荣发展。”Aloudata联合创始人兼首席产品官肖裕洪表示,围绕新的企业落地目标,Aloudata进行了一系列产品的关键升级。
为了帮助企业以低成本实现数据高效就绪。Aloudata在今年将专门在语义引擎上进行重大升级。首先是指标定义的增强,让企业能够以最优雅、最高效的方式定义指标和建模。比如支持多角色关系的建模,支持基于指标值定义和快速变更维度(标签),支持公共(杂项)维度的定义;其次是指标加速的增强,重点优化查询路由改写、物化构建效率与Cube加速功能;最后是指标治理的增强,进一步提高相似指标的识别能力,提供更加精细的审批管理和审计日志,并通过多环境发布和字段级的影响评估进一步提升数据质量。
Aloudata还将结合AI技术推出智能建模助手,以提升企业在复杂场景下的数据建模效率。在指标和维度的批量创建场景中,智能助手可以显著提升效率;此外,智能语义助手还可应用于更深度的语义生成和洞察分析中,例如可自动提取常用维度或热门维度,帮助用户在多维归因分析的时候更好地选择合适的分析维度。或自动从指标构建血缘、查询记录中挖掘出指标关联因子指标,帮助用户在归因时自动关联相关指标,提供更深入的洞察;智能助手还可以实时监测用户的分析行为,识别性能瓶颈或不经济的查询模式,并提前进行智能加速,确保分析体验的流畅性;以及自动盘点企业中的重复指标或无用指标,为管理者提供清晰的管理视图,提升治理效率。
Aloudata AIR和Aloudata CAN两大平台作为以NoETL理念所打造的产品将通过深度融合,确保企业的所有数据能够轻松连接和高效利用,并为企业的多智能体生态提供单一可信的数据服务。Aloudata目标未来在存算层、用户体系层、权限层和血缘关系上实现更深层次的融通。
“在AI时代,企业要为各种智能体提供一份单一可信的数据源,而Aloudata AIR同Aloudata CAN的深度融合形成了一个路径更短、成本更低、自动化程度更高的NoETL工程体系,将有力支撑企业的数字化重心从「数据呈现」转移到「数据洞察」。”肖裕洪表示,融合的原因在于企业对数据就绪速度的需求显著提高,而数据编织能够借助数据虚拟化技术达成轻量级数据集成与准备、按需物化的效果。在实际业务推进过程中,Aloudata AIR逻辑数据编织解决方案是为Chat BI进行快速、低成本的数据集成准备的理想方案。
当AI-Ready的数据底座进一步完成构建,确保指标语义层拥有最大的数据覆盖度。也意味着Chat BI最后的落地障碍扫清,Aloudata更是“既许人以援手,必扶持到底”,宣布还即将推出一款以“万数皆可问”为目标的Chat BI智能体:Aloudata Agent。
万数皆可问的Chat BI智能体
“‘万数皆可问’不仅是一个愿景,更是我们通过技术手段实现的承诺。我们希望通过一个强大的NoETL数据底座,为上层的Aloudata Agent提供更完整的数据覆盖、更精准的数据语义、更强大的查询性能和更可靠的安全保障。”肖裕洪表示。
Aloudata Agent目标解决Chat BI在数据查询中面临的诸多挑战。例如数据覆盖度不足、口径不一致导致的准确性问题、性能不稳定或不可控的查询响应问题,以及数据越权或泄露的安全问题。Aloudata Agent目前已经具备了一些重要的功能和特性,能够为企业提供初步的智能化支持。
第一是对话式分析。Aloudata Agent支持灵活、准确的对话式取数、归因分析和智能分析报告生成。未来将会通过迭代升级达到与专业分析师同级别的归因分析能力,能够提出假设与验证假设。
第二是分析过程透明化。在Chat BI这种容错性较低的场景中,分析过程的透明化至关重要。Aloudata Agent会清晰呈现分析过程,保留中间产物,确保用户能够清晰地了解每一步的分析逻辑,以及在事后进行分析的回溯和审计。
第三是数据准确可信。Aloudata Agent的数据准确性依赖于Aloudata CAN指标平台的标准化语义沉淀。它能够将用户的问答与企业标准指标口径对齐,确保分析结果的准确性和可信度。
第四是数据安全可保障。Aloudata通过指标平台精细化的数据权限管理确保数据在分析过程中的安全性和可控性。
为了配合Aloudata Agent的推出,Aloudata还提供了面向AI的API和SDK,以赋能企业快速实现AI应用创新,构建智能体生态。Aloudata AI API能够致力于加速企业AI应用开发的工具集,尤其针对RAG场景进行了深度优化,旨在通过简化数据集成与复杂分析流程,帮助企业更高效地构建智能应用。
在NoETL指标平台最佳实践研讨会上,周卫林专门谈到了针对企业Chat BI落地的三个建议,分别是:“好数据,强智能”、“可溯源,可审计”、“全开放,大生态”。纵观Aloudata依托NoETL理念所打造的产品及持续升级,以及最新发布的Aloudata Agent,无疑正在围绕这18个字,为企业构建AGI时代的数智基建。
“我们坚信,AI时代的关键是Data,是知识库,是数据语义层,是数据虚拟化,这是我们的判断,也是我们创立这家公司的初心。”周卫林这样介绍了“Aloudata”名称的由来,即源于“AI on data”的理念。
自NoETL理念诞生的三年以来,正在逐步筑牢企业的数据根基,化阻碍为“知本”壁垒。如今随着Aloudata围绕AI时代所带来一系列升级,以及Aloudata Agent的全新推出,又在“好数据”的根基之上,为企业种下了“万数皆可问”的知识之树。
0 条