对话维他动力余轶南赵哲伦: 自动驾驶没搞定的事,机器人能做吗?

内容摘要关于智能机器人,为大家推荐这篇信息量极高的万字长文。维他动力的两位创始人:前地平线智能驾驶总裁余轶南,和前理想汽车智能驾驶产品总监赵哲伦近日接受了“42号车库”的访谈。机器人的形态选择、与自动驾驶的对比,机器人带动的产业链大升级,AI重塑的

关于智能机器人,为大家推荐这篇信息量极高的万字长文。

维他动力的两位创始人:前地平线智能驾驶总裁余轶南,和前理想汽车智能驾驶产品总监赵哲伦近日接受了“42号车库”的访谈。

机器人的形态选择、与自动驾驶的对比,机器人带动的产业链大升级,AI重塑的机器人价值观……

在具身智能领域,真正的起跑线,其实刚刚出现。

一起期待。

(以下为访谈内容)

2025 年,中国机器人行业的融资规模已突破 50 亿元,仅 4 月的第一周就涌入超过 20 亿元。这一波超预期的资本涌动背后,却藏着一个颇为冷静的现实:2024 年全年,全球四足机器人出货量仅三四万台,人形机器人更不足万台。一个尚未建立起真实用户习惯的行业,为何成为了资本追逐的风口?

本期节目,我们邀请到维他动力的两位创始人:前地平线智能驾驶总裁余轶南,和前理想汽车智能驾驶产品总监赵哲伦。他们曾站在中国智能汽车技术发展的第一线,如今却在机器人赛道重新出发——不是选择更吸引眼球的人形机器人路线,而是转向一个更加现实的问题:机器人是否真的能进入家庭,解决日常生活中的具体问题?

他们的答案是:从一个能在家里真正「被用起来」的机器人开始。绕开流行的人形路径,聚焦家庭空间中「可以上岗」的产品。2025 年,他们的首款机器人即将上市。

这期内容,我们不聊「机器人是不是还会火」,而是关注:

真正落地的创业公司,是如何定义产品、评估路径?

技术、资本与形态选择之间,谁才决定机器人能不能走入家庭?

当资本高潮已至,真正的起跑线,其实刚刚出现。

嘉宾介绍

维他动力成立于 2024 年 12 月,以「通过 AI 创新研发,创造生活空间的智能伙伴」为使命,致力于打造服务于家庭场景的具身智能机器人。公司创立三个月内即完成 2 亿元种子轮融资,投资方包括高瓴创投、雅瑞资本、百度、地平线等一线机构与科技企业。

余轶南,维他动力创始人兼 CEO,前地平线智能驾驶总裁,自 2015 年起主导地平线智能驾驶和智能座舱技术研发与落地,其团队曾获 CVPR 2023 最佳论文奖,助力推动智能驾驶到端到端系统的转型。

赵哲伦,维他动力联合创始人,前理想汽车智能驾驶产品总监,负责理想 ONE 与 L 系列车型智能驾驶产品的定义与交付,现负责具身智能的产品化和市场。

今天可能是机器人创业的最好的时间点

大吉:去年底维他动力成立后,三个月就融资两亿,你们怎样看待这次融资?

余轶南:其实数据不算特别高,但是速度的确也挺快,这个市场现在非常的火热。

赵哲伦:我们把它基本上定义为行业的普涨吧,AI 这个产业确实是紧贴国家大方向。之前其实预计得比这要慢。因为我们一开始选择的路径还挺反共识的,大家都在 follow 特斯拉的路径,想进工厂做一个人形。但我和轶南一开始就没想解决这些问题,我们觉得它没必要替代人的工作,我们认为他应该是能很好的成为生活中的伙伴,帮助人产生价值。所以这种情况下还是挺难跟投资人沟通的,因为这与特斯拉的选择完全不同。

大吉:那后来你们怎么说服投资人的?

赵哲伦:慢慢的我们把我们的很多对于场景的思考,对于产品的思考,为什么我们会把户外与室内场景拆分,为什么我们在思考产品的时候,会去思考它的功能实现什么场景,包括这个产品是怎么样的成本结构说清楚,投资人就开始理解了。

大吉:其实你们在智驾赛道里面处于产业很核心的位置上,至今为止这些公司都处在头部的位置。今年智驾平权概念推出来后,行业在走向规模化。但是你们却选择在这个阶段创业去做机器人,为什么?

余轶南 :因为事实上技术的通用性其实是可以打穿自动驾驶和机器人的,而且在我看来,创业这件事情一定要趁早,虽然今天自动驾驶很火,但是今天可能是机器人创业最好的时间点。

大吉:你觉得跟当年比起来,哪一些方面它已经成熟了,以及又刚刚好是一个比较早的时机?

余轶南:我对这件事情的描述是叫做天时、地利、人和。

「天时」讲的是整个资本市场的热度。今天整个资本市场在 AI、在机器人方向非常的火热,所以是一个很好融资、获得资金支持的一个时间点。

「地利」的话,主要是中国在过去十年围绕着整个智能驾驶、自动驾驶、电动汽车的产业链的兴起,使得我们对于传感器、计算平台、整车的三电,尤其是电机和电池这些方面在整个产业链上的成熟。这里产业链的成熟一方面是指技术上的成熟,另外一方面则是说整个成本的大规模下降。

大家如果有记忆的话,是大概在 2014 年左右的时候,一颗 Velodyne 的 64 线激光雷达需要 64 万人民币。也就是说一根线 1 万元人民币,那今天的话一颗 128 线的激光雷达可能也就 1,300 元人民币,那我们如果按照每一根线的成本来去计算的话,成本降低了 1,000 倍。它能从实验室走向真正产品市场。我觉得在成本上有着非常重大的优化与改进,所以今天你有机会去开发一个可以量产的机器人产品,而在 10 年前没有这个机会。

第三点就是「人和」。一方面,经过自动驾驶这么多年的培育,其实整个产业诞生了一大批有着丰富的 AI 落地的工程经验的人才。不仅仅是算法方面做得好,而且它在工程落地上面有很多的经验。另一方面,其实今天在全世界引领 AI 的浪潮的其实大部分是中国人,所以今天整个市场人才的供给其实是要远比 10 年前好的。此外我觉得非常重要的一点是哲伦和我们一起组建这样一个团队,我们认识五年时间,从理想 one 的合作开始,大家一起打过了五年智驾的仗,所以有非常深度的共识和互信,这也是「人和」中非常重要的一部分。

机器人开车或许会比汽车实现自动驾驶更快

大吉:如何看待自动驾驶技术在机器人身上的技术复用?

赵哲伦:在我们心中,其实机器人本质上和自动驾驶是很接近的,它就是不同的东西的 A 点到 B 点。车体的 A 点到 B 点,对机器人来说,可能是它的各种关节,它的手、胳膊或者是它的手指等不同部位的 A 点到 B 点。实际上自动驾驶天然的难点不在于复杂,它天然难点在于 99.9% 后面那些东西越往后面越难,就 corner case 越来越 corner,对于容错这个问题,其实在目前架构并不是 AI 所擅长的,我觉得 L4 其实还是有一些距离。

大吉:为什么说 L4 还有距离?

余轶南:我觉得现在的技术架构可能仍然不是通往终局的最佳的方案,因为并没有找到一种真正高效有效的解决办法能够去收敛长尾的 corner case,尤其是没有见过的,即使是像端到端这样的架构。端到端我们更多指的是模型上,它是 Sensor in, control out,但是如何训练这样的一个模型?其实今天有不同的做法。自动驾驶的领域,因为你没有办法去做一个闭环的一个训练,所以大部分采用的是 Imitation 这种开环的这种方式,然后再加上很多的人工的工程和规则来去兜底。

那我们可以看到今天机器人的研发范式非常多的是在模拟器里面来去做好训练,去在工程层面把 Sim to Real 做好,然后把在模拟器里面训练的模型 deploy 到真机上面,期待真机能够去实现跟在模拟器里面相同的或者相似的表现。

但是如果我们按照一个完整链条来看,事实上机器人应该是在真实的环境中去训练自己,最后在真实的环境中来应用自己。所以从这个视角上来看,今天其实不管自动驾驶也好,还是机器也好,在整个的研发范式、技术范式上面其实都还没有走到终局。

大吉:他们是在技术的架构上是相似的,但是训练的范式是不同的?

余轶南:在模型的架构上来讲,其实自动驾驶和机器人本质上并没有太大的区别。但是核心的区别是在于在两种不同的场景里边,你如何得到这个东西。也就是说在训练的角度来讲,这两个领域其实今天有巨大的差别,因为对于自动驾驶来说,其实你很难去在模拟器里面来去进行训练。

所以大家更多的是在真实的环境中去采集数据去进行这个 Imitation Learning(模仿学习),然后在  Imitation Learning(模仿学习)基础之上来再去加入很多人工的工程算法,使得这个智驾系统能够比较可靠的去运行。

但是对于机器来说,其实大家很难去采集真实的数据。大家可能很多时候都是一部分真实的数据,再加上非常大量的模拟器里边的数据,一起来去学。这时候整个的闭环训练其实是基于模拟学习和强化学习,在模拟器里面完成的,所以这两种训练的范式和对数据应用的范式其实是有很大的差别。

大吉:那会带来产品落地上的什么差异呢?那机器人后面可以开车吗?

余轶南:这是一个好问题。我觉得不管是机器人也好还是自动驾驶也好,如果能够搞定 L4,那这个架构有可能会是一个通杀两边的架构。机器人本质上是在学习人,我们现在也是在做模仿人跳舞,模仿人做操作,那为什么不能模仿人开车呢?所以我觉得还真有机会,我们可以训练一个机器人去开车。

大吉:它不会有延时的问题吗?

余轶南:如果我们往未来看 10 年、20 年,我觉得算力总是能够满足的。

大吉 :如果机器人也可以搞定这些延时的问题,它就完全可以开车,那车就不需要自动驾驶。如果机器人它如果自己都已经可以实现开车,为什么车作为一个机器它不能实现?

余轶南:这是很有意思的一个话题,有可能跟我所从事行业的技术范式的天花板有关系。这里面会不会存在某种因为领域的不同,所以使得你的技术架构的先进性的需求不同?那我们会发现其实技术总是高维打低维,会有降维打击,所以这里边到底谁能够先碰线?坦率讲,今天还不好说。

大吉:那你觉得机器人与智驾相比高维还是低维?

余轶南:机器人肯定是比汽车更高维。因为机器人需要处理的复杂度,一个是本体的复杂度,第二个是环境的复杂,事实上是要高于汽车的。

大吉:今天大家在讨论机器人行业里的时候,其实并没有更多的讨论到算力是瓶颈,可能在智驾里会讨论到算力是瓶颈,但是今天机器人行业里都讲瓶颈是数据。

余轶南:我觉得是因为大家还没有开始干产品,大家今天都还在做 demo,还在用一些非产品化的一些计算平台在做。

大吉:如果说没有足够的数据,他就做不出足够好的产品,而产品不交付给用户,他也没有足够多的好的数据。

余轶南:其实什么是足够好的产品?这件事情实际上是可以被定义的,这件事情其实背后并不是说你一定要有天花板级的技术,在我看来今天所有的技术包括 VLA 什么我觉得都不够好,这里边其实仍然没有解决关键问题,对于 corner case 和未知情况的学习和处理能力,在这样的技术架构里面并没有体现。

赵哲伦:因为它没法对用户产生价值,它现在还是停留在视频领域。

事实上,我们是有很强的算力焦虑的。因为本身机器人需要移动,这件事就挺费电,而机器人身上能放的电力也有限,所以很大程度上导致我所能放的算力确有限,毕竟算力越大它的功耗就越高。这就是为什么轶南说大家目前还没有去做产品,所以才不会考虑算力的问题,因为我们但凡做产品了之后会觉得算力还是核心问题,研发同学都想要最大的算力。

但问题是这个算力背后,一是说这里面的散热怎么解决,二是说这里面的供电怎么解决?这些问题都是实际产品化过程中会碰到的问题,有些机器人现在它可以驱动大算力,但都要插着电源,那这个产品交付的时候怎么可能插着电源呢?

大吉:所以你们的理解就是先做一个用户愿意购买的可交付的产品,同时这个产品的完成它不需要经过现在大量的数据训练,但交付给用户之后他就可以得到很多的数据。就跟我们原来刚去开始用 L2 级的这种高速的辅助驾驶一样。

赵哲伦:差不多。我觉得今天要先区分好一个用户的场景。我觉得我们这个团队也避免不了要自己做很多数据的采集和训练,但是这个跟用户的数据闭环比毕竟还是有限的。所以先确保用户的场景百分之八九十的好用,随着我们这个东西确实能进到用户的生活里,能进到他们的家里之后,跟用户形成闭环才是真正的价值。

大吉:今天智元机器人和小鹏汽车的创始人何小鹏都提出了机器人从 L1 到 L5 的不同的分级,你们觉得机器人可以沿用自动驾驶的这种分级吗?或者说现在机器人行业里会对这样的分级有共识吗?

余轶南:我觉得还没有,而且对于自动驾驶来讲,今天其实一直停留在所谓的 L2 和 L2 +,所以这个分级本身我觉得可能还是值得商榷的。但是这个理念我认为是值得去借鉴的,因为实现一个通用机器人并不太可能一蹴而就,这个事情的难度和复杂度可能远超我们的想象。但是在现阶段,尤其是在未来三年时间内,有没有机会把能够让用户先用起来的产品做出来,这个是重点。

大吉:为什么是三年?

余轶南:因为我觉得三年是一个可期待的一个时间点,其实三年你可能也做不了几代产品, 可能两到三代产品,所以今天你可能看到的最有潜力的技术,有可能在三年以后能够把它实现完整的产品和工程化。

大吉:但是我们再来盘这件事情,如果结合你刚才说的,三年之后我才能够有一个大概可用的、解决部分问题的这个机器人。但是作为机器人,如果它发展速度比车快的话,它甚至还有可能自己开车。那就是五年之内你觉得都到不了 L4?

余轶南:我的确对这件事情有点悲观。我觉得这个时间可能会比我们想象的更久。

大吉:你更相信机器人开车会比汽车实现自动驾驶更快实现?

余轶南:我觉得不能排除这个可能。

大吉:那你如果有一天出现的话,你认为谁会先做到,特斯拉吗?

余轶南:有可能,因为他在两边都有非常强的布局。

从汽车到机器人的产业链思考

大吉:汽车行业里面有非常成熟的供应链,产生了头部的供应商公司。但今天我们去回顾机器人行业,好像整个行业没有高度标准化,缺乏成熟的分工机制,似乎整个供应链还在非常早期?

余轶南:如果我们把机器人拆解开来去看这里边其实分几大部分,第一个就是整个的传感器、计算平台和电池,这些部分其实在过去十年时间里被整个的自动驾驶和电动汽车行业提高了非常多。但是它整个的产品规格和设计都是面向汽车行业的,所以我们要把技术和产品拆开来看,技术是有希望和机会迁移到整个机器人行业。

然后就是整个的关节模组,这个是对于机器人行业来说比较特殊的。过去全球每年在这样的电机或者这样的关节模组上的出货量可能就是几十万这个级别。一个机器人少则十几个关节模组,多则大几十个关节模组,即使全球只出 10 万台机器人,这样的规模其实也远比过去全球在工业自动化上所使用的电机和关节模组在量上要大得多。

所以说这是一个爆发力和规模要远大于过去产业链所承载能力的一个市场。我觉得在关键模组这个方向需要重新去构建产业链。今天你在市场上事实上还比较难去买到真正具备性价比的产品,但是我觉得随着整个机器人产业链出货量的上升,这部分的成熟度会很快起来。事实上,中国在技术能力层面具备完整的产业链能力,只需要在产品上把它做重新的整合和规模化的生产。

赵哲伦:我们刚从整个大湾区逛了一圈回来,我们看到过去国内智能电动车行业整体发展培养了很多能力很强的供应商。而智能电动车它很多的零部件确实很大程度都可以复用到机器人,目前只需要进入产品化的过程。

同时,这一轮发展中,我们看到了许多原先汽车供应商都建立了机器人相关的一个团队或者部门。一方面他们在智能电动车这个产业里面已经有确定性的竞争之后的位置,能有很好的经营现金流,另一方面他们也会投资到一个更远的,相对来说更宏大的一个事情。所以我觉得,今天中国的整体产业链还是非常有潜力。

大吉:目前国内的机器人公司大多数都是自己做软硬件一体,很少有只做本体的公司,不像很多汽车公司在智能化上直接找成熟的供应商合作。行业需要 Physical Intelligence、 Skild AI 这种纯做大脑的公司吗?你们觉得机器人行业里面会出现一些软件的供应商吗?

余轶南:今天还很难判断,我觉得今天机器人行业有点像春秋时代,春秋时代的特点是百花齐放,百家争鸣。不同的企业或者不同的团队,大家都会有自己的不同的思考,而且相互之间会去找差异化,在市场上会去讲不同的声音。但今天也很难去判断哪些观点是能够最终胜出的,因为这个产业本身就处在一个高度的不确定性下,但是随着这个产业实践的增加,我相信有几个点。

第一个点是会产生最佳实践,最佳实践产生了以后,会有很多的公司会来去效仿,然后在效仿的过程中可能会产生新的产业的分层和新的产业的格局的诞生,所以我觉得今天这件事情还很难讲最后的结论,但是我觉得趋势会从一个无序到有序,然后到分层。其实我们看很多的产业链,它其实都会经过这样的一些过程。今天我们讲汽车有主机厂,会有 Tier 1,会有 Tier 2。但是如果你倒退 50 年去看,你会发现这个产业的状态也是百花齐放。

就这些东西都是在产业的高度高速的这种变动中,大家都希望在这个产业里边有自己的一个身位,相互差异化去竞争所形成的一种临时性的一种现象,它是产业没有形成一个成熟稳定的一个状态。但一旦成功稳定的话,其实大部分的产业都会做分层,原因是分层带来经营效率的提高和专业化的分工。但当产业有巨大的变化的时候,往往垂直整合会带来更好的效率。

大吉:那会出现数据公司吗?

余轶南:数据,这是一个 forever 的需求。数据这件事的价值其实来源于两个,一个是数据本身,第二是数据标注中所蕴含的——本质上是人的 know how 和人的知识。那今天的话,我觉得对于机器人行业来说,其实跟自动驾驶行业会很类似,而且今天自动驾驶行业里边做数据标注的这些公司也都在往机器人领域靠。

大吉:自动驾驶行业出现了两种创业路径,一种是直接做 L4 robotaxi,一种是直接做 L2 的量产交付方案,但目前我们也看到大量的这种做 L4 的公司,最后变成了供应商,为厂家来做 L2+ 的量产交付方案,在你们看来这件事情会影响你们对于机器人创业方向的判断吗?

赵哲伦:特斯拉当年推出的 Autopilot 1.0 和 2.0 ,其实是个 LCC,就是车道保持。当他拿出这个东西的时候,L4 公司都觉得是个垃圾。但事实上这个东西真的奠定了它的早期的 innovator。

我觉得这个事情奠定了特斯拉在智驾这个战场上和 L4 公司的胜局,他真的把一个东西带到了用户的生活里,逐步地交付成一个 FSD,但是这件事情实际上是由不断地落地来组成的。今天机器人也是一样,一定要做一个通用的完美的,我并不觉得这是一条可行的真实世界的路径,但是怎么样让它真正的先进入到用户的生活里,或许只能解决一小部分问题,而且也能解决得比较好,我觉得这个是比较重要的。

余轶南:大家可以去参考一下汽车的发展史。事实上对汽车领域来讲,整个的功能安全、信息安全事实上也是最近 20 年兴起的,但是整个汽车工业已经存在了 100 多年。那问题就是过去的那 100 年时间,这个产业到底发生了什么?所以在事实上对于汽车来说是有很长的一段时间,其实也没有这些法律法规标准,那大家通过什么样的东西来去完善这些事情呢?其实本质上就是靠不断的实践,通过一代一代去完善产品,然后产品在用户的使用过程中遇到问题,然后在下一代的产品里边去想办法去解决。

因为如果你不解决,你的企业就会在竞争中被淘汰出去。所以它是在一个市场竞争这样的一个循环中,不断完成了整个汽车工业的安全和可靠性的提升。当这一水准达到了一个较高高度时,这时候大家反过来去总结我们过去做了哪些有用的方式,比如说我们在功能安全上面,在这些硬件层面、机械层面,我们做了哪些工作使得产品的可靠性变强?大家把这些东西总结出来形成了一些惯例,这个惯例汇聚为行业共识,并最终形成了所谓的国际标准和行业标准。

今天对于机器人来说,其实并没有哪一家已经开始去做这样的积累。因为整个行业,2024 年满打满算的全球出货量也就几万台,出货量的规模太小,而且这个市场今天还没有形成一个有序、有效的竞争,因此它还没有开启一个真正的基于产品竞争和市场筛选而持续迭代的过程。

大吉:对于你们来说,最可怕的对手是谁?

余轶南:我觉得不同阶段有不同的竞争的格局,当前这个阶段我用一个词来描述叫做「菜鸡互啄」。今天并不是说大家不好,而是说今天这个竞争的维度其实还是比较低,大家今天在想法上还会比较发散,没有形成那种特别内卷,那种很强的竞争态势,所以我觉得可能在一两年之内的这个时间,大家属于这个产品的尝试期和摸索期,所以在这个阶段大家可能都不是那种正儿八经的正规军在打仗,大家都是先相互的试探和尝试,当有产品被市场所真正的接受的时候,会形成所谓的行业共识,这时候的话可能会有一波新的有实力的玩家会进入。

我觉得今天还没有完全进入到那种打仗的状态,原因是今天没有仗可打,整个市场其实很新。

赵哲伦:我分享一个很有意思的例子,事实上我们第一代机器人的量产时间比我们最早定的要提前了差不多半年的时间。

大吉:半年这么多?

赵哲伦:至少是四个月。我们原来预期其实是明年年初。我们确实想看看团队的极限在哪里,我们到底能冲到什么状态,然后能不能很快的完成商业化。

大吉:所以你们希望快速地到市场上去试错?

余轶南:对,我过去在做产品的时候,习得一些经验或者说某种认知。比如说做成本这件事情,什么样的成本是一个有竞争力的成本,不是你比别人卖得便宜,是你的售价比你的竞争对手的 BOM 成本还要低,就这种情况下你是可以杀死你的竞争对手,这个才叫做拳拳到肉啊。如果你仅仅是比别人便宜,那别人也会降价,所以你要干的事情就是不出招则已,一出招就是让你的竞争对手根本就跟不起。

大吉:如果你今天希望以后成为这样的一个位置的话,类似比亚迪、特斯拉都有着非常强的垂直供应链一体的能力,这个也是你们接下来会考虑的事情?

余轶南:我觉得一定需要考虑的。

为什么选择家用机器人

大吉:你们为什么选择了家用机器人的场景?

维他动力首款机器人设计稿

赵哲伦:我们一开始看待机器人场景的时候,天然地看到了全然不同的两类场景。我们把它叫做一个是 outdoor,一个是 indoor。其实今天在「门内」场景中,包括家里的扫地机以及商场都有的清洁的机器,其实你会发现它对移动能力的诉求并不是特别高,所以它基本上采用轮式底盘就能完成多数移动需求。如同大家往往所说,这个世界是由人来构建的,其实人来构建的就是室内的环境,所以室内场景往往对双手操作要求比较高,机器人双手操作的高度、尺度是应该跟人的上肢的这个尺度是比较接近的。

那如果我们到 outdoor 环境,在户外环境中,其实你会发现对移动的要求就非常高。它一定会有台阶,一定会有各种下坡、上坡,坑坑洼洼的路面。但在户外往往你对操作要求又没那么高,你并不需要在户外操作什么特别复杂的东西,所以我们天然觉得会有两类场景。

这两类谈场景其实都有产品化的可能,而且如无必要不增实体。它完全可以最小级到一个最小的硬件单元,完成一个确定的任务。那如果到户外层面来说的话,我们第一代产品是一个四足的机器人,它拥有全地形的移动能力。同时我们还会给它赋予整体的 AI,让它能完全自主的移动。过去我们公司把所有能买到的四足都体验了一番,其实最大的问题确实是它的易用性问题——都需要拿遥控器来控制,这种没法带来一个好的自然交互、自主移动的体验。

大吉:那你们把这样的机器人定位于 L2 吗?

赵哲伦:这肯定是到 L2 级以上了。其实我们在内部也做了整体的基于移动的 VLA 的算法,它能很好地记住许多地方的位置,然后建立语义地图,最终完全地进行自主移动。

现在已经有一些基础的 demo。我们办公室门口有一个「瓦力」,我们现在的原型机能从我们办公室任何地方出发,你跟他说帮我找一下「瓦力」,然后他就能找到。我们实际还在往后延伸,比如我们楼下有一家瑞幸咖啡,到楼下取咖啡,他再自己上来,这些完全都是可以完成的。这些都只需要它走过一遍。

大吉:你们觉得家庭会愿意去欢迎这样一个新的品类的东西?

赵哲伦:家用其实是一个非常非常大的场景,而且这个在我们的愿景里,我们觉得每家每户都一定是需要这样一个机器人的,我们其实会把问题拆成两部分,一个物理空间的数字化,一个这个空间的自主化。拿家来讲,其实家的数字化都没有被解决,很多人都有这样的痛点——还挺容易忘记自己家里什么东西在哪。家里的收纳本身是一个很大的痛点,具备一个家里移动能力的一个机器人。但它并不一定需要一个带着双脚在家里走路,双足并没有带来额外的优势,且它会带来一定的不稳定性。

但家里特别需要一个机械臂的结构去完成一些收纳类的工作,这类的工作其实以前你像通过扫地机的延伸也是很难做出来的,因为它的平面非常低。扫地机有带机械臂的结构,我觉得它是一个特别好的尝试。而扫地机的机械臂其实比今天机器人的机械臂要更加的柔和,更适合进家,但它问题是它太低了,所以它只能去做一些扫地机清障的工作,比如它在地面上把一个纸团、一个拖鞋放在一边,事实上没有办法完成家里的收纳。

大吉:那收纳是你们给家用机器人选的第一个任务吗?你在选择这个收纳这个任务的时候,你们思考的到底是机器人的能力能干嘛,还是说这是大家需求的一个痛点?你们怎么去收敛这个场景?

赵哲伦:我们这是两者的结合。就首先能干嘛来讲的话,我们觉得有一个简单到复杂的逻辑,就比方说同样是处理一个衣服,我们确实觉得就是说把衣服从衣架上拿下来,把它从一个脏衣篓上放进洗衣机里,这其实是比较简单的,我们觉得完全有机会能去做到的。但是你要说把它叠起来还叠的特别的整齐,这其实今天来讲还是比较费劲的。

但是说你要追求通用性,有的人要叠,有的要挂,叠的话,有的人叠的还不一样,有的家里叠的可能四四方方的,有的家里叠的可能偏长一些,这个就不一样了。目前看,部分场景已经能满足部分的需求了。另外的话,家里其实往往大家还容易想到一个,其实是我们可以叫容错率的问题。今天但凡处理的是一件衣服,其实容错率都还是比较高的,机器人不小心手抖一下,其实摔到地上你再捡起来就好了。如果你在家里,你要处理的家务是把家里的所有的碗都洗了,它不止复杂,它 fail cost 还很高,就它容错率还很低。那这样的问题其实会偏晚一些。

所以我们的判断是,其实找到两根轴,一根轴是简单到复杂,一根轴是容错率高到低,这两根轴之间它其实有它左下角的那部分,它是能先进家,且帮助只能解决一部分的问题。而且我们作为一定的尝鲜者或者说 early adopter 就已经说能接受这样一个商业化的产品了。

如果回到扫地机来讲也是一样,扫地机发展到今天非常的全,其实也发展了差不多 20 年的时间,我觉得是扫地机发展的 20 年前 iRobot 先带领了一部分人把扫地机带进家。其实我们也想成为那个 iRobot。

大吉:你认为你们先成为的是 iRobot,还不是今天的石头或者小米的扫地机?

余轶南:对,我觉得产业发展它总会有几波浪潮,今天应该勇敢的去做那个满足 Innovater 的人的需求的那个产品,我相信一个能够满足家庭多功能需求的机器人的市场规模应该是要比扫地机的大的。今天扫地机大概全球 2,000 多万,而中国大概 1,000 多万,所以我认为一个通用的家用机器人应该在几千万的规模上,但是今天的话,千里之行也得始于足下,扫地机器人经过 20 年的发展,有了今天这样的一个渗透率,那对于一个通用的家用机器人来讲,我相信可能时间会更快,但是它也需要一点一点能够爬起来。

大吉 :所以收纳只是你们给这个机器人设定的第一个场景,你们最终是希望它变成一个通用的、家用的机器人。那我们怎么去理解通用的家用机器人?机器人它会成为 AGI 吗?需不需要是人形?

余轶南:我觉得会成为 AGI ,但 AGI 它不需要是人形。我觉得它完成某一种任务的时候,它需要 leverage 某一种躯壳,它需要有一个身体来去承载。

赵哲伦:如果它但凡没有手,没有本体,它其实只能处理关于信息的问题。但另外这个世界的组成,你毫无疑问还有物质和能源,就说把一个东西从 a 点挪到 b 点,对吧?它需要能源。我觉得过去大家确实存处于 20 年的互联网大爆发里,大家觉得所有东西都是信息,信息能完成一切的事情,然后信息确实能很好的帮我们提高效率,带来了一些幸福,也带来一些烦恼。但我真觉得其实物理世界,这一波机器人带来物理世界革命的时候,会带来挺多的幸福的,因为我们的本质是活在物理世界里,你需要更多的是怎么样能活得更舒服,比方说出去玩的时候,你能帮你减轻负重,对吧?这个就是一个很好的舒服体现,在家里过周末的时候,你不用再去想我是不是得抽一个上午的时间出来收拾家务,而是你回家的时候每天都很整洁,这是我们觉得真正的那个幸福。

大吉:你们既然认为 AGI 它有一个实体,你也希望它最后变成一个通用的一个智能体。但是今天大多数厂商都在做人形机器人,你们排斥它长得像人吗?

余轶南:我并不排斥它长得像人,关键是它能做的事情,是不是令你觉得它足够有价值和意义,这个价值和意义跟它的形态没有关系。举个例子,比如说像对于在家里边,其实我是挺排斥人形的。但是如果是在网球场,我是很喜欢一个人形机器,而不是一个网球发球机。

基于这样的一个核心的原则,你反过来去设计产品的形象会比较合理,而不是说从技术的角度出发,先去尝试定义一个什么样的形态,然后再把它应用在什么样的场景。

大吉:那回到你们的家用机器人,你们希望它在家中是一个什么样的角色?如果机器人他今天做好所有的家务,像人类一样操作,我家里可以不需要有这些洗碗机、洗衣机等家电,我的家还可以变得更大。你们怎么看待这种观点?

余轶南:这里面还有个效率的问题,就是它做这件事情是不是效率够高?尽管可以工作 24 小时,但它可能洗碗不见得能洗完,就算他洗完碗,可能还要再去洗衣服,你会发现它的劳动效率还是太低。所以可能一个更好的想法是看这些机器人有没有可能充分地利用家电?

大吉:那就是你设想的机器人的未来,它在家中并不需要无所不能。那为什么你们不先做这款家用的机器人,而是先做一个户外的机器人,为了更快好落地?

余轶南:所以这是机会,这里面有还是有很多的值得改进的地方。

赵哲伦:我们一直自己评价,我们把很多学术上的偏原理性的技术转化成工程化的技术,落地成产品,这是我们这家公司的使命。过去在 3 ~ 5 年的时间里,对于移动型的技术在学理上的讨论非常多,所以今天在障碍物识别预测、感知环境等方面已经有很好的积累。事实上,在人的行走环境里,包括自然环境里,其实它都能有机会去做好一个自主移动的产品。今天我们并不在乎它移动控制的是轮还是四足、两足或者轮足之类的不同结构,它本质上它怎么跟人进行交互,怎么自主去移动是它最核心的事情。

另外一个家用机器人,它本质上的课题是自主操作。但怎么使得它按照人的需求去进行操作这件事情在原理上的讨论也就是这两年才开始热起来。但如何有机会将原理转化成工程化技术,我们觉得两年内完全有机会。但今年不行。此刻你要说转化成一个真正进家的产品,我们觉得时机还没到。

大吉:这个时机的缺口是什么?

余轶南:现在其实我们看到市场上包括像石头和追觅已经有了相关的产品。我觉得是好的开始,是进步的源头,不管它今天的能力怎么样,他至少是一个勇敢的尝试。因为我觉得基于这样的产品,其实你能够对场景、对于技术有更多的理解,所以我们这样的一款产品我们会拿过来试一试。

大吉:所以像这种带机械臂的扫地机会是你们的竞争对手?

余轶南:我觉得竞争对手可能谈不上,但是他一定是一个你很好的学习对象,大家会对这样的一个形态抱有非常大的期待,尽管它目前或许只能捡纸团、捡拖鞋。而这个产品设计的很有意思的一个点是,它实际上有个用户遥操的接口,用户可以通过手机来去遥操这个机器。这个设计我觉得很好,因为它无形中帮助企业采集了很多数据。

赵哲伦:回到前面那个操作这个事来说的话,我觉得今天软硬件其实都还是有一些卡点在的。硬件层面的话其实我们也是调研了大部分做机械臂的,甚至是给机器人做机械臂的这些东西,其实我们觉得现在机械臂进到家里还是比较危险的,就这个硬件本体上来说,如果你实际看到的话,这个东西它很重、很大,且实际上它的负载能力并不强。

拿原理性上来说的话,其实我们会看到类似于 1X Technologies 它那个绳控的技术,相对来说我们觉得它是一个更适合进家的一个机械臂的控制技术。因为它能更好地把这个机械臂的整个驱动往躯干里放,机械臂就能变得更轻。目前大多数机器人所用的机械臂,它的电机全长在它的胳膊上,导致胳膊就非常重。对它来讲,要像人一样拥有关节自由,可能需要在一个关节上得放两三个电机。

大吉:另外就是我们今天也缺少触觉的数据。

余轶南:今天其实已经有相关的一些初步的一些方案,比如说今天有电容的触觉传感器,或有视触觉的传感器,这些方案其实都有它的合理性和可行性。但是今天其实因为没有大规模的量产,所以技术的产品化成熟度还不够高。这里面包括技术的工程化的细节以及成本的优化以及可靠性,大规模的批量化生产以及交付,这些链条今天还没有被构建起来,所以我们相信随着像一些局部场景下的一些机器人被大规模的应用和量产,相关的这些技术也会走向成熟。

大吉:如果是你们,我就作为一个用户,你怎么说服我购买一个家用的机器人?

余轶南:其实很有可能不是因为功能和有用性去 trigger 了,用户去购买产品很有可能是因为好玩。你想其实手机跟电脑的普及,并不是因为办公,游戏和娱乐性的东西在里面占了很大的比重。但这些原因促使整个产品的出货规模在一个比功能性价值更大的 skill 上去落地。所以我觉得机器人一定是得既有用又有趣,而且不管什么形态,如果你没有趣,这个产品可能会很难被大众所接受。

大吉:那你们之后会推人形机器人吗?

余轶南:我觉得会。

机器人走向通用或是场「无限游戏」

大吉:假使这个机器人成功了,你们卖得也挺好的。那大家都可以效仿,或者保持不同的造型,这样会不会去影响这个硬件的标准?

余轶南:我觉得硬件的标准不是被定义出来的,而是被行业共识出来的。共识是在于,可能大家都用相似的技术架构,这种硬件在整个产业供应链上面有更好的价格,所以大家自然而然会收敛出一个行业标准。所以在这种情况下,这个标准不是你想去定义就能定义的,而是被头部的领先的公司所引领出来。

大吉:如果维他动力成功了,你觉得什么能证明你们的成功?以及维他动力成为一家什么样的公司?

赵哲伦:我觉得 100 万台机器人进入 100 万家庭,这是第一步。

余轶南:我觉得这是一个可能长达 50 年甚至更长周期的一个赛道,像我们这一代人可能都不能完全去实现它。我对这个产业的定义是今天处于一个一九零几年时整个汽车产业的状态。所以我相信这个产业会迎来一个 maybe 100 年的一个宏伟浪潮。我觉得这是一个很令人激动的时代,你有机会创造一个全新而且巨大的产业,同时这个产业它对世界的改变和影响可能会远大于过去二三十年其他的技术变革。

大吉:所以在你眼里 50 年之后才能谈成功吗?

余轶南:甚至可能这是一个无限游戏。

大吉:那 AGI 什么时候会出现?

余轶南:我不知道。其实你看我很少去谈论 AGI 这个词,因为这个词根本就定义不清楚,我们总会发明一些新的概念,让人们有一种憧憬和想象,但事实上没有任何人能去定义这个概念的含义是什么。你还记得我们过去会经常讲一个词,叫做图灵测试。这个词现在已经没有人讲了,因为它已经被实现了。今天你会接到一些诈骗电话,你可能都分辨不清楚对方到底是谁,所以说明图灵测试事实上已经成功。当我们每次讨论这些概念的时候,你就会觉得其实没有分级,无从着力。但是当你每次讨论具体的产品以及具体的技术实现的时候,你就会发现你事实上是脚踩在土地上,你会觉得很有力量。

大吉:那我们讲一个最基础的概念「机器人」,你觉得这个大家是有共识吗?

余轶南:甚至有些时候我觉得也没有。

赵哲伦:对,你看我们公众号叫《Vita 机器人》,我当时最早在写这个 Vita 机器人的时候,我都有点担心大家觉得它像是客服机器人。因为过去十几年互联网的发展过程中,把客服机器人也定义成一种机器人,但这东西完全不 embodied 的,它只是一个聊天窗口的一个对话。

余轶南:对,就当某些概念它的范围过于宏大的时候,其实你就很难去抓住它。

大吉:我想到一对词,「四足机器人」和「机器狗」,大家的理解好像就是不同的。

赵哲伦:我们定义成四足,不是为了让它长得像一条狗,而是为了让他有充分的在人类社会里的自主移动能力和全地形的能力。因为今天事实上人类社会的包括台阶、坑洼不平的那些路面、上坡下坡等场景中,四足更具稳定性。

而其实我们在思考这个四足的腿应该多长的时候,我们也并不是考虑说它要跟一只狗一样长。 对于四足来说,我们要考虑的事情是还是场景。事实上按照整个能耗来讲,身体越低,重心和能耗都会更低,但是它得至少能过台阶。所以我们测算了现在市面上标准的台阶高度差不多在 15 公分,最高的是那种电梯的台阶,有 24 公分。这个数据影响了我们如何设计四足腿长。

设计我们身子的尺寸呢?我们也不是根据一只狗,其实我们是看怎么样把它的体积和它的长宽高设计成一个与家更和谐的比例,因为毕竟你需要在家中去放这么一个东西,甚至你也可能要在后备箱的空间中放。所以我们所有东西都是按照场景来定义的。

大吉:那你们觉得户外的四足机器人卖得更多,还是家用的机器人卖得更多?

赵哲伦:我觉得有时间阶段问题,最终家务机器人的应该会进到千家万户,但户外的可能是根据不同的家庭的出行习惯来决定。

机器人和人之间的关系可能也会有很大的「方差」

大吉:你们觉得人类跟机器人最后会是一种怎样的关系?人类需要非常信任机器人吗?

余轶南:我觉得是一个非常有意思的问题。最近有个电影我特别喜欢——《电幻国度》。这个电影是讲,一开始机器人是人类的工具,后来机器人造反打败了人类,而人类又发明了某种技术反击,最后把机器人圈养在一个空间里头。故事的最后是机器人的自我解放——形成某种新的社会游戏规则,来与人类和平相处。

我觉得这个电影有意思的点在于它很有可能会是未来某种现实。当新的一种产品或者某种东西它足够强大的时候,它很有可能会脱离人的掌控,尤其是 AI 的东西。余凯讲的一句话我觉得很有道理,他说人工智能的产业革命是人类最后一场产业革命。

所以我觉得往未来 50 年、 100 年去看,我觉得有几个主题其实很有意思,第一个主题就是人类如何发展机器人来造福于自己。第二个是人类如何避免被机器人所反败为胜,或者机器人脱离自己的掌控。第三个主题可能是人类和机器人该怎样和谐共处。

大吉:我觉得人类和机器人的关系这个话题之所以令人紧张,在于人工智能与机器人的迅猛发展可能会让资源集中在更强大的人手里。

余轶南:你会发现其实有时候并不是说因为某种东西去主动夺取了人类的权利,事实上很多时候是人类主动放弃了这个权利,让渡了这些权利给了机器。比如说我们微博上有 AI 助手帮助你去回复,这其实就是你在让渡你的话语权,尽管有时候 AI 助手回复的内容观点跟你的观点是相反的。你不断地让渡权利,它会越来越强,我觉得这个大概率会是一个事实。

所以,如果当你有这样的一种判断和观点的时候,其实你应该做的是做一个负责任的企业或者组织,然后判断你是否能够在某些宏观的层面来影响你自己的产品,使得他某种意义上可能不是避免,而是通过减速来推迟某些事情的发生。其实你看有很多产品设计的很好,它让人不要过度沉迷,比如说像微信做的这么极简,它背后有类似于这样的思考和克制。如果你做一个机器人公司,我觉得也会是类似的,那你能不能在某些事情上面有自己的自制力,克制自己为了跟竞争对手竞争,而去夺取用户的时间和夺取用户的 attention。

大吉:你让我思考一个新的问题,这个问题不是人类应不应该信任机器人,这个问题是,作为消费者的我以后应该怎么去信任这些机器人公司?这就像今天我们去看 OpenAI 团队的几次分裂都是来源于对 AI 的价值观的分裂。

余轶南:没错。企业从自身的角度来讲,你是否能够做到对于这种文化、理念的认识以及执行。我觉得很多时候文化这件事它不是虚的,事实上它会渗透到你所有的决策和行为里,比如说当你看到你的用户很沉迷或者经常使用你的东西的时候,你是不是在你的产品设计上其实希望让用户少用,或者当用户主动地把某些权限交给你的时候,你是不是能够拒绝。

你不拒绝可能会给你企业带来更大的利益,但是如果你拒绝你可能会真的对用户和社会更好。这个时候我觉得真的会很深刻地体现企业价值观,而当你发现一个企业不再去讨论和判别这些价值观,只对于产品和技术讨论的时候,这个企业一定会走向某种极端。

大吉:你们内部探讨过这些问题吗?你其实内心是想要做一个像微信这样的一个产品,其实是带一点点克制的。

余轶南:我觉得是的,克制。

赵哲伦:完成它该完成的事,不要多说废话。

大吉:如果你们想在这个机器人上面写一句话,价值观让这个机器人不能违背,比如说不能伤害人类的一句话会是什么?

余轶南:我觉得这个表述不好,像是你对他的一种请求或者一种祈求,你会对什么人来说你不要伤害我?我前一段时间其实跟人聊到一个话题,就是机器跟人的关系到底是什么?其实是可以回归到人和人的关系。如果你放眼过去 2,000 年,会发现人和人的关系其实有巨大的高低落差之分。有人可能是奴隶,有人可能是帝王,有人是老师,有人是学徒,所以人和人的关系事实上就是有巨大的方差。人和人天然不是平等的,尤其是在过去,现在可能会好一点。所以我认为机器人和人之间的关系可能也会有很大的方差。

有的机器人可能是工具,甚至是奴隶,但有的机器人它可能会有自己非常强的专业知识被人尊重,所以这里面它是个选择题,它不是一个一概而论的定义。对于我们来说,我们希望选择哪样的东西来去创造它?如果在这样的一个话题下,我们去看这个问题的话,我们希望我们做出来的机器人是人类的 partner,这个 partner 的定义是说它跟人类的之间的关系是相似的,但是不独立。我觉得一个很重要的目标是机器人能让人类本身变得更好,让你自己的生活变得更好,让你自己变得更好,而不是让你沉迷于某些事情。

大吉:那会有明确的这一句话吗?

赵哲伦:我们用马斯克刻在 Roadster 跑车上的那句话作为收尾 —— Made on Earth by humans,就是他永远要记住它来自于地球,并且由人类来创造。

(转自:元璟资本)

 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
浙ICP备19001410号-1