聚焦it 科技 英诺基金王晟:警惕具身智能三大虚火

英诺基金王晟:警惕具身智能三大虚火

今天想给大家泼点冷水,但目的不是冻死大家,而是让大家冷静一点。

大家可能都感觉到了,过去1-2年,具身智能和机器人是投资最火的赛道。一级市场里,它几乎成了每个投资人“必须参与、必须布局”的领域。

但是在这么热的情况下,一方面,我们要达成共识:热度是有理由的,这波赛道确实值得关注;另一方面,也需要思考:热潮背后,哪些是真价值,哪些只是表象。

具身智能的进化路线

今天我们谈的人形机器人、具身智能,其实代表了机器人产业的一次重启。

我们看到,最近有不少机器人公司,在排队上市或者融资。这一波,基本上是十年前那波机会的延续和升级。

上一波机器人技术,大家强调的概念是“灵巧、协作”,目的也是区别于传统工业机器人——它们的特征是什么?

用今天具身智能的视角来看,它们基本上是规则驱动(rule-based)的,解决特定场景问题,结构化程度高,泛化能力有限。它们有一点智能,但很少涉及多模态感知(CV)和更复杂的自适应能力。

而今天,我们的期待已经不只是灵巧和协作,而是机器能不能像人一样理解世界、执行任务,甚至最终走向AGI(通用人工智能),乃至更高层级的智能形态(ASI,super intelligent)。

AGI是什么?AI和机器能做的事,达到了人的水平,基本上可以完全把人替掉。再往后就是ASI(超级智能),机器的智能可能会超过人类,人类已经很难理解它的决策过程,就像猴子理解不了人一样。

从技术路径上看,早在2022年,我们提出了通向AGI的三个大致阶段。

先是信息智能,也就是现在大家看到的大模型;

然后是具身智能,本质上是强化学习,让AI不只会“想”,还要会“做”。

再往后,会出现新的智能形态,但具体是什么,还没有定论。

这几年大家争论得很激烈的一个问题是:为什么要做人形机器人?人形是不是最优解?

站在我们的角度,人形代表的是我们对机器人智能水平的最高期待,但它未必是当下最经济、最实用的形态,但它是上限目标,是我们心中那颗“皇冠上的明珠”。只要你能把人形机器人真正做好,说明你的技术能力已经走到了非常高的位置。

热度能持续多久?

很多人会问,这一轮具身智能,热度为什么能持续这么久?

如果看技术成熟度曲线,很多新技术在达到热度顶峰后,两三年内就会明显降温。

自动驾驶就是一个例子,2016年开始大量创业和融资,2019年左右进入低谷,市场情绪急转直下,甚至有极端声音认为,部分自动驾驶公司就该破产,半毛钱都不值。

但具身智能从2023年开始,到现在热度还在持续,比如银河机器人、智元机器人等。背后有几个现实原因。

第一,二级市场环境好。

大家现在热情很高,资金流动性也不错,上市窗口很大。很多人认为,这是“连续创新项目”的好机会。英诺也投资了一些相关项目,当初都是小几千万估值入场,现在赶上了上市窗口。

第二,国内公司长期难以对标美国,但开始出现突破。

过去,中国的机器人和具身智能项目,很难和美国项目的估值做对标。举个例子:中国头部的火箭公司,一级市场估值普遍在100-200亿元,而美国的SpaceX已经超过7000亿美金。

在AI领域也是类似情况:Anthropic最新融资估值3000–4000亿美金,OpenAI更是7000亿美金。中国的大模型企业虽然不低,但和美国对标公司相比,还有不少差距。

有意思的是,直到去年Q2-Q3,中国头部机器人项目的估值,不但不比美国便宜,甚至还更贵。但去年Q3-Q4,Figure(总部美国)一轮融资,就把26亿美金估值拉到390亿美金,涨幅惊人,相当于一级市场直接拉到小3000亿元。

这给国内的具身智能赛道,带来很大想象空间。

虽然现在市场很热,但我们也得冷静想一想:这波热潮会不会是一场泡沫?会不会像过去的元宇宙、O2O 或移动互联网那样,经历大起大落,甚至大规模衰退?

泼三盆冷水

在热度背后,我觉得有几盆冷水是必须要泼的。

第一,今天的具身智能模型,其实非常“窄”。

去年最热的VLA模型,通常只覆盖一项技能,或者少数几项技能的组合。如果你希望机器人什么都能做,那需要成百上千个小模型,而且无法泛化。

第二,高质量数据严重不足。

图像领域有ImageNet这样的数据集,有上千万规模的人工标注的高质量数据,但真实世界、可用于具身智能训练的高质量数据,到底有多少?这个问题没有人能给出一个确定答案。

第三,规模化训练能力门槛很高。

大模型的能力,很大程度来自规模。但真正有能力长期做预训练、掌握算力和数据资源的团队,非常少。多数公司只是基于现有开源大模型做微调,离底层能力还有距离。

哪些公司已经赚钱?

今天在具身智能领域,已经出现了三波主要的人才:

第一波,本体派,更擅长机器人“物理硬件本体”。

大多来自高校的机械学院、自动化学院或者机电学院。他们擅长机械和硬件,但对AI的理解有限。

第二波,CV(计算机视觉)派。

很多有名的老师都来自这个背景,他们的研究多是十年前的技术,几乎没有接触过大模型,但现在在具身智能里非常抢手。

第三波,自动驾驶派。这一波最受欢迎。

原因很简单——大家看到埃隆·马斯克先做了特斯拉,然后做了Optimus,就觉得这是一个成功路径,仿佛做自动驾驶和具身智能是一回事,所以自动驾驶背景的人在行业里最吃香。

但说到国内的自动驾驶企业,真正能像特斯拉那样做端到端的公司其实不多。别看有的企业讲得头头是道,但你要问:他们基因里真的懂AI吗?

最近几个月,从投资界到创业者,大家开始形成新的共识:大模型开始进入具身智能领域,有望催生新一波创业力量。

这里面谁能跑出来?落地是灵魂挑战。你的产品解决了什么实际问题?客户愿意让你的机器人进入他们的工厂、场景吗?愿意为它付钱吗?

我们至少看到两家曾经被视作明星的具身智能公司,因为无法真正落地,都被客户踢出了场景。再牛的明星公司,如果解决不了实际问题,也只能被淘汰。

我说一下大模型与具身智能结合后,哪些领域有机会赚钱。

首先,供应链类的公司是有收入的。

像我们投资的一些本体企业,去年的销售情况非常好,有些企业在短短两三年内,完整交付了上千台机器人,收入也相当可观。

至于具身智能小脑企业(运动控制等)——他们能落地吗?能赚钱吗?很难。

做“大脑”企业有一定市场,比如我们投的千诀科技,就有大量合作伙伴在用它的核心技术。

本文来自微信公众号 “铅笔道”(ID:pencilnews)

本文来自网络,不代表聚焦it立场,转载请注明出处:https://www.jujiaoit.cn/tech/26178.html

“GEO”到底是不是AI版的竞价排名?

下一篇

已经没有了

返回顶部