文章作者、来源:AI前线 最近,人形机器人迎来了从“奢侈品”到“白菜价”的历史性转折。一年前需要花近百万元排队预购的工程样机,如今在二手网站和拆机市场上,以“5 万元一车”的价格打包清仓。单价上,甚至有的比高端旗舰手机都便宜了。 宇树 G1 降至 8.5 万元起,消费级入门款 R1 Air 仅售 2.99 万元,而松延文章作者、来源:AI前线 最近,人形机器人迎来了从“奢侈品”到“白菜价”的历史性转折。一年前需要花近百万元排队预购的工程样机,如今在二手网站和拆机市场上,以“5 万元一车”的价格打包清仓。单价上,甚至有的比高端旗舰手机都便宜了。 宇树 G1 降至 8.5 万元起,消费级入门款 R1 Air 仅售 2.99 万元,而松延

人形机器人价格大跳水,比iPhone还便宜:一场关于生产力而非形态的产业竞速

2026/06/09 17:51
阅读时长 21 分钟
如需对本内容提供反馈或相关疑问,请通过邮箱 [email protected] 联系我们。

文章作者、来源:AI前线

最近,人形机器人迎来了从“奢侈品”到“白菜价”的历史性转折。一年前需要花近百万元排队预购的工程样机,如今在二手网站和拆机市场上,以“5 万元一车”的价格打包清仓。单价上,甚至有的比高端旗舰手机都便宜了。

宇树 G1 降至 8.5 万元起,消费级入门款 R1 Air 仅售 2.99 万元,而松延动力的 Bumi 更是跌至 9998 元,比一台高配 iPhone 还便宜。与此同时,中国人形机器人的供应链国产化率已突破 90%。根据摩根士丹利最新发布的报告,2025 年全球出货的 13000 至 16000 台人形机器人中,约有 90% 来自中国制造商。

如果说现在的 AI 已经开始充当数字世界的生产力,那么迅猛发展的机器人有望成为物理世界的生产力。在产品价格“一日千里”的狂热局面下,一个问题开始浮出:未来是否只需要人形机器人?

Gartner 的调研数据给出一个冷静的事实:人形机器人的“现实比例”仅为 1:60,约 98.36% 的受访客户仍处于探索阶段,而实际投入部署的仅占 1.64%。“从实用或者理性的角度来说,我们认为未来的机器人未必要和人长得一模一样。”Gartner 研究副总裁高挺表示。

近日,我们采访了高挺。他在对话中指出,虽然人类世界是按人的体型设计的,但人体结构并不一定是机器人的最佳形态。成功的机器人应该改良人类形态而非简单复制。例如,亚马逊测试的 Digit 机器人膝盖向后弯曲,能比人更高效地在货架前下蹲;1X 的 Eve 机器人则采用轮式、自平衡底盘,在平坦的室内环境中提高移动效率。高效的机器人外形可以是犬类、轮式或完全根据任务需求设计的全新形态,这些形态通常比人形更稳定、成本更低且速度更快。

“不要被‘人形’外形限制,应优先寻找能快速交付价值、产生收入的特定垂直应用场景。”除此之外,高挺从技术、硬件、应用场景和现实挑战等多个维度,梳理了今天机器人产业的真实图景。

今天的机器人能做什么?

“短期内,应该关注的不是‘机器人是不是长得像人’,而是‘机器人能不能在一个非常明确的场景里面稳定完成任务、降低成本、减少人力依赖和提升运营效率’。”

那么,今天的机器人能够做些什么呢?

“从现在已经跑起来的案例看,机器人长什么样其实不是最重要的。不管是仓库里的机械臂,还是汽车工厂里的搬运机器人,真正比较容易落地的场景都有一个特点:环境比较固定。企业最后看的是:这台机器人能不能把活干好,这笔账能不能算得过来,而不是它长得像不像人。”

高挺总结,现阶段更容易形成投资回报的机器人场景,通常具有三个特点:任务边界清晰、流程可以重复、异常情况相对有限。例如,工业线边物流、仓储搬运和部分服务流程,都可以通过现场改造降低机器人需要处理的复杂度。家庭场景则不同:任务组合更加分散,环境变化更加频繁,而且任何失误都可能直接影响人员安全。因此,家庭机器人不仅需要更强的模型能力,也需要更成熟的工程可靠性和安全机制。

大规模产业化的窗口期,机会在哪里?

“机器人正处于迈向规模化产业化的窗口期。”对于当前的机器人产业阶段,高挺这样定义。“目前,机器人已经在一些工商业场景里跑通了。尤其是在工厂和仓库里,一些重复频率高的工作,机器人已经可以替代一部分人工。所以资本对这个赛道非常关注,一些头部公司的估值也涨得很快。”

但是真正大规模的产业落地还没有发生。

特斯拉曾提出在 2025 年生产约 5000 台 Optimus 的目标。但在 2025 年第四季度财报发布时,Elon Musk 也承认,Optimus 在工厂里面只做了一些基础的任务,还没有形成真正意义上的生产力据悉,特斯拉第三代人形机器人预计年中亮相,要到 2026 年 7-8 月才会启动正式投产。

“机器人、尤其是人形机器人,实际落地和大众预期有挺大差距,这也是现状。”

在高挺看来,未来 2-3 年,人形机器人仍难以实现完全大规模商业化。“这些人形机器人可能会继续出现在工厂、仓储、汽车制造等相对固定的环境里,做一些重复性、低复杂性的工作。但更多是试点和小规模部署,而不是全面替代劳动力。相比之下,工业机器人、仓储机器人、服务型机器人以及一些面对特定任务的多功能机器人,这些产品的商业化路径反而更清楚。因为它们的任务边界比较明确,投入产出也更容易算,安全和流程相对容易控制。”

对于想购买机器人的企业,他的建议是:“第一,起点不是‘买一个人形机器人’,而是要从找高价值、低复杂度的任务开始。第二,要把机器人当作一个运营改造项目,而不是单纯的硬件采购。买来本体不能直接落地,还要考虑现场流程、空间布局、IT/OT 集成、员工协作等等。第三,先试点、再扩展,从一两个小封闭场景开始,拿到真实的生产力结果后再复制。第四,先考虑成熟的品类,比如 AMR、机械臂、协作机器人,然后长期追踪人形机器人的成熟度。”

“行业内常有人将当前具身智能的发展阶段类比为大模型早期:技术方向已经逐渐清晰,但规模化能力尚未形成。”高挺解释,这个类比有一定道理,但机器人的产业化难度更高。“因为它不仅受到数据和算力约束,还涉及传感器、驱动系统、电源管理和系统可靠性。”

“VLA 仍是重要路线, 世界模型正在加速融入机器人系统”

机器人能做什么、不能做什么,根本上取决于它的“大脑”,也就是机器人模型。

高挺表示:“VLA 是通用机器人模型目前比较成熟的技术路线。” VLA 即 Vision-Language-Action,指视觉、语言和动作。其中的“Language”部分,就是来自于大语言模型。它让机器人能够结合环境信息和任务指令,生成相应的动作。

“语言模型的作用是为机器人提供语义理解、常识和任务规划能力。例如,当用户说‘房间太暗了’,机器人需要理解这句话背后的任务目标,判断是否应该开灯。”

区别于以前的范式,VLA 模型是先有泛化能力,再一个一个场景去突破可靠性。逻辑正好反过来。“以前是先解决特定场景的高可靠性问题,然后再试图泛化。比如先让一个机器人把某个动作的可靠性做到非常高,然后试图让它学别的任务。但你会发现,这种方式很难真正实现泛化,你只能得到一个非常专业的机器人,换个任务就做不好。”

对于世界模型这类新的技术路线,高挺表示,“它提供了另一种思路:让系统学习物理世界中的状态变化和因果关系,并对动作可能产生的结果进行预测。它不一定依赖语言作为中间层,更强调对物理规律的建模。就像一个熟练的司机在开车时,看到前方有水坑,不需要在大脑里用语言翻译‘这里有水,可能会打滑,我要减速’,而是视觉直接触发了对车辆轨迹的物理预测,本能地踩下刹车。世界模型想解决的,就是这种不需要先翻译成语言、直接作出判断的能力。

不过,他认为,“今天,通用机器人和人形机器人的前沿路线仍然以 VLA 为主。世界模型虽然发展很快,但目前更多用于合成数据生成、仿真、评估和辅助规划,真正直接用于实体机器人控制的案例仍然比较早期。未来一两年,VLA 大概率仍然会是机器人动作模型的主体,但世界模型会逐步融入 VLA 系统,为机器人提供更强的物理理解、规划和预演能力。长期来看,更有可能出现的是 VLA 与世界模型的融合,而不是世界模型简单取代 VLA。”

高挺指出,目前 VLA 是最接近工程化落地的通用机器人技术路线之一。它距离像人一样灵活、通用的智能仍有较大差距,但在仓储、制造等边界相对明确的场景中,已经展现出较好的实用价值。未来一段时间,VLA 很可能仍然是机器人产业化的主要路线。

离不开的“灵巧手”: 机器人量产中的多重工程权衡

如果说模型是机器人的“大脑”,那么灵巧手就是它最重要的“工具”。“对于需要操作物体的机器人而言,末端执行器至关重要;在通用操作场景中,灵巧手尤其关键。”

高挺表示,不是任何机械手都能叫“灵巧手”,必须要有足够的自由度、能够进行精细操作,并且可以适应不同物体的抓取。

过去几年,灵巧手有了明显进步:自由度越来越高,价格越来越便宜。但高挺指出,“灵巧手的难点不只是增加自由度。对于工业应用而言,更重要的是在有限空间内兼顾抓取精度、力量输出、耐久性和维护成本。自由度最高的产品未必最适合量产,不同任务需要在性能和可靠性之间做出不同取舍。”

他举例说明:“一些海外高端灵巧手,虽然可以通过高密度的传感器堆叠和复杂的腱绳驱动,在自由度和自适应抓取能力上接近人手,但价格通常较高,动辄几万甚至几十万元,较难大规模部署。部分千元级或开源入门产品降低了使用门槛,但在端部力量输出、耐久性和感知精度等方面仍需进一步验证,现阶段尚难直接替代人工。”

数据鸿沟:仿真与现实、机器与人之间的差距

今天,机器人行业还面临多项挑战,核心瓶颈之一是高质量数据不足。“数据仍然是机器人走向规模化的第一道门槛。”

高挺表示,大语言模型训练用的是互联网数据,相对容易获得。但训练机器人的真实操作数据,比如遥操数据,需要付出不菲的成本。

既然真实数据难拿,能不能用仿真数据替代?这就触及了第二个挑战:模拟与真实的鸿沟。高挺指出,NVIDIA 正在重点布局仿真和合成数据工具链,通过在虚拟环境中训练、测试和验证机器人,扩大训练数据规模并降低真实世界试错成本。优点是成本低、易规模化。但有一个重要问题:模拟场景和真实世界总有差别。“仿真做得再好,和真实世界还是有差别。即便机器人在虚拟引擎中完成了无数次完美的动作映射,一旦面对现实中微小的摩擦力、材质或光影变化,在虚拟环境中学到的控制策略就可能失效。所以,仿真数据很有用,但暂时还不能完全替代真实数据。”

还有人提出:能不能直接用互联网上的海量视频训练机器人?成本低,数据也容易获得,但这就又有一个新挑战:Embodiment Gap(具身鸿沟)。简单说,人的身体和机器人的身体长得不一样,就像“眼睛学会了,手却未必学会”。因此,将人类行为视频或动作数据直接迁移到机器人上,效率会受到很大影响。

“未来更现实的路线不是‘只靠仿真’。”高挺说,“而是建立混合数据策略:以真实机器人交互数据为核心,包括遥操作、人工示教和现场运行反馈;再结合动作捕捉、第一人称视频等人类行为数据,以及仿真 / 合成数据,来提升机器人模型的泛化能力和可靠性。”

除数据外,成本也是机器人产业仍面临的挑战之一。“要让机器人进入到千行百业,它肯定是要足够便宜。”不过高挺也指出,中国的供应链是巨大的优势。“宇树科技最便宜的人形机器人 R1 Air,价格已经做到 3 万元人民币以下。虽然它还不能真正去工厂干活,主要还是用于科研用途,但中国机器人供应链的优势已经非常明显了。

价格在跳水,供应链在成熟,VLA 范式被验证可行,资本在涌入。但数据鸿沟、硬件瓶颈、成本难题,仍然像三道高墙挡在全面普及的路上。

对于这个产业,最理性的态度或许不是追逐“人形”的噱头,而是回归一个朴素的问题:这台机器,到底能帮人解决什么实际问题?正如高挺所说:“不要纠结长得是不是像人。”比这更重要的,是“有用”。而比价格更重要的,是价值。这场关于生产力而非形态的产业竞速,才刚刚开始。

完成预测交易,解锁大奖资格

完成预测交易,解锁大奖资格完成预测交易,解锁大奖资格

奖池高达 $500,000,100% 中奖!

免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 [email protected] 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。

MEXC×持牌券商:真实美股已上线

MEXC×持牌券商:真实美股已上线MEXC×持牌券商:真实美股已上线

用USDT买入真实美股,100%持股享分红权益,上线期间0费率