文章作者、来源：AI前线最近，人形机器人迎来了从“奢侈品”到“白菜价”的历史性转折。一年前需要花近百万元排队预购的工程样机，如今在二手网站和拆机市场上，以“5 万元一车”的价格打包清仓。单价上，甚至有的比高端旗舰手机都便宜了。宇树 G1 降至 8.5 万元起，消费级入门款 R1 Air 仅售 2.99 万元，而松延文章作者、来源：AI前线最近，人形机器人迎来了从“奢侈品”到“白菜价”的历史性转折。一年前需要花近百万元排队预购的工程样机，如今在二手网站和拆机市场上，以“5 万元一车”的价格打包清仓。单价上，甚至有的比高端旗舰手机都便宜了。宇树 G1 降至 8.5 万元起，消费级入门款 R1 Air 仅售 2.99 万元，而松延

人形机器人价格大跳水，比iPhone还便宜：一场关于生产力而非形态的产业竞速

来源：MetaEra

2026/06/09 17:51

阅读时长 21 分钟

如需对本内容提供反馈或相关疑问，请通过邮箱 [email protected] 联系我们。

文章作者、来源：AI前线

最近，人形机器人迎来了从“奢侈品”到“白菜价”的历史性转折。一年前需要花近百万元排队预购的工程样机，如今在二手网站和拆机市场上，以“5 万元一车”的价格打包清仓。单价上，甚至有的比高端旗舰手机都便宜了。

宇树 G1 降至 8.5 万元起，消费级入门款 R1 Air 仅售 2.99 万元，而松延动力的 Bumi 更是跌至 9998 元，比一台高配 iPhone 还便宜。与此同时，中国人形机器人的供应链国产化率已突破 90%。根据摩根士丹利最新发布的报告，2025 年全球出货的 13000 至 16000 台人形机器人中，约有 90% 来自中国制造商。

如果说现在的 AI 已经开始充当数字世界的生产力，那么迅猛发展的机器人有望成为物理世界的生产力。在产品价格“一日千里”的狂热局面下，一个问题开始浮出：未来是否只需要人形机器人？

Gartner 的调研数据给出一个冷静的事实：人形机器人的“现实比例”仅为 1:60，约 98.36% 的受访客户仍处于探索阶段，而实际投入部署的仅占 1.64%。“从实用或者理性的角度来说，我们认为未来的机器人未必要和人长得一模一样。”Gartner 研究副总裁高挺表示。

近日，我们采访了高挺。他在对话中指出，虽然人类世界是按人的体型设计的，但人体结构并不一定是机器人的最佳形态。成功的机器人应该改良人类形态而非简单复制。例如，亚马逊测试的 Digit 机器人膝盖向后弯曲，能比人更高效地在货架前下蹲；1X 的 Eve 机器人则采用轮式、自平衡底盘，在平坦的室内环境中提高移动效率。高效的机器人外形可以是犬类、轮式或完全根据任务需求设计的全新形态，这些形态通常比人形更稳定、成本更低且速度更快。

“不要被‘人形’外形限制，应优先寻找能快速交付价值、产生收入的特定垂直应用场景。”除此之外，高挺从技术、硬件、应用场景和现实挑战等多个维度，梳理了今天机器人产业的真实图景。

今天的机器人能做什么？

“短期内，应该关注的不是‘机器人是不是长得像人’，而是‘机器人能不能在一个非常明确的场景里面稳定完成任务、降低成本、减少人力依赖和提升运营效率’。”

那么，今天的机器人能够做些什么呢？

“从现在已经跑起来的案例看，机器人长什么样其实不是最重要的。不管是仓库里的机械臂，还是汽车工厂里的搬运机器人，真正比较容易落地的场景都有一个特点：环境比较固定。企业最后看的是：这台机器人能不能把活干好，这笔账能不能算得过来，而不是它长得像不像人。”

高挺总结，现阶段更容易形成投资回报的机器人场景，通常具有三个特点：任务边界清晰、流程可以重复、异常情况相对有限。例如，工业线边物流、仓储搬运和部分服务流程，都可以通过现场改造降低机器人需要处理的复杂度。家庭场景则不同：任务组合更加分散，环境变化更加频繁，而且任何失误都可能直接影响人员安全。因此，家庭机器人不仅需要更强的模型能力，也需要更成熟的工程可靠性和安全机制。

大规模产业化的窗口期，机会在哪里？

“机器人正处于迈向规模化产业化的窗口期。”对于当前的机器人产业阶段，高挺这样定义。“目前，机器人已经在一些工商业场景里跑通了。尤其是在工厂和仓库里，一些重复频率高的工作，机器人已经可以替代一部分人工。所以资本对这个赛道非常关注，一些头部公司的估值也涨得很快。”

但是真正大规模的产业落地还没有发生。

特斯拉曾提出在 2025 年生产约 5000 台 Optimus 的目标。但在 2025 年第四季度财报发布时，Elon Musk 也承认，Optimus 在工厂里面只做了一些基础的任务，还没有形成真正意义上的生产力据悉，特斯拉第三代人形机器人预计年中亮相，要到 2026 年 7-8 月才会启动正式投产。

“机器人、尤其是人形机器人，实际落地和大众预期有挺大差距，这也是现状。”

在高挺看来，未来 2-3 年，人形机器人仍难以实现完全大规模商业化。“这些人形机器人可能会继续出现在工厂、仓储、汽车制造等相对固定的环境里，做一些重复性、低复杂性的工作。但更多是试点和小规模部署，而不是全面替代劳动力。相比之下，工业机器人、仓储机器人、服务型机器人以及一些面对特定任务的多功能机器人，这些产品的商业化路径反而更清楚。因为它们的任务边界比较明确，投入产出也更容易算，安全和流程相对容易控制。”

对于想购买机器人的企业，他的建议是：“第一，起点不是‘买一个人形机器人’，而是要从找高价值、低复杂度的任务开始。第二，要把机器人当作一个运营改造项目，而不是单纯的硬件采购。买来本体不能直接落地，还要考虑现场流程、空间布局、IT/OT 集成、员工协作等等。第三，先试点、再扩展，从一两个小封闭场景开始，拿到真实的生产力结果后再复制。第四，先考虑成熟的品类，比如 AMR、机械臂、协作机器人，然后长期追踪人形机器人的成熟度。”

“行业内常有人将当前具身智能的发展阶段类比为大模型早期：技术方向已经逐渐清晰，但规模化能力尚未形成。”高挺解释，这个类比有一定道理，但机器人的产业化难度更高。“因为它不仅受到数据和算力约束，还涉及传感器、驱动系统、电源管理和系统可靠性。”

“VLA 仍是重要路线，世界模型正在加速融入机器人系统”

机器人能做什么、不能做什么，根本上取决于它的“大脑”，也就是机器人模型。

高挺表示：“VLA 是通用机器人模型目前比较成熟的技术路线。” VLA 即 Vision-Language-Action，指视觉、语言和动作。其中的“Language”部分，就是来自于大语言模型。它让机器人能够结合环境信息和任务指令，生成相应的动作。

“语言模型的作用是为机器人提供语义理解、常识和任务规划能力。例如，当用户说‘房间太暗了’，机器人需要理解这句话背后的任务目标，判断是否应该开灯。”

区别于以前的范式，VLA 模型是先有泛化能力，再一个一个场景去突破可靠性。逻辑正好反过来。“以前是先解决特定场景的高可靠性问题，然后再试图泛化。比如先让一个机器人把某个动作的可靠性做到非常高，然后试图让它学别的任务。但你会发现，这种方式很难真正实现泛化，你只能得到一个非常专业的机器人，换个任务就做不好。”

对于世界模型这类新的技术路线，高挺表示，“它提供了另一种思路：让系统学习物理世界中的状态变化和因果关系，并对动作可能产生的结果进行预测。它不一定依赖语言作为中间层，更强调对物理规律的建模。就像一个熟练的司机在开车时，看到前方有水坑，不需要在大脑里用语言翻译‘这里有水，可能会打滑，我要减速’，而是视觉直接触发了对车辆轨迹的物理预测，本能地踩下刹车。世界模型想解决的，就是这种不需要先翻译成语言、直接作出判断的能力。

不过，他认为，“今天，通用机器人和人形机器人的前沿路线仍然以 VLA 为主。世界模型虽然发展很快，但目前更多用于合成数据生成、仿真、评估和辅助规划，真正直接用于实体机器人控制的案例仍然比较早期。未来一两年，VLA 大概率仍然会是机器人动作模型的主体，但世界模型会逐步融入 VLA 系统，为机器人提供更强的物理理解、规划和预演能力。长期来看，更有可能出现的是 VLA 与世界模型的融合，而不是世界模型简单取代 VLA。”

高挺指出，目前 VLA 是最接近工程化落地的通用机器人技术路线之一。它距离像人一样灵活、通用的智能仍有较大差距，但在仓储、制造等边界相对明确的场景中，已经展现出较好的实用价值。未来一段时间，VLA 很可能仍然是机器人产业化的主要路线。

离不开的“灵巧手”：机器人量产中的多重工程权衡

如果说模型是机器人的“大脑”，那么灵巧手就是它最重要的“工具”。“对于需要操作物体的机器人而言，末端执行器至关重要；在通用操作场景中，灵巧手尤其关键。”

高挺表示，不是任何机械手都能叫“灵巧手”，必须要有足够的自由度、能够进行精细操作，并且可以适应不同物体的抓取。

过去几年，灵巧手有了明显进步：自由度越来越高，价格越来越便宜。但高挺指出，“灵巧手的难点不只是增加自由度。对于工业应用而言，更重要的是在有限空间内兼顾抓取精度、力量输出、耐久性和维护成本。自由度最高的产品未必最适合量产，不同任务需要在性能和可靠性之间做出不同取舍。”

他举例说明：“一些海外高端灵巧手，虽然可以通过高密度的传感器堆叠和复杂的腱绳驱动，在自由度和自适应抓取能力上接近人手，但价格通常较高，动辄几万甚至几十万元，较难大规模部署。部分千元级或开源入门产品降低了使用门槛，但在端部力量输出、耐久性和感知精度等方面仍需进一步验证，现阶段尚难直接替代人工。”

数据鸿沟：仿真与现实、机器与人之间的差距

今天，机器人行业还面临多项挑战，核心瓶颈之一是高质量数据不足。“数据仍然是机器人走向规模化的第一道门槛。”

高挺表示，大语言模型训练用的是互联网数据，相对容易获得。但训练机器人的真实操作数据，比如遥操数据，需要付出不菲的成本。

既然真实数据难拿，能不能用仿真数据替代？这就触及了第二个挑战：模拟与真实的鸿沟。高挺指出，NVIDIA 正在重点布局仿真和合成数据工具链，通过在虚拟环境中训练、测试和验证机器人，扩大训练数据规模并降低真实世界试错成本。优点是成本低、易规模化。但有一个重要问题：模拟场景和真实世界总有差别。“仿真做得再好，和真实世界还是有差别。即便机器人在虚拟引擎中完成了无数次完美的动作映射，一旦面对现实中微小的摩擦力、材质或光影变化，在虚拟环境中学到的控制策略就可能失效。所以，仿真数据很有用，但暂时还不能完全替代真实数据。”

还有人提出：能不能直接用互联网上的海量视频训练机器人？成本低，数据也容易获得，但这就又有一个新挑战：Embodiment Gap（具身鸿沟）。简单说，人的身体和机器人的身体长得不一样，就像“眼睛学会了，手却未必学会”。因此，将人类行为视频或动作数据直接迁移到机器人上，效率会受到很大影响。

“未来更现实的路线不是‘只靠仿真’。”高挺说，“而是建立混合数据策略：以真实机器人交互数据为核心，包括遥操作、人工示教和现场运行反馈；再结合动作捕捉、第一人称视频等人类行为数据，以及仿真 / 合成数据，来提升机器人模型的泛化能力和可靠性。”

除数据外，成本也是机器人产业仍面临的挑战之一。“要让机器人进入到千行百业，它肯定是要足够便宜。”不过高挺也指出，中国的供应链是巨大的优势。“宇树科技最便宜的人形机器人 R1 Air，价格已经做到 3 万元人民币以下。虽然它还不能真正去工厂干活，主要还是用于科研用途，但中国机器人供应链的优势已经非常明显了。

价格在跳水，供应链在成熟，VLA 范式被验证可行，资本在涌入。但数据鸿沟、硬件瓶颈、成本难题，仍然像三道高墙挡在全面普及的路上。

对于这个产业，最理性的态度或许不是追逐“人形”的噱头，而是回归一个朴素的问题：这台机器，到底能帮人解决什么实际问题？正如高挺所说：“不要纠结长得是不是像人。”比这更重要的，是“有用”。而比价格更重要的，是价值。这场关于生产力而非形态的产业竞速，才刚刚开始。

完成预测交易，解锁大奖资格

奖池高达 $500,000，100% 中奖！

免责声明: 本网站转载的文章均来源于公开平台，仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利，请联系 [email protected] 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证，并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考，不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。