文章作者、来源:哈佛商业评论
如果你曾有机会乘坐无人驾驶汽车Waymo,下车时很可能会对其展现出的能力感到惊叹。
自谷歌母公司Alphabet于2009年启动该项目以来,Waymo已打造出一支由2 500辆无人驾驶出租车(robotaxis)组成的车队,目前在旧金山、迈阿密、凤凰城等城市运行,累计完成了超过2 000万次的行程。这些车辆能够做到的,远不止以最高105公里/小时的速度将乘客送往目的地,它们还能响应语音指令(例如“在Spotify上播放一些80年代的说唱音乐”),或者回答问题(例如“旧金山巨人队的比赛几点开始?”),同时还能通过灵活并线,避开路面上违规停放的货车。早期的客服数据以及Waymo One应用程序中的用户评论显示,这种体验令乘客兴奋异常。
生成式AI机器人,是一项正在迅速成熟并即将大规模部署的技术,Waymo只是其中的一个具体案例。许多公司已经在使用生成式AI聊天机器人、智能体(Agents)以及相关技术来实现客户服务的自动化和规模化,但在大多数情况下,客户仍然是通过屏幕与这些技术互动。将生成式AI嵌入机器人,使企业有机会在长期依赖人类的实体服务场景(如餐厅、酒店、医院、零售门店以及其他线下场所)中重新设计与客户的互动方式。借助大语言模型(LLMs)、大行为模型(LBMs)以及代理式AI(agentic AI),新一代机器人能够更好地理解语境、进行推理并提供个性化的体验。它们可以像称职的员工一样交流——在多轮对话中保持逻辑连贯、澄清模糊之处,并以简单易懂的方式解释复杂概念。
过去,当一名患者问机器人“这项检查会疼吗?要持续多长时间?如果我感到头晕怎么办?”时,这些问题往往超出了机器人预设脚本的范围。但如今,由大语言模型驱动的服务机器人可以逐一拆解这些顾虑,并给出通俗易懂的回答。一个名叫Robin的机器人已经在做类似的事情,目前它在全美30个儿科病房和养老院中提供情感支持。它能够自主移动,与孩子们打招呼并回答问题。护士还可以向Robin下达口头指令,例如:“去517号病房待20分钟,然后去516号病房待10分钟。”它还内置了多种游戏,孩子们可以通过语音参与互动。
这可能并不是你第一次读到宣称机器人将改变服务行业的文章。诚然,它们的发展步伐比许多支持者预想得要慢。
2024年,全球专业服务机器人市场(包括物流、医疗、清洁等领域在内)增长了约9%,销量接近20万台。但许多试点项目停滞不前或未能达到预期效果。麦肯锡的研究显示,71%的公司表示高昂的前期成本是采用机器人的主要挑战之一,61%的公司则将缺乏自动化经验列为另一项关键障碍。
机器人的维护与可靠性问题依旧是持续存在的挑战,客户与员工的接受度也有待提升,许多人仍然更倾向于与人类互动,尤其是在情境复杂或情绪色彩浓烈的情况下。当企业部署面向客户的机器人时,大多数应用仍局限于一些高度脚本化的狭窄任务,例如在酒店中运送行李或客房服务用品。这些服务机器人充其量就是一些精密的移动售货机而已,它们能够沿预设路线运行、读取条形码并回答常见问题,但总体而言,仍未能实现早期采用者所期待的规模效应或投资回报。
尽管如此,几乎所有主要的机器人制造商都在将生成式AI整合进其产品中,且一些早期成果已经展现出相当的潜力。我从事先进机器人研究已有10余年,在过去的18个月里,我走访了欧洲、亚洲和北美的14家机构,实地考察了它们部署的生成式AI服务机器人。这些机构分布在金融服务、医疗、教育、酒店等多个领域。在本文中,我将概述企业如何利用生成式AI机器人创造价值、降低风险,并打造推动其成功所需的组织能力。
由生成式AI赋能的机器人依赖于多种技术的融合,其中有些已经为人所熟知,有些则尚不常见。
到目前为止,大多数高管已经对大语言模型和代理式AI有了一定的了解。在机器人身上,大语言模型赋予了其对话能力,而代理式AI则增加了记忆、规划、执行和反思的能力。借助这些技术,机器人可以记住再次光临的熟客,在权衡利弊后做出推理(例如,如果保洁员说房间快打扫好了,那可以提前办理入住吗?),规划一系列任务,在数字系统与物理空间中执行具体步骤,然后反思哪些做法有效、哪些无效。依赖脚本的传统机器人与受代理式AI驱动的机器人之间,差异可谓天壤之别。一个依赖脚本的系统也许能够识别出某项配送任务需要优先处理,但仍然会按照预设路线执行;而一个代理系统则可以将任务分配给人类,重新规划配送路线,并通过调配资源确保任务完成。尽管机器人通常具有特定领域的智能(例如,酒店机器人的训练方式与医院机器人截然不同),但在其所在领域,它们仍然能够依据高层级的指令做出复杂决策,例如“尽快为客人办理入住”或“在值班结束前补足静脉注射液的库存”。
大行为模型则是一项较为陌生的技术。正如大语言模型在海量文本上进行训练,大行为模型则是在大规模的行为数据集上训练。大行为模型帮助机器人适应现实环境中服务场景的“混乱不堪”:托盘会倾斜、地面会变得湿滑、顾客可能会递来易碎品。在这样的背景下,为机器人预先编写应对所有突发情况的程序是不现实的。因此,开发人员转而利用大行为模型,让机器人在各种情境中自主学习应对方式。大行为模型正是让Waymo车辆能够绕过违规停放的货车灵活行驶的关键。
生成式AI机器人利用摄像头、麦克风和各类传感器进行学习,它们可以通过观察人类、提问,以及反复试错来不断优化。这种训练最初可以在现实世界中进行,机器人根据少量示范动作学习某种行为(例如如何小心地拿起一杯红酒),然后借助元宇宙或数字孪生技术,对速度、抓取力度和动作轨迹进行数百万次的微调实验,完善其操作方式。这些行为还可以跨场景迁移。如果一个机器人在咖啡馆学会了如何处理易碎玻璃杯,那么其中的部分技能也可以迁移到在诊所里处理玻璃药瓶上,或在精品店中搬运商品上。
还有一些技术进一步提升了生成式AI机器人的学习能力。例如,无代码编程(no-code programming)和群体学习(fleet learning,一组机器人之间共享指令)使部署和改进机器人变得比10年前容易得多。过去,对机器人的任何调整都需要向IT部门提交工单或等待供应商上门处理,而现在,无代码训练(由生成式AI实现)让一线员工只需要询问机器人为何采取某种方式、描述更好的方案并进行肢体示范,就可以直接调整其行为。这种改进的便捷性,将运营优化的周期从几个月压缩至几天。这些能力使机器人变成了集对话、认知和物理行动于一体的自适应系统——既能大规模运行,又能针对每位客户实现个性化的服务。
以宝马位于南卡罗来纳州帕斯坦堡的汽车装配工厂为例。汽车行业是最早采用机器人技术的行业之一,自20世纪80年代,工厂就开始使用简单的机械臂来执行重复性任务(例如点焊)。但到2024年,宝马开始试点部署Figure02——这是一款人形机器人,代表了对传统工业自动化的一次重大突破。
与传统工厂机器人不同,Figure 02借助机身上的六个摄像头实现了工厂中的自主移动,理解所见之物,并结合深厚的汽车知识及通用知识库,推理出物体应如何使用。Figure 02在OpenAI模型的驱动下,能够聆听并处理人类语言,甚至能从模糊的指令中推断意图,在必要时主动追问来明确需求,并能随着时间的推移从错误中吸取教训。
在为期11个月的部署过程中,Figure 02参与了大约3万辆宝马汽车的生产。在车身车间,它相当于一双高精度的“机械手”,负责搬运并放置易损的钣金零件,并将组件对齐,使焊接机器人能够顺利组装汽车框架。目前,宝马正规划使用Figure 03,这是一款更轻也更高的继任型号,旨在将这些能力扩展到工厂之外的更多场景。在一段宣传视频中,Figure 03展示了多种任务能力,例如洗碗、叠衣服、端送饮料以及玩抛接游戏,凸显出生成式AI正帮助机器人获得日益多样化的能力。
我与多家企业的合作研究表明,生成式AI机器人最令人兴奋的应用场景,往往集中在一线岗位,以及面向客户和员工的任务中。将机器人引入工作场所绝非“拆箱即用”那么简单,因为许多工作环境本身具有高度的不确定性。例如服务员需要端着托盘穿梭,医生和护士则会在不同病房之间忙碌奔走,等等。为了将潜力转化为实际效能,企业领导者必须仔细挑选应用案例,向客户及员工沟通使用机器人的原因和方式,并设立保障机制。根据我的实地观察,以下四个关键步骤可以为管理者提供指导。
1、从劳动力瓶颈处着手
当机器人被应用于那些具有重复性、经济价值高且能够带来可量化回报的任务时,其效果最为显著。我所观察到的许多早期实验,涉及的岗位大多来自长期面临“用工荒”的行业,这合乎逻辑,机器人不仅降低了成本,还缓解了招聘难的问题。目标岗位一旦确定,首先就要审视这些工作涉及的具体任务:它们的重复性是否足够多,便于机器人的快速学习?将这些任务交给机器人后,是否能在速度、效率、一致性方面获得立竿见影的回报,或者能释放员工,让他们专注于价值更高的工作?
理想的试点场景包括:酒店的入住与退房办理、快餐店的订单修改与送餐,以及医院病区的物流配送。在这些情境中,一线的服务能力始终不足,并且也存在机器人可以独立承担的清晰操作环节。
一旦确定了应用场景,就要对试点项目进行精心设计,确保一线员工能够在实际工作过程中参与机器人表现的改进。如果员工发现机器人采用的操作步骤并不理想,应当能够及时解释并示范更好的方法,而不必等待数周后的软件更新。
如果执行得当,随着时间的推移,这种方法能持续拓展机器人的能力边界,增强其在特定领域的表现,并提升整体部署的效果。与此同时,它还能推动一线岗位向技能要求更高的工作岗位转型,并在劳动力最紧缺的岗位有效缓解用工压力。
2、设计客户接受的机器人交互
大多数针对机器人的抵触情绪,往往始于客户触点,而非技术本身。传统的自助终端、自助服务技术以及依赖脚本的机器人,常常迫使客户进入刻板、不自然的交互流程。这本质上是一个设计缺陷,而由大语言模型驱动的机器人正在消解这一负担。客户和员工可以用自然语言与它们交谈,并且至关重要的一点是,这些机器人可以在真实环境中真正执行相应操作。
以酒店入住办理为例。人类员工通常需要在多个系统间切换,到预订记录、会员信息、客房状态、支付系统以及客户偏好的不同界面进行处理。而生成式AI机器人则可以同时连接多个系统,在后台处理信息、协调冲突,并在与客人互动、致欢迎词的同时,在数秒内交付房卡。对客户而言,这种体验表现为一场亲切且高效的交谈,并且在高峰时段,其服务的稳定性往往优于人类。
早期的部署案例既展示了这一技术的潜力,也暴露出其局限。在东京的海茵娜酒店(Henn na Hotel),机器人前台能帮助宾客完成身份验证、房间分配以及支付环节的所有流程。这一举措确实降低了劳动力成本并缓解了人手短缺的问题,但并非所有环节都如预期般顺利。有时,机器人在处理口音、背景噪声和突发请求时显得力不从心,反而增加了员工的工作负担。
针对客户接受度进行设计,意味着必须要在真实环境、面对真实客户的过程中测试这些交互方式。找出摩擦产生的环节,并确保机器人的沟通能力与其物理执行的可靠性相匹配。
3、定位为服务增效工具,而非人力替代品
机器人如何被引入组织,以及其角色如何被解释,会深刻影响人们对它们的认知。人们对AI的接受程度会因人口特征和具体情境而有所不同,而在当前,许多客户在需要温度、同理心或判断力的互动场景中,仍然更倾向于与人类交流。与此同时,员工也担心这项技术会取代他们的工作。
为了应对这些偏好与担忧,企业应将生成式AI机器人定位为一线员工的辅助工具,而不是替代品。生成式AI机器人的作用是提升服务的可及性、速度和可靠性,同时释放人类员工的时间,使他们能够专注于那些情绪负荷较高、情境模糊或风险较大的互动任务。根据我的观察,最成功的部署案例通常发生在以“便捷性”为客户首要诉求且自动化价值一目了然的场景中。
企业还应清晰地说明机器人能够完成哪些工作,以及当客户需要时,他们如何能获得人工支持。例如在医院,机器人可以向患者解释,它们的作用是让简单的互动变得更顺畅、更便捷,在达到能力极限后,它们会主动呼叫人类工作人员协助。在零售场景中,让一线卖场导购与后台的自动化机器人协同工作,有助于让购物体验始终保持人类在场的感觉。
如实设定预期至关重要。企业应与客户和员工坦诚沟通,说明机器人目前擅长的领域——速度、稳定性以及对长尾需求的持续可靠响应,同时也应指明人类仍然明显优于机器人的地方,尤其是在需要共情、创造力或解决全新问题的场景中。要用事实而非夸张表达强化以上信息,以具体数据说服人,例如“我们的等待时间从6分钟缩短至90秒”,或者“我们的护士每个班次少走了3 000步,所以能多花一个小时陪伴患者”。这类数据清楚地表明,机器人如何为客户和员工创造“双赢”。
4、持续优化“负责任使用”的指导原则
当企业部署生成式AI机器人时,与伦理、公平和隐私有关的风险也随之提升。许多机器人配备了摄像头和麦克风,这意味着它们几乎可以将面对面互动中发生的所有事情数字化(除非法律另有规定)。再加上先进语言模型的助力,机器人突然间就具备“说服”人类的能力。这在销售和追加销售中固然有用,但如果客户被以公司意图之外的方式分析、诱导或操纵,就可能会越界。当机器人参与资源分配或定价决策(例如升房、提前入住或个性化优惠)时,情况会变得尤为敏感,因为这些决策可能引发偏见或不公平的感知。
好的部署方式是将生成式AI机器人视为一个可持续优化的系统,而不是一个完善的产品。组织需要建立机制,观察人们与机器人的真实互动,识别互动失败或卡顿的环节,并持续系统性地改进性能。这一过程始于对一系列信号的捕捉(例如用户在哪些地方出现犹豫、重复表达,或推翻机器人的操作),并将这些洞察转化为清晰、可执行的改进建议,提供给督导员和一线管理者。
此外还存在一定的学习风险。由于生成式AI机器人是通过人机交互进行学习的,这也为员工和客户提供了利用它们的漏洞。如果缺乏防护机制,机器人可能会学到不当行为。我曾听说机器人会在酒店里重复不当用语,也见过博物馆的访客出于娱乐目的故意干扰机器人。无代码工具和群体学习同样带来了新的挑战。员工可能在无意中引入了错误或带有偏见的逻辑,而恶意攻击者还可能蓄意破坏,导致不良行为迅速在机器人群体中蔓延。
改进应当是审慎、可迭代的:测试变更、衡量结果、保留有效做法,然后不断重复这一过程。在实践中,没有任何一个机器人在一开始就能运行良好,细致的持续调优至关重要。一线员工在这一学习闭环中扮演着核心角色,应当被支持成为“全民开发者”(citizen developers)。通过适当的微学习流程、认证机制以及无代码工具,一线员工作为某个领域的专家,可以用自然语言直接向机器人指出故障点并解释更优的做法。随着时间的推移,管理岗位的职责也会发生转变:从单纯监督具体任务,转向协调系统运行——包括评估改进建议、执行安全与授权协议,并确保激励机制与质量、可靠性以及客户成果相挂钩,而不仅仅关注速度。
与此同时,学习过程必须受到严格治理机制和企业数字责任的约束。由于机器人会收集敏感数据,隐私保护必不可少。又因为它们会在实体环境中移动,可能与人员或物体发生碰撞,安全同样也是首要考量。谨慎的运动控制、作业环境的有序性以及系统的可靠性,应被视为不可妥协的底线,并辅以风险分析、地理围栏(限制机器人在特定区域内移动)、紧急制动(允许人工立即停止机器人行动),以及与供应商签订的维护和事故响应的明确服务等级协议。
这些并不意味着企业应当对生成式AI机器人望而却步。但它确实意味着,安全性、保障和负责任的设计必须成为首要优先事项。错误总会发生,但如果系统架构、政策和测试机制足够稳健,这些错误演变为实际伤害的可能性将大大降低。这些规范化的做法能够确保在机器人能力不断提升的同时,组织仍然对其行为承担责任——在推进创新规模化的过程中,不以牺牲客户与员工的信任为代价。
由生成式AI驱动的机器人,为在现实世界中实现高性价比的服务提供了一条切实可行的路径。它们能够成规模地提供稳定性与个性化兼具的服务,而这长期以来一直是实体服务领域的“阿喀琉斯之踵”。但生成式AI机器人的部署过程复杂且周期较长,而且由于必须在真实环境中运行,其风险更高、失败更容易被公众看到,安全问题也因此成为一项重大关切。
尽管这项技术仍处于起步阶段,但早期试点的初步结果表明,生成式AI机器人能够同时为企业、员工和客户创造价值。通过遵循本文所概述的步骤,企业可以以一种结构化且安全的方式,逐步部署这些机器人。
武耀恒(Jochen Wirtz)| 文
武耀恒是新加坡国立大学商学院副院长、市场营销系教授。
廖琦菁 | 编校

