Google 與 Boston Dynamics 將 Gemini AI 整合至 Spot 機器人，實現自然語言控制、物體識別和任務執行，推動自適應機器人技術發展Google 與 Boston Dynamics 將 Gemini AI 整合至 Spot 機器人，實現自然語言控制、物體識別和任務執行，推動自適應機器人技術發展

Google 與 Boston Dynamics 將 Gemini 機器人模型整合至 Spot，實現進階感知與任務執行

來源：Metaverse Post

2026/04/16 22:41

閱讀時長 5 分鐘

如需對本內容提供反饋或相關疑問，請通過郵箱 [email protected] 聯絡我們。

Google 與 Boston Dynamics 將 Gemini Robotics 模型整合至 Spot 機器人，實現進階感知與任務執行

科技公司 Google 宣布與 Boston Dynamics 合作，將其 Gemini Robotics 具身推理模型整合至四足機器人 Spot，標誌著人工智慧應用於現實世界機器人技術邁出了重要一步。此次合作使機器人能夠更好地理解其環境、識別物體，並根據自然語言指令執行任務，而非僅依賴預先編程的例行程序。

此整合建基於 2025 年內部黑客松期間進行的實驗性工作，開發人員探索了大型語言模型和視覺推理系統如何增強 Spot 的自主性。透過運用 Gemini Robotics，機器人能夠處理來自攝影機的視覺輸入，並將高階指令（例如整理房間內的物品）轉換為協調的實體動作。

與傳統機器人編程（通常依賴於僵化的逐步邏輯）不同，該系統引入了基於對話提示的更靈活介面。開發人員使用 Spot 的軟體開發套件創建了一個中介軟體層，讓 Gemini 模型能夠與機器人的應用程式介面通訊。此框架使 AI 能夠從一組定義好的動作中進行選擇，包括導航、物體偵測、影像捕捉、抓取和放置。

自然語言介面重塑機器人任務執行

在實際演示中，該系統展現了理解一般指令和適應動態環境的能力。例如，當被指派整理物品時，AI 模型分析視覺資料、識別相關物體，並引導機器人執行一系列動作。來自機器人的回饋（例如任務完成或實體限制）被即時納入，使系統能夠在無需人工介入的情況下調整其行為。

此方法透過將 AI 限制在機器人 API 內的預定義功能來維持操作邊界，確保可預測且受控的性能。此設計在適應性和安全性之間取得平衡，這是在實體系統中部署 AI 的關鍵考量。

此合作關係也突顯了開發人員潛在的效率提升。透過減少大量手動編碼的需求,自然語言介面讓工程師能夠專注於定義目標，而非編程每個動作序列。此轉變可能會加速製造、檢測和物流等產業的機器人應用開發。

儘管實施仍處於實驗階段，此演示反映了實體 AI 的更廣泛趨勢，其中基礎模型越來越多地被用於增強機器感知和決策能力。兩家公司均表示正在進行進一步開發，包括持續將基於 Gemini 的系統整合至機器人平台。

此合作顯示了向更直觀的人機互動轉變的趨勢，複雜的機器人行為能夠透過簡化的輸入進行引導。隨著 AI 模型持續演進，此類整合可能會擴大自主系統的功能範圍，同時降低其部署的技術障礙。

本文《Google 與 Boston Dynamics 將 Gemini Robotics 模型整合至 Spot 機器人，實現進階感知與任務執行》首次發表於 Metaverse Post。

只要一分鐘，20 USDT 免費拿！

充值 $100，多拿 $300 GOLD 倉位！

免責聲明: 本網站轉載的文章均來源於公開平台，僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利，請聯絡 [email protected] 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證，並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考，不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。