Google 與 Boston Dynamics 將 Gemini AI 整合至 Spot 機器人,實現自然語言控制、物體識別和任務執行,推動自適應機器人技術發展Google 與 Boston Dynamics 將 Gemini AI 整合至 Spot 機器人,實現自然語言控制、物體識別和任務執行,推動自適應機器人技術發展

Google 與 Boston Dynamics 將 Gemini 機器人模型整合至 Spot,實現進階感知與任務執行

2026/04/16 22:41
閱讀時長 5 分鐘
如需對本內容提供反饋或相關疑問,請通過郵箱 [email protected] 聯絡我們。
Google 與 Boston Dynamics 將 Gemini Robotics 模型整合至 Spot 機器人,實現進階感知與任務執行

科技公司 Google 宣布與 Boston Dynamics 合作,將其 Gemini Robotics 具身推理模型整合至四足機器人 Spot,標誌著人工智慧應用於現實世界機器人技術邁出了重要一步。此次合作使機器人能夠更好地理解其環境、識別物體,並根據自然語言指令執行任務,而非僅依賴預先編程的例行程序。

此整合建基於 2025 年內部黑客松期間進行的實驗性工作,開發人員探索了大型語言模型和視覺推理系統如何增強 Spot 的自主性。透過運用 Gemini Robotics,機器人能夠處理來自攝影機的視覺輸入,並將高階指令(例如整理房間內的物品)轉換為協調的實體動作。

與傳統機器人編程(通常依賴於僵化的逐步邏輯)不同,該系統引入了基於對話提示的更靈活介面。開發人員使用 Spot 的軟體開發套件創建了一個中介軟體層,讓 Gemini 模型能夠與機器人的應用程式介面通訊。此框架使 AI 能夠從一組定義好的動作中進行選擇,包括導航、物體偵測、影像捕捉、抓取和放置。

自然語言介面重塑機器人任務執行

在實際演示中,該系統展現了理解一般指令和適應動態環境的能力。例如,當被指派整理物品時,AI 模型分析視覺資料、識別相關物體,並引導機器人執行一系列動作。來自機器人的回饋(例如任務完成或實體限制)被即時納入,使系統能夠在無需人工介入的情況下調整其行為。

此方法透過將 AI 限制在機器人 API 內的預定義功能來維持操作邊界,確保可預測且受控的性能。此設計在適應性和安全性之間取得平衡,這是在實體系統中部署 AI 的關鍵考量。

此合作關係也突顯了開發人員潛在的效率提升。透過減少大量手動編碼的需求,自然語言介面讓工程師能夠專注於定義目標,而非編程每個動作序列。此轉變可能會加速製造、檢測和物流等產業的機器人應用開發。

儘管實施仍處於實驗階段,此演示反映了實體 AI 的更廣泛趨勢,其中基礎模型越來越多地被用於增強機器感知和決策能力。兩家公司均表示正在進行進一步開發,包括持續將基於 Gemini 的系統整合至機器人平台。

此合作顯示了向更直觀的人機互動轉變的趨勢,複雜的機器人行為能夠透過簡化的輸入進行引導。隨著 AI 模型持續演進,此類整合可能會擴大自主系統的功能範圍,同時降低其部署的技術障礙。

本文《Google 與 Boston Dynamics 將 Gemini Robotics 模型整合至 Spot 機器人,實現進階感知與任務執行》首次發表於 Metaverse Post。

免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 [email protected] 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

USD1 Genesis:0 費率 + 12% APR

USD1 Genesis:0 費率 + 12% APRUSD1 Genesis:0 費率 + 12% APR

新用戶:質押最高享 600% APR。限時福利!