Perusahaan teknologi Google mengumumkan kemitraan dengan Boston Dynamics untuk mengintegrasikan model penalaran terwujud Gemini Robotics ke dalam robot berkaki empat Spot, menandai langkah maju dalam penerapan kecerdasan buatan pada robotika dunia nyata. Kolaborasi ini memungkinkan robot untuk lebih baik menafsirkan lingkungannya, mengidentifikasi objek, dan menjalankan tugas berdasarkan instruksi bahasa alami, daripada hanya mengandalkan rutinitas yang telah diprogram sebelumnya.
Integrasi ini dibangun berdasarkan pekerjaan eksperimental yang dilakukan selama hackathon internal 2025, di mana pengembang mengeksplorasi bagaimana model bahasa besar dan sistem penalaran visual dapat meningkatkan otonomi Spot. Dengan memanfaatkan Gemini Robotics, robot dapat memproses input visual dari kameranya dan menerjemahkan instruksi tingkat tinggi—seperti mengatur objek di dalam ruangan—menjadi tindakan fisik yang terkoordinasi.
Tidak seperti pemrograman robotika tradisional, yang sering bergantung pada logika kaku dan langkah demi langkah, sistem ini memperkenalkan antarmuka yang lebih fleksibel berdasarkan prompt percakapan. Pengembang menciptakan lapisan perangkat lunak perantara menggunakan kit pengembangan perangkat lunak Spot, memungkinkan model Gemini berkomunikasi dengan antarmuka pemrograman aplikasi robot. Kerangka kerja ini memungkinkan AI untuk memilih dari sekumpulan tindakan yang telah ditentukan, termasuk navigasi, deteksi objek, pengambilan gambar, menggenggam, dan penempatan.
Dalam demonstrasi praktis, sistem menunjukkan kemampuan untuk menafsirkan instruksi umum dan beradaptasi dengan lingkungan yang dinamis. Misalnya, ketika ditugaskan untuk mengatur barang, model AI menganalisis data visual, mengidentifikasi objek yang relevan, dan mengarahkan robot melalui serangkaian tindakan. Umpan balik dari robot—seperti penyelesaian tugas atau batasan fisik—dimasukkan secara real time, memungkinkan sistem untuk menyesuaikan perilakunya tanpa intervensi manual.
Pendekatan ini mempertahankan batasan operasional dengan membatasi AI pada kemampuan yang telah ditentukan dalam API robot, memastikan kinerja yang dapat diprediksi dan terkontrol. Desain ini menyeimbangkan adaptabilitas dengan keamanan, pertimbangan utama untuk menerapkan AI dalam sistem fisik.
Kemitraan ini juga menyoroti potensi peningkatan efisiensi bagi pengembang. Dengan mengurangi kebutuhan akan pengkodean manual yang ekstensif, antarmuka bahasa alami memungkinkan insinyur untuk fokus pada penentuan tujuan daripada memprogram setiap urutan tindakan. Pergeseran ini dapat mempercepat pengembangan aplikasi robotika di berbagai industri seperti manufaktur, inspeksi, dan logistik.
Meskipun implementasinya masih bersifat eksperimental, demonstrasi ini mencerminkan tren yang lebih luas dalam AI fisik, di mana model dasar semakin banyak digunakan untuk meningkatkan persepsi dan pengambilan keputusan mesin. Kedua perusahaan telah mengindikasikan bahwa pengembangan lebih lanjut sedang berlangsung, termasuk integrasi berkelanjutan sistem berbasis Gemini ke dalam platform robotika.
Kolaborasi ini menunjukkan transisi menuju interaksi manusia-mesin yang lebih intuitif, di mana perilaku robotik yang kompleks dapat dipandu melalui input yang disederhanakan. Seiring model AI terus berkembang, integrasi semacam itu dapat memperluas cakupan fungsional sistem otonom sambil mengurangi hambatan teknis untuk penerapannya.
Postingan Google Dan Boston Dynamics Integrasikan Model Robotika Gemini Ke Dalam Spot Untuk Persepsi Dan Eksekusi Tugas Tingkat Lanjut muncul pertama kali di Metaverse Post.


