Google Deepmind melancarkan Gemini Robotics On-Device

Jun 30, 2025 Tinggalkan pesanan

Pada 24 Jun, Google Deepmind melancarkan model robot revolusioner Gemini Robotics on-device, menandakan kali pertama model boleh beroperasi sepenuhnya secara tempatan tanpa bergantung pada sambungan awan. Model tindakan visual-tindakan (VLA) ini, berdasarkan Gemini 2. 0 seni bina, mengintegrasikan pengiktirafan visual, pemahaman bahasa semulajadi, dan keupayaan penjanaan tindakan, yang membolehkan robot untuk melaksanakan tugas-tugas yang kompleks dengan tepat seperti pakaian lipat, unzipping zippers, dan juga mengikat kasut di luar talian.

 

Gemini Robotics On-Device

 

Terobosan Teknologi: Lonjakan ke arah autonomi dari awan ke tepi


Robotik Gemini pada peranti mencapai prestasi yang setanding dengan model berasaskan awan pada perkakasan tempatan melalui reka bentuk ringan dan pengoptimuman algoritma, sementara dengan ketara mengatasi penyelesaian tempatan yang lain. Dilengkapi dengan sensor sentuhan berkepadatan tinggi dan reka bentuk kalis air IP67, ia boleh beroperasi di dalam air sehingga 1 meter jauhnya selama 30 minit, menyesuaikan diri dengan persekitaran yang kompleks seperti dapur dan bilik mandi. Dari segi mobiliti, kelajuan berjalan telah meningkat sebanyak 60% berbanding dengan generasi terdahulu, dengan keseimbangan ketepatan yang bersaing dengan gimnas profesional, dan sokongan untuk kerjasama dwi-lengan untuk melaksanakan operasi yang tepat seperti perhimpunan perindustrian.

 

Ekosistem pemaju: penyesuaian dengan hanya 50 demonstrasi


Sebagai model VLA pembukaan pertama Google, Gemini Robotics on-device dapat dengan cepat menyesuaikan diri dengan senario baru dengan hanya demonstrasi tugas 50-100, seperti menyelesaikan arahan "Letakkan kiub Rubik ke dalam beg hadiah" pada Apptronik's Apollo Humanoid. SDK Gemini Robotics yang disertakan mengintegrasikan simulator Fizik Mujoco, yang membolehkan pemaju menguji model dalam persekitaran maya dan mendapat akses melalui "program penguji yang dipercayai." Inisiatif ini dilihat oleh industri sebagai "Android of Robotics," dengan potensi untuk memacu decoupling perisian perkakasan dan halangan pembangunan industri yang lebih rendah.

 

Senario Aplikasi: Kebolehpercayaan dari Kilang ke Rumah


Dalam sektor perindustrian, model ini telah disesuaikan untuk robot dwi-lengan Franka FR3, yang membolehkan tugas-tugas seperti perhimpunan tali pinggang penghantar dan pemeriksaan kualiti. Di dalam tetapan rumah, ia boleh melakukan perkhidmatan harian seperti memasak dan berjalan anjing melalui interaksi bahasa semulajadi, dan juga menyediakan sarapan pagi terlebih dahulu berdasarkan jadual pengguna. Terutama, Google telah melaksanakan ulasan keselamatan semantik melalui API Gemini Live dan menetapkan daya tindakan dan had laju di peringkat perkakasan untuk membina sistem perlindungan keselamatan pelbagai lapisan.

 

Gemini Robotics On-Devicefm

 

Walaupun kini dibangunkan berdasarkan Gemini 2. 0, pasukan terasnya telah mula mengintegrasikan peningkatan prestasi Gemini 2.5 terkini, yang berpotensi membuka jalan untuk terobosan selanjutnya dalam kemampuan perancangan logik pelbagai langkah. Apabila model AI setempat menjadi lebih meluas, industri robotika beralih dari "pergantungan awan" kepada "kecerdasan kelebihan." Pelancaran Gemini Robotics On-Device menandakan era baru kecerdasan terkandung memasuki aplikasi berskala besar.