DeepMind Google memperkenalkan model AI baru yang membolehkan robot melakukan tugas-tugas dunia sebenar tanpa latihan

Mar 29, 2025 Tinggalkan pesanan

DeepMind Google telah melancarkan dua model AI baru yang direka untuk membantu bot mencapai tugas-tugas dunia yang lebih nyata.

Gemini Robotics

Salah seorang daripada mereka, yang dipanggil Robotik Gemini, adalah model tindakan bahasa visual yang membolehkan robot memahami situasi baru tanpa terlatih secara khusus.

 

Gemini Robotics didasarkan pada versi terbaru Google model AI perdana, Gemini 2. 0. Carolina Parad, pengarah kanan robotik di DeepMind Google, mengatakan bahawa Gemini Robotics bergantung pada keupayaan pemahaman dunia multimodal Gemini untuk menerapkannya ke dunia nyata dengan menambah modaliti baru tindakan fizikal.

 

Model ini membuat kemajuan dalam apa yang dipercayai Google Deepmind adalah tiga bidang teras yang diperlukan untuk membina bot yang cekap: fleksibiliti, interaktiviti, dan fleksibiliti. Di samping dapat mengatasi situasi baru, Robotik Gemini lebih baik berinteraksi dengan orang dan alam sekitar, dan dapat melakukan operasi fizikal yang lebih tepat, seperti kertas lipat atau penutup botol pembukaan.

 

Yang lain ialah model Robotik-ER (Perwakilan Perwakilan) Gemini, yang mana syarikat itu memanggil model bahasa visual maju yang mampu "memahami dunia kompleks dan dinamik."

 

Parada selanjutnya menjelaskan bahawa apabila anda membungkus kotak bento, anda perlu mempertimbangkan di mana dan bagaimana untuk melakukannya di atas meja. Gemini Robotics-ER direka untuk tugas kesimpulan jenis ini, yang membolehkan ahli robotik berinteraksi dengan sistem kawalan peringkat rendah yang sedia ada dan membuka kunci keupayaan baru yang dikuasakan oleh Gemini Robotics-ER.

 

Vikas Sindhwani, seorang penyelidik di DeepMind Google, berkata syarikat itu sedang membangunkan "strategi keselamatan berlapis" dan berkata model Robotik Gemini telah dilatih untuk menilai sama ada tindakan selamat dalam situasi tertentu. Syarikat itu juga telah mengeluarkan tanda aras dan rangka kerja baru untuk memajukan penyelidikan keselamatan dalam bidang AI. Menurut IT House, tahun lepas, Google Deepmind melancarkan "Perlembagaan Robot", yang merupakan satu set norma tingkah laku robot yang diilhamkan oleh Isaac Asimov.

 

Menurut media asing The Verge, DeepMind Google telah bekerjasama dengan Apptronik untuk "membina robot humanoid generasi akan datang". Di samping itu, Google telah membuka model Robotics Gemini kepada "penguji yang dipercayai" termasuk robot tangkas, robotik ketangkasan, Boston Dynamics, dan alat yang terpesona. "Kami memberi tumpuan kepada membina kecerdasan yang memahami dan bertindak di dunia fizikal, dan kami sangat berharap untuk menggunakan teknologi ini merentasi pelbagai domain dan pelbagai manifestasi," kata Parada. "