Google представив дві нові моделі ШІ — Gemini Robotics та Gemini Robotics-ER

Google презентував дві нові моделі штучного інтелекту: Gemini Robotics, розроблену для застосування в робототехніці на базі Gemini 2.0, та Gemini Robotics-ER, яка відзначається покращеним просторовим розумінням. Про це повідомляє The Robot Report.
Представники Google зазначають, що досягли суттєвого прогресу в здатності Gemini вирішувати складні завдання, застосовуючи мультимодальні міркування через текст, зображення, аудіо та відео. Завдяки новим моделям ці можливості тепер виходять за межі цифрового простору, переходячи у реальний світ.
Gemini Robotics — це вдосконалена модель vision-language-action (VLA), яка додає фізичні дії як новий вихідний канал, дозволяючи безпосередньо керувати роботами. Gemini Robotics-ER забезпечує розширене просторове розуміння, що дозволяє роботам запускати власні програми за допомогою втілених міркувань.
Обидві моделі відкривають шлях до виконання роботами значно ширшого спектра завдань у реальному світі. У межах цього проєкту компанія співпрацює з Apptronik для створення гуманоїдних роботів, що працюватимуть на базі Gemini 2.0.