Google DeepMind разрабатывает роботов с «внутренним голосом»: это ускорит обучение

04.07.2025 20:19

Технология работает так: робот смотрит видео или изображение, где человек выполняет действие (например, поднимает чашку), и «внутренне проговаривает» — «человек поднимает чашку». Это связывает визуальные данные с речевыми описаниями и помогает лучше запоминать и воспроизводить действия — даже с незнакомыми объектами и без предварительного обучения.

Такой внутренний монолог помогает роботам сопоставлять визуальные данные с речевыми описаниями, что значительно улучшает их способность понимать и запоминать правильные действия при столкновении с похожими объектами.

Главное преимущество системы заключается в том, что она поддерживает обучение «с нуля»: роботы могут выполнять задачи с незнакомыми объектами без предварительного обучения.

DeepMind отмечает, что метод снижает требования к объему памяти и вычислительной мощности, необходимой для обучения роботизированных систем. Добавление внутренней речи обеспечивает роботам контекст, позволяя им принимать обоснованные решения и адаптироваться к новым ситуациям.

Проект развивается параллельно с другим направлением DeepMind — автономной моделью Gemini Robotics On-Device, представленной на прошлой недели. Она работает без облака и подходит для задач с минимальными задержками. Эта «стартовая модель» учится по 50–100 демонстрациям и работает даже на устройствах с ограниченной связью.

Источник: hightech.fm

—

Комментарии

Нет комментариев. Ваш будет первым!

Войдите или зарегистрируйтесь чтобы добавлять комментарии

Всё о спорте

Высокие технологии

Здоровый образ жизни

Путешествия и туризм

Google DeepMind разрабатывает роботов с «внутренним голосом»: это ускорит обучение

Мы используем Cookie!

Google DeepMind разрабатывает роботов с «внутренним голосом»: это ускорит обучение