RHyME требует всего 30 минут данных робота и повышает успешность выполнения задач более чем на 50% по сравнению с предыдущими методами.

Кушал Кедиа (слева), аспирант в области компьютерных наук, и Притвиш Дэн, магистр наук 26 года рождения, являются членами команды разработчиков RHyME — системы, которая позволяет роботам изучать задачи, просматривая одно обучающее видео.
Корнелльский университет
Исследователи из Корнеллского университета представили новую структуру на базе искусственного интеллекта, которая позволяет роботам лучше справляться с обучающими задачами. Она называется RHyME, что означает Retrieval for Hybrid Imitation under Mismatched Execution.
Идея проста, но эффективна: вместо того, чтобы часами изучать пошаговые инструкции, робот может освоить задачу, просто посмотрев одно видео.
Это может стать огромным шагом вперед для робототехники. Обучение роботов даже базовым работам требует много времени, данных и усилий. Обычно им требуются подробные инструкции, и они теряются, если что-то меняется в процессе выполнения задачи, например, если инструмент падает или что-то пропадает.
«Одной из раздражающих вещей в работе с роботами является сбор большого количества данных о роботе, выполняющем различные задачи», — сказал Кушал Кедиа, докторант по информатике и ведущий автор статьи. «Люди выполняют задачи не так. Мы смотрим на других людей как на источник вдохновения».
От человека к роботу – RhyME преодолевает разрыв
Главной проблемой обучения роботов всегда была разница между тем, как двигаются люди и роботы. Люди текучи и быстры. Роботы — нет. Поэтому даже при использовании видеодемонстраций роботы обычно терпят неудачу, если действия не полностью соответствуют тому, как они запрограммированы на поведение.
«Если человек движется так, как это хоть как-то отличается от того, как движется робот, метод немедленно разваливается», — сказал Санджибан Чоудхури, старший автор и доцент Колледжа вычислительной техники и информатики имени Энн С. Бауэрс в Корнелле. «Мы думали: «Можем ли мы найти принципиальный способ справиться с этим несоответствием между тем, как люди и роботы выполняют задачи?»
RHyME — ответ команды на эту проблему. Он создан, чтобы помочь роботам распознавать шаблоны и адаптироваться. Даже если видео не совсем соответствует тому, что нужно сделать роботу, RHyME помогает ему использовать память, чтобы заполнить пробелы.
Таким образом, если робот видит видео, на котором кто-то берет кружку и ставит ее в раковину, он может обратиться к своей памяти о похожих движениях — например, о взятии чашки или перемещении ложки — и понять, как выполнить эту работу, даже если он никогда раньше не выполнял эту задачу.
Чоудхури сравнивает это с языковым переводом: «Наша работа похожа на перевод с французского на английский — мы переводим любую поставленную задачу с человеческого на роботизированный язык».
Всего 30 минут данных, большие результаты
Что делает RHyME действительно впечатляющим, так это то, как мало данных для обучения ему нужно. Большинству роботизированных систем требуются часы телеуправляемого руководства для обучения одной задаче. С RHyME это сокращается всего до 30 минут данных.
Команда заявила, что в ходе лабораторных испытаний роботы, использующие RHyME, продемонстрировали рост показателей успешности более чем на 50% по сравнению с предыдущими методами.
«Эта работа — отход от того, как сегодня программируют роботов. Статус-кво программирования роботов — это тысячи часов телеуправления, чтобы научить робота выполнять задачи. Это просто невозможно», — добавил Чоудхури. «С RHyME мы отходим от этого и учимся обучать роботов более масштабируемым способом».
Наряду с Кедиа и Чоудхури в исследовательскую группу входят Притвиш Дэн, Анджела Чао и Максимус Пейс. Команда представит свои выводы на Международной конференции IEEE по робототехнике и автоматизации в Атланте в мае.
Sourse: interestingengineering.com




