Роботи вчаться виконувати домашні справи, спостерігаючи за людьми

 Робот спостерігав за тим, як людина відчиняє дверцята холодильника. Він записував його рухи, хід дверцят, розташування холодильника та багато іншого, аналізував ці дані та готувався імітувати дії людини.

Спочатку у робота нічого не виходило: іноді він повністю пропускав ручку, хапався за неї в неправильному місці або тягнув неправильно. Але після кількох годин практики робот досяг успіху та відчинив двері.

“Наслідування – чудовий спосіб навчання”, - сказав Бахл, аспірант Інституту робототехніки (RI) при Школі комп'ютерних наук Університету Карнегі-Меллона. “Те, що роботи можуть навчатися, безпосередньо спостерігаючи за людиною, залишається невирішеною проблемою в цій галузі, але ця робота робить значний крок у створенні такої можливості”.

Бахл працював з Діпаком Патхаком та Абхінавом Гуптою, викладачами РІ, над розробкою нового методу навчання для роботів під назвою WHIRL, скорочено від In-the-Wild Human Imitating Robot Learning. WHIRL – це ефективний алгоритм для одномоментної візуальної імітації. Він може навчатися безпосередньо на відеозаписах взаємодії з людиною та узагальнювати цю інформацію для виконання нових завдань, що робить роботів тими, що добре підходять для навчання домашньому господарюванню. Люди постійно виконують різноманітні завдання у своїх оселях. За допомогою WHIRL робот може спостерігати за виконанням цих завдань та збирати відеодані, необхідні йому для того, щоб зрештою визначити, як виконати роботу самостійно.

Команда додала камеру та програмне забезпечення до готового робота, і він навчився виконувати понад 20 завдань – від відкривання та закривання приладів, дверей шаф та ящиків до накривання каструлі кришкою, підштовхування стільця та навіть виймання сміттєвого пакету з кошика. Щоразу робот спостерігав за тим, як людина виконує завдання, а потім тренувався й вчився виконувати їх самостійно. Команда представила свої дослідження цього місяця на конференції "Робототехніка: Наука та системи" у Нью-Йорку.

“Ця робота є способом запровадити роботів у дім”, - сказав Патхак, доцент РІ та член команди. “Замість того, щоб чекати, поки роботи будуть запрограмовані або навчені успішно виконувати різні завдання, перш ніж впроваджувати їх в людські оселі, ця технологія дозволяє нам впровадити роботів і навчити їх виконувати завдання, при цьому вони адаптуються до навколишнього середовища та вдосконалюються лише за рахунок спостереження”.

Поточні методи навчання роботів виконання завдань зазвичай ґрунтуються на наслідуванні або навчанні з підкріпленням. При наслідувальному навчанні людина вручну керує роботом, щоб навчити його виконувати завдання. Цей процес повинен бути виконаний кілька разів для одного завдання, перш ніж навчиться робот. При навчанні з підкріпленням робот зазвичай навчається на мільйонах прикладів у симуляції, а потім його просять адаптувати це навчання до реального світу.

Обидві моделі навчання добре працюють при навчанні робота одному завданню у структурованому середовищі, але їх важко масштабувати та впроваджувати. WHIRL може навчатися на основі будь-якого відеозапису виконання завдання людиною. Цей алгоритм легко масштабується, не обмежується одним конкретним завданням та може працювати у реалістичних домашніх умовах. Команда навіть працює над версією WHIRL, яка навчається на основі перегляду відеозаписів взаємодії людей з YouTube та Flickr.

Прогрес у сфері комп'ютерного зору зробив цю роботу можливою. Використовуючи моделі, навчені на даних Інтернету, комп'ютери тепер можуть розуміти та моделювати рухи у 3D. Команда використовувала ці моделі для розуміння рухів людини, що полегшило навчання WHIRL.

За допомогою WHIRL робот може виконувати завдання у своєму природному середовищі. Побутова техніка, двері, ящики, кришки, стільці та мішок для сміття не були змінені або маніпульовані спеціально для робота. Перші кілька спроб робота виконати завдання закінчилися невдачею, але після кількох вдалих спроб він швидко зрозумів, як виконати завдання, і освоїв його. Хоча робот може виконати завдання тими самими рухами, як і людина, мета не в цьому. Люди та роботи мають різні частини тіла, і вони рухаються по-різному. Головне, щоб кінцевий результат був однаковим. Двері відкриті. Вимикач вимкнено. Кран увімкнено.

“Для масштабування робототехніки в дикій природі дані мають бути надійними та стабільними, а роботи повинні краще орієнтуватися у навколишньому середовищі, тренуючись самостійно”, - сказав Патхак.

Коментарі

Популярні дописи з цього блогу

Досліджувати Європу можливо з використанням технології кремнієво-германієвих транзисторів