<Бретт Адкок из p>Figure заявил, что на выходных наступил «момент ChatGPT» для гуманоидной робототехники. Теперь мы знаем, что он имеет в виду: робот теперь может наблюдать за тем, как люди выполняют задачи, формировать собственное понимание того, как их выполнять, и начинать выполнять их полностью автономно.
Гуманоидным роботам общего назначения придется выполнять самые разные работы. Им нужно будет понимать все инструменты и устройства, объекты, методы и цели, которые мы, люди, используем для достижения цели, и им нужно будет быть такими же гибкими и адаптируемыми, как и мы, в огромном диапазоне динамических рабочих сред.
Они бесполезны, если им нужна команда программистов, рассказывающая им, как выполнять каждую новую работу; им нужно иметь возможность смотреть и учиться – а мультимодальные ИИ, способные смотреть и интерпретировать видео, а затем управлять роботами, чтобы воспроизводить то, что они видят, в последние месяцы добились революционных успехов, о чем свидетельствует невероятная демонстрация «большой модели поведения» Toyota в Сентябрь.
Но Toyota использует настольные роботы-манипуляторы в исследовательском центре. Фигура, как и Tesla, Agility и все большее число других компаний, сфокусирована на самодостаточных гуманоидах с полным телом, которые теоретически могут выйти на любое рабочее место и в конечном итоге научиться брать на себя любую человеческую задачу. И это не исследовательские программы, эти компании хотят, чтобы продукты появились на рынке вчера, начиная платить за себя и выполнять полезную работу.
Рисунок 01 шел в течение 12 месяцев после разработки – это рекорд, считает Адкок. Рисунок
Адкок рассказал нам, что надеется развернуть робота 01 и продемонстрировать полезную работу на территории компании «Фигур» к концу 2023 года – и хотя на данный момент этого, похоже, не произошло, возможность наблюдать и учиться в гуманоид — это действительно большая новость.
Демонстрация, о которой идет речь, заметьте, не самая впечатляющая задача; Фигурка робота показана работающей с кофемашиной Keurig с чашкой в ней. Он реагирует на устную команду, открывает верхний люк, засовывает капсулу с кофе, закрывает люк, нажимает кнопку и позволяет парню, который попросил кофе, самому взять полную чашку из машины. Проверьте это:
Figure-01 has learned to make coffee ☕️
Our AI learned this after watching humans make coffee
This is end-to-end AI: our neural networks are taking video in, trajectories out
Join us to train our robot fleet: https://t.co/egQy3iz3Kypic.twitter.com/Y0ksEoHZsW
— Brett Adcock (@adcock_brett) January 7, 2024
Так что да, будет справедливо сказать, Человек и машина Кёриг все еще выполняют здесь тяжелую работу – но дело не в этом. Дело в том, что робот Фигура потратил 10 часов на изучение видео и теперь может делать что-то самостоятельно. В свою библиотеку добавлено новое автономное действие, которое можно перенести на любого другого робота-фигуры, работающего в той же системе, посредством группового обучения.
Если этот процесс обучения устойчив к широкому спектру различных задач, то нет причин, по которым мы не должны смотреть новое видео, подобное этому, через день, поскольку 01 учится делать все: от чистки бананов до сложения страниц в папку. папка с кольцами, закручивать и снимать крышки банок, пользоваться гаечными ключами, дрелями, угловыми шлифовальными машинками и отвертками.
Пройдет немного времени, прежде чем он сможет найти на кухне чашку, проверить, подключен ли Keurig к сети и в нем достаточно воды, приготовить чертов кофе, нажимая кнопку, и принести его на стол, не пролив – сложные задачи, используя возможности ходьбы и способность ИИ большой языковой модели разбивать задачи на практические шаги.
Так что не зацикливайтесь на кофе; наблюдайте за этим пространством. Если робот Фигуры действительно умеет смотреть и учиться сейчас, мы почувствуем серьезный толчок ускорения на диком фронте коммерческой гуманоидной робототехники, когда наступит 2024 год. И даже если Fig переоценит свои возможности (не то чтобы какой-либо технологический стартап мечтал бы о таком) — это не продлится долго, и есть пара десятков других команд, маниакально спешащих создать роботов с такими возможностями. Это происходит.
Today we're unveiling our Figure 01 robot.
Watch as we demonstrate dynamic bipedal walking — a milestone the team was able to hit within 12 months of company inception.
Here are the details: pic.twitter.com/tSNVLioXpC
— Figure (@Figure_robot) October 17, 2023
Сейчас происходят вещи, которые даже пять лет назад были бы совершенно немыслимы. Похоже, мы находимся на переломном этапе технологического и социального переворота, более масштабного, чем сельскохозяйственная или промышленная революции, который может открыть мир невообразимой легкости и изобилия и/или, возможно, низвести 95% людей до статуса животных в зоопарках или комнатные растения.
Without internationally enforced speed limits on AI, humanity is very unlikely to survive. From AI's perspective in 2-3 years from now, we look more like plants than animals: big slow chunks of biofuel showing weak signs of intelligence when undisturbed for ages (seconds) on end.…
— Andrew Critch (h/acc) (@AndrewCritchPhD) July 16, 2023
Как вы относитесь ко всему этому, ребята? Лично я немного запутался. Мои брови могут подниматься только так высоко, и они там уже довольно давно. У меня появляются новые морщины на лбу.