
Становится немного легче создавать сложные проекты по робототехнике дома.
AI Dev Platform Hearging Face выпущен ранее на этой неделе. Открытая модель AI для робототехники под названием Smolvla. Обученная «совместно лицензированным», наборы данных об сообществе, Smolvla превосходит гораздо более крупные модели для робототехники как в виртуальной, так и в реальной среде, обнимая заявления о лицах.
«Smolvla стремится демократизировать доступ к моделям Vision-Language-Action (VLA) и ускорить исследования по отношению к генеральным роботизированным агентам»,-пишет обнимающееся лицо в посте в блоге. «Smolvla — это не только легкая, но и способная модель, но и метод обучения и оценки генеральной робототехники (технологии)».
Smolvla является частью быстро расширяющихся усилий Hugging Face по созданию экосистемы недорогих оборудования и программного обеспечения для робототехники. В прошлом году компания запустила Lerobot, коллекцию моделей, наборов данных и инструментов, ориентированных на робототехнику. Совсем недавно объявил об объятиях Pollen Robotics, стартап робототехники, базирующейся во Франции, и обнародовал несколько недорогих систем робототехники, включая гуманоиды, для покупки.
Smolvla, который составляет 450 миллионов параметров, был обучен данных из наборов данных сообщества Lerobot, специально известных наборов данных о робототехнике, разделенных на платформе разработки AI Higing Face. Параметры, иногда называемые весами, являются внутренними компонентами модели, которая направляет ее поведение.
Объятие лица утверждает, что Smolvla достаточно мала, чтобы работать на одном потребительском графическом процессоре — или даже на MacBook — и может быть протестирована и развернута на «доступном» оборудовании, включая собственные системы робототехники компании.
В интересном повороте, Smolvla также поддерживает «асинхронную стек вывода», который, как говорит обнять лицо, позволяет модели отделять обработку действий робота от обработки того, что он видит и слышит. Как объясняет компания в своем блоге, «(б), как это разделение, роботы могут быстрее реагировать в быстро меняющихся средах».
Smolvla доступна для скачивания от обнимающего лица. Уже пользователь на X утверждает, что использовал модель для управления сторонним роботизированным руком:
Стоит отметить, что обнимающееся лицо далеко не единственного игрока в зарождающейся открытой гонке робототехники.
У Nvidia есть коллекция инструментов для открытой робототехники, а Labs Startup Ksale создает компоненты для того, что он называет «гуманоидами с открытым исходным кодом». Другие грозные фирмы в сегменте включают в себя Dyna Robotics, физический интеллект Джеффа Безоса и RLWRLD.