Hugging Face vừa công bố SmolVLA, mô hình AI dành cho robotics với hiệu suất cao và cực kỳ tiết kiệm tài nguyên. Mô hình này có thể chạy trực tiếp trên MacBook hoặc phần cứng giá rẻ, giúp phát triển robot trở nên dễ tiếp cận hơn cho mọi người.
SmolVLA: Mô hình AI nhẹ cho robotics từ Hugging Face
SmolVLA là mô hình vision-language-action (VLA) mới do Hugging Face phát triển nhằm dân chủ hóa công nghệ robotics và mở rộng nghiên cứu về các robot đa năng. SmolVLA được huấn luyện trên bộ dữ liệu cộng đồng do LeRobot cung cấp, với dữ liệu phù hợp về bản quyền được chia sẻ bởi cộng đồng phát triển AI.
Đặc điểm nổi bật của SmolVLA
- Kích thước chỉ 450 triệu tham số (parameters), giúp dễ triển khai trên phần cứng phổ thông như MacBook hoặc GPU tiêu chuẩn.
- Vượt trội về hiệu suất so với các mô hình lớn khác trong môi trường ảo lẫn thực tế, theo tuyên bố của Hugging Face.
- Hỗ trợ stack "asynchronous inference" cho phép tách xử lý hành động và xử lý cảm biến (thị giác, âm thanh), giúp robot phản ứng nhanh hơn trong các tình huống thay đổi.
- Tích hợp và dễ dàng kiểm thử trên các hệ thống phần cứng giá rẻ do chính Hugging Face cung cấp.
Hệ sinh thái robotics mở rộng của Hugging Face
SmolVLA nằm trong chiến lược phát triển hệ sinh thái robotics chi phí thấp của Hugging Face. Trước đó, công ty từng ra mắt LeRobot với các mô hình, bộ dữ liệu và công cụ cho robotics. Gần đây, Hugging Face cũng đã mua lại Pollen Robotics và công bố một số hệ thống robot giá rẻ, bao gồm cả robot hình người.
Ứng dụng thực tiễn và xu hướng phát triển
Tích hợp dễ dàng và minh bạch
SmolVLA được phát hành công khai trên nền tảng Hugging Face, cho phép cộng đồng tải về sử dụng, thử nghiệm và phát triển, đáp ứng nhu cầu từ cá nhân đến doanh nghiệp nhỏ trong lĩnh vực robotics. Một người dùng trên X đã thử nghiệm SmolVLA với cánh tay robot Koch Arm trên GPU RTX 2050 và đạt kết quả so sánh ấn tượng so với baseline.
Cạnh tranh trong lĩnh vực robotics mã nguồn mở
Bên cạnh Hugging Face, các tên tuổi lớn như Nvidia, K-Scale Labs, Dyna Robotics, Physical Intelligence hậu thuẫn bởi Jeff Bezos, và RLWRLD cũng đẩy mạnh phát triển công cụ và mô hình robotics mở, cho thấy tiềm năng phát triển mạnh mẽ của lĩnh vực này.
SmolVLA của Hugging Face đánh dấu bước tiến mới trong việc phổ cập mô hình AI cho robotics, với kích thước nhỏ, hiệu suất cao và khả năng triển khai trên phần cứng phổ thông. Đại diện cho xu hướng democratize công nghệ robotics, SmolVLA đang là giải pháp hữu ích cho cộng đồng phát triển và thử nghiệm robot.
