Hãng công nghệ AI Hugging Face vừa giới thiệu SmolVLA, một mô hình AI điều khiển robot mới có thể hoạt động trên laptop thông thường như MacBook. Dù chỉ có 450 triệu tham số – con số nhỏ so với các mô hình AI lớn hiện nay – SmolVLA lại vượt trội hơn nhiều mẫu lớn trong cả môi trường mô phỏng lẫn thực tế, theo tuyên bố của công ty.
Mục tiêu của Hugging Face là “dân chủ hóa công nghệ robot”, giúp nhiều người dễ dàng tiếp cận và nghiên cứu các mô hình AI xử lý thị giác – ngôn ngữ – hành động (vision-language-action, viết tắt VLA). SmolVLA không chỉ là một mô hình AI, mà còn là phương pháp huấn luyện và đánh giá công nghệ robot đa năng, phù hợp cho nhiều ứng dụng khác nhau.
SmolVLA được huấn luyện trên dữ liệu chia sẻ công khai từ cộng đồng LeRobot – một sáng kiến trước đó của Hugging Face nhằm xây dựng kho dữ liệu, công cụ và mô hình dành riêng cho robot. Đây là bước tiếp theo trong chiến lược xây dựng hệ sinh thái phần cứng – phần mềm robot giá rẻ của công ty.
Năm ngoái, Hugging Face đã mua lại Pollen Robotics, startup robot đến từ Pháp, và công bố loạt thiết bị robot giá rẻ, bao gồm cả người máy hình người. Tất cả những thiết bị này đều tương thích với SmolVLA, mở ra khả năng thử nghiệm và triển khai robot ngay tại nhà.
Điểm thú vị là SmolVLA có thể chạy trên GPU phổ thông hoặc laptop, thay vì cần máy chủ chuyên dụng như các mô hình lớn khác. Thậm chí, một người dùng trên mạng xã hội X đã dùng SmolVLA để điều khiển cánh tay robot của bên thứ ba – cho thấy tiềm năng triển khai thực tế của mô hình này.
Ngoài ra, SmolVLA còn hỗ trợ xử lý bất đồng bộ – tức tách biệt quá trình ra quyết định hành động của robot với việc xử lý những gì robot thấy và nghe. Cách tiếp cận này giúp robot phản ứng nhanh hơn trong môi trường thay đổi liên tục, điều vốn là thách thức lớn với robot truyền thống.
Hugging Face không phải người chơi duy nhất. Nvidia, K-Scale Labs, Dyna Robotics, Physical Intelligence (được Jeff Bezos hậu thuẫn) và RLWRLD cũng đang đầu tư mạnh mẽ vào mảng robot mã nguồn mở (open-source robotics), cạnh tranh gay gắt trong cuộc đua đưa AI điều khiển robot trở nên phổ cập.
Hiện tại, SmolVLA đã được đăng tải công khai và có thể tải về trực tiếp trên nền tảng Hugging Face.