Meta vừa trình làng V-JEPA 2, mô hình AI thế hệ mới hỗ trợ các tác vụ trong môi trường vật lý. V-JEPA 2 giúp AI hiểu và dự đoán diễn biến xung quanh, hướng đến hỗ trợ robot thực thi nhiệm vụ thực tế hiệu quả hơn.
Meta đẩy mạnh phát triển mô hình AI hiểu môi trường thực
Ngày 4/6, Meta đã giới thiệu V-JEPA 2, phiên bản nâng cấp từ V-JEPA, đóng vai trò như một 'world model' giúp AI hiểu về thế giới vật lý. V-JEPA 2 được xây dựng dựa trên nền tảng đã huấn luyện trên hơn một triệu giờ video, giúp AI học hỏi cách các sự vật vận động và tương tác trong thực tế.
Khả năng dự đoán hành động thông minh
- V-JEPA 2 cho phép AI dự đoán các hành động tiếp theo dựa trên ngữ cảnh, giống với phản xạ tự nhiên của trẻ em hoặc động vật.
- Mô hình có thể xử lý các tình huống như dự báo hướng chuyển động của vật thể hoặc hành động của robot khi thực hiện công việc.
- Ví dụ, robot được giao nhiệm vụ đang vừa cầm đĩa, vừa cầm thìa; V-JEPA 2 đặt ra khả năng cao rằng robot sẽ dùng thìa để đẩy trứng từ chảo lên đĩa.
So sánh hiệu suất với mô hình khác
Theo Meta, V-JEPA 2 có tốc độ xử lý nhanh gấp 30 lần so với mô hình Cosmos của Nvidia, giúp AI dự báo các diễn biến vật lý hiệu quả hơn trong thời gian thực. Tuy nhiên, kết quả này được đo lường theo các chuẩn riêng của Meta.
Tiềm năng ứng dụng trong lĩnh vực robot và agent AI
V-JEPA 2 mở ra khả năng lớn cho AI hỗ trợ các công việc vận động thực tế, giúp giảm đáng kể nhu cầu về dữ liệu huấn luyện robot. Theo ông Yann LeCun, Chief AI Scientist của Meta, đây là bước tiến quan trọng, đưa robot và AI đến gần hơn với khả năng đáp ứng các nhiệm vụ hàng ngày trong thế giới thực.
V-JEPA 2 của Meta đánh dấu bước tiến lớn trong việc giúp AI hiểu và phản ứng với thế giới vật lý như con người. Nhờ tốc độ xử lý nhanh và khả năng dự đoán chính xác, mô hình này hứa hẹn tạo nền tảng vững chắc cho thế hệ robot và AI agent mới.
