Sakana AI vừa công bố TreeQuest - framework mã nguồn mở tối ưu việc phối hợp nhiều mô hình ngôn ngữ lớn (LLM) trên cùng một tác vụ, giúp tăng hiệu suất giải quyết vấn đề lên hơn 30%. Phương pháp này hướng tới doanh nghiệp và các nhà phát triển mong muốn xây dựng hệ thống AI mạnh mẽ, linh hoạt hơn.
Sakana AI phát triển TreeQuest với chiến lược Multi-LLM AB-MCTS
Sakana AI, phòng thí nghiệm AI tại Nhật Bản, vừa giới thiệu kỹ thuật Multi-LLM AB-MCTS, cho phép nhiều mô hình AI hợp tác chặt chẽ để xử lý những nhiệm vụ phức tạp mà một LLM riêng biệt không thể hoàn thành. Phương pháp này lấy cảm hứng từ cách các đội nhóm con người vượt trội nhờ sự đa dạng chuyên môn.
Chi tiết về Multi-LLM AB-MCTS và TreeQuest
- Multi-LLM AB-MCTS: Thuật toán kết hợp các chiến lược tìm kiếm sâu (refine solution) và rộng (thử nghiệm ý tưởng mới) nhờ Monte Carlo Tree Search (MCTS).
- Tự động chọn mô hình thích hợp theo từng phần việc, dựa trên ưu nhược điểm của each LLM.
- TreeQuest là framework mã nguồn mở giúp lập trình viên triển khai mô hình Multi-LLM AB-MCTS cho nhiều ứng dụng thực tiễn.
- API linh hoạt cho phép tuỳ chỉnh chấm điểm và logic nhiệm vụ.
Hiệu quả thử nghiệm và các tính năng nổi bật
- TreeQuest giúp phối hợp các mô hình như o4-mini, Gemini 2.5 Pro, DeepSeek-R1 để giải đề trên benchmark ARC-AGI-2.
- Tỷ lệ giải thành công hơn 30% cho 120 bài kiểm tra, vượt mức của từng mô hình khi hoạt động độc lập.
- Hệ thống có khả năng "giao nhiệm vụ" thông minh: nếu một LLM mắc lỗi, output sẽ được các LLM khác kiểm tra và sửa sai.
- Giảm thiểu hiện tượng "hallucination" nhờ tận dụng điểm mạnh của từng model, cực kỳ hữu ích với doanh nghiệp.
- Mã nguồn TreeQuest có sẵn qua giấy phép Apache 2.0, dễ dàng tích hợp vào các dự án AI hiện tại.
Lợi ích cho doanh nghiệp và ứng dụng thực tế
Tối ưu giải pháp AI nhờ phối hợp LLM đa dạng
- Không bị phụ thuộc vào một nhà cung cấp AI riêng biệt.
- Dễ dàng chọn lựa và gán phần việc thích hợp cho mẫu AI mạnh nhất, tối ưu hiệu quả.
- Khả năng tuỳ chỉnh giải thuật và điểm số đánh giá phù hợp với bài toán thực tiễn của tổ chức.
- Giảm thiểu rủi ro của từng mô hình riêng biệt (ví dụ: vấn đề phát sinh "hallucination").
TreeQuest ứng dụng rộng rãi vượt ngoài bài test ARC-AGI-2
Nghiên cứu còn thử nghiệm thành công AB-MCTS ở các tác vụ như viết mã thuật toán phức tạp, tối ưu hoá mô hình machine learning, và cả cải tiến hiệu năng phần mềm thông qua cách tiếp cận thử-sai liên tục.
TreeQuest và thuật toán Multi-LLM AB-MCTS từ Sakana AI đã chứng minh hiệu quả vượt trội khi phối hợp nhiều LLM trong giải quyết bài toán khó. Framework mới này mở ra nhiều cơ hội cho các doanh nghiệp và cá nhân xây dựng hệ thống AI linh hoạt, chính xác và giảm rủi ro so với sử dụng một mô hình đơn lẻ.
