MiniMax, một startup AI từ Trung Quốc, vừa công bố MiniMax-M1 - mô hình mã nguồn mở với sức mạnh ngữ cảnh đạt tới 1 triệu token. Sản phẩm đáp ứng nhu cầu xử lý văn bản dài và thương mại hoá linh hoạt ngay từ thời điểm ra mắt.
MiniMax-M1 - Mô hình AI mã nguồn mở cho ứng dụng ngữ cảnh dài
MiniMax-M1 là sản phẩm chủ lực mới nhất của MiniMax, doanh nghiệp AI nổi bật với dự án Hailuo mô phỏng video chân thực. Mô hình vừa được công bố miễn phí theo giấy phép Apache 2.0, khuyến khích doanh nghiệp sử dụng cho mục đích thương mại cũng như tuỳ chỉnh, không gặp rào cản về bản quyền.
Khả năng xử lý siêu ngữ cảnh
- Cửa sổ ngữ cảnh lên đến 1 triệu token, phù hợp với các bài toán suy luận trên văn bản dài, tài liệu, dữ liệu lớn.
- Cho phép xuất tối đa 80.000 token mỗi lần, giúp tổng hợp và phân tích data hiệu quả.
Kiến trúc tối ưu chi phí và hiệu quả
- Áp dụng cấu trúc Mixture-of-Experts (tổ hợp chuyên gia), kết hợp thuật toán Lightning Attention tăng tốc và giảm chi phí suy luận.
- Gồm 456 tỷ tham số (parameters), đáp ứng nhu cầu về hiệu năng vượt trội.
- Chi phí huấn luyện được ghi nhận ở mức 534.700 USD, thấp hơn đáng kể với nhiều mô hình dẫn đầu thị trường.
Tính năng nổi bật của MiniMax-M1
Hiệu suất dưới kiểm thử và tuỳ chỉnh đa dạng
- Kết quả benchmark cho thấy MiniMax-M1 đạt độ chính xác cao, vượt trội nhiều đối thủ trong các tác vụ phức tạp.
- Hỗ trợ triển khai qua vLLM (Virtual Large Language Model), cho phép tích hợp linh hoạt vào nhiều hạ tầng số.
- Có thể gọi hàm có cấu trúc (structured function calling) để mở rộng kịch bản sử dụng AI.
Lựa chọn thích hợp cho doanh nghiệp muốn tối ưu chi phí
Với mô hình mã nguồn mở và chi phí triển khai dễ chịu, MiniMax-M1 là giải pháp hữu ích dành cho các tổ chức đang chú trọng đầu tư vào AI mà vẫn đảm bảo kiểm soát ngân sách.
MiniMax-M1 nổi bật với sức mạnh xử lý ngữ cảnh dài, kiến trúc hiện đại cùng chi phí hợp lý. Mô hình này đem đến sự linh hoạt cho doanh nghiệp và các tổ chức muốn mở rộng năng lực AI trên nền tảng mã nguồn mở.
