Alibaba ra mắt Qwen3-Coder-480B-A35B-Instruct: Mô hình AI mã nguồn mở chuyên lập trình mạnh nhất hiện nay

Alibaba vừa ra mắt Qwen3-Coder-480B-A35B-Instruct, mô hình ngôn ngữ lớn (LLM) mã nguồn mở chuyên biệt cho hỗ trợ lập trình viên và doanh nghiệp phát triển phần mềm. Mô hình này được đánh giá cao về hiệu suất thực thi tác vụ và linh hoạt tích hợp trên nhiều nền tảng, phù hợp cho cả cá nhân lẫn tổ chức.

Qwen3-Coder-480B-A35B-Instruct: Mô hình AI mã nguồn mở tối ưu cho lập trình

Đội ngũ Qwen Team của Alibaba tiếp tục gây ấn tượng trên thị trường AI khi cho ra mắt Qwen3-Coder-480B-A35B-Instruct, một mô hình ngôn ngữ chuyên biệt hỗ trợ công việc phát triển phần mềm với hiệu suất mạnh mẽ. Không chỉ mở mã nguồn tự do sử dụng dưới license Apache 2.0, mô hình này còn cho phép download, chỉnh sửa và triển khai trực tiếp phục vụ sản phẩm, ứng dụng doanh nghiệp mà không cần trả phí bản quyền.

Thông số kỹ thuật nổi bật

Kết cấu Mixture-of-Experts (MoE) với 480 tỷ tham số, 35 tỷ tham số kích hoạt mỗi truy vấn.
Hỗ trợ context tới 256K tokens và có thể mở rộng tới 1 triệu tokens nhờ YaRN (Yet another RoPE extrapolatioN).
Có 62 layers, 96 attention heads (truy vấn), 8 attention heads (key-value).
Tối ưu cho tác vụ lập trình, theo dõi chỉ dẫn (instruction-following), bỏ qua hỗ trợ <think> block để giảm độ trễ.

Hiệu suất vượt trội trên các benchmark mở

SWE-bench Verified: 67.0% (standard), 69.6% (500-turn), vượt mặt nhiều đối thủ thương mại lớn.
So sánh: GPT-4.1 (54.6%) và Gemini 2.5 Pro Preview (49.0%), Claude Sonnet-4: 70.4%.
Đạt thành tích tốt ở các tác vụ lập trình đa ngôn ngữ, trình duyệt agentic, tool use, sinh code logic dài nhiều bước.

Khả năng tích hợp, triển khai mạnh mẽ

Công cụ & môi trường hỗ trợ lập trình viên

Qwen Code – công cụ CLI fork từ Gemini Code, dễ cài đặt qua npm hoặc source.
Hỗ trợ function calling, structured prompting, tích hợp với Node.js.
Kết nối nền tảng: Claude Code (qua DashScope), Cline, Ollama, LMStudio, MLX-LM, llama.cpp, KTransformers, cũng như trên Alibaba Cloud.

Kỹ thuật huấn luyện và hậu huấn luyện cho tác vụ AGI

Tiền huấn luyện trên 7,5 nghìn tỷ tokens (70% là code).
Code RL (Reinforcement Learning) – áp dụng cho bài toán logic, thực thi và kiểm chứng code đa dạng.
Long-horizon Agent RL – nâng cao năng lực lập kế hoạch nhiều bước, thích nghi với workflow thực tế kiểu SWE-bench.
Alibaba đầu tư hệ thống 20.000 môi trường song song cho huấn luyện và đánh giá khả năng tác vụ đa nhiệm phức tạp.

Giá trị cho doanh nghiệp và cộng đồng lập trình viên

Với license mở, Qwen3-Coder phù hợp để doanh nghiệp triển khai nội bộ hoặc qua cloud mà không lo bị khóa vendor hay tối ưu chi phí. Mô hình này hỗ trợ workflow CI/CD, auto pull request, hỗ trợ hiểu codebase lớn và tài liệu kỹ thuật – rất thích hợp cho các pipeline AI sản xuất quy mô lớn và đội nhóm phát triển linh hoạt.

Thiết lập, best practice và trải nghiệm thực tế

Qwen khuyến nghị setting: temperature=0.7, top_p=0.8, top_k=20, repetition_penalty=1.05.
Dài output đạt tối đa 65,536 tokens; hỗ trợ tốt với Transformers từ phiên bản 4.51.0.
APIs tương thích OpenAI, có sẵn các ví dụ Python SDK.
Cho phép định nghĩa custom tool – chủ động nhúng sâu vào workflow phát triển thực tế.

Phản hồi từ cộng đồng nghiên cứu, developer, kỹ sư AI rất tích cực. Nhà nghiên cứu @Raschka đánh giá đây là mô hình lập trình mã nguồn mở tốt nhất hiện nay; evaluator Wolfram Ravenwolf đã tích hợp thành công vào Claude Code bằng proxy riêng thiết lập với LiteLLM; giáo viên AI Kevin Nelson ghi nhận khả năng lĩnh hội context và thực nghiệm của mô hình qua simulation. Nhà sáng lập Twitter và Block, Jack Dorsey, cũng chia sẻ ủng hộ khi Qwen3-Coder phối hợp tốt với framework Goose của Block.

Tương lai: đa kích thước, rộng ứng dụng

Qwen Team lên kế hoạch phát hành thêm các phiên bản quy mô nhỏ hơn để tăng khả năng tiếp cận và tích hợp rộng rãi hơn cho các hệ thống AI trong nhiều lĩnh vực.

Qwen3-Coder-480B-A35B-Instruct của Alibaba đánh dấu một bước tiến lớn cho mã nguồn mở AI trong lĩnh vực lập trình. Với khả năng tích hợp linh hoạt, hiệu suất cao và giấy phép sử dụng mở, mô hình cực kỳ phù hợp cho doanh nghiệp và cộng đồng developer yêu cầu giải pháp AI lập trình vượt trội.