Startup công nghệ Z.ai của Trung Quốc vừa công bố hai mô hình ngôn ngữ lớn (LLM) mã nguồn mở mới: GLM-4.5 và GLM-4.5-Air. Hai model này nổi bật ở khả năng lập trình tự động, xử lý ngôn ngữ nâng cao và đặc biệt là tạo slide PowerPoint từ prompt. Sản phẩm đã sẵn sàng cho phép dùng và tích hợp API, nhắm vào lập trình viên cũng như doanh nghiệp cần AI tự vận hành.
GLM-4.5 và GLM-4.5-Air: Giải pháp AI toàn diện cho tạo nội dung và lập trình tự động
Z.ai vừa trình làng hai mô hình mã nguồn mở GLM-4.5 và GLM-4.5-Air, tập trung vào các nhiệm vụ như suy luận phức tạp, tác vụ agent, lập trình, và tự tạo tài liệu slide. Điểm đáng chú ý là GLM-4.5 đạt điểm số hàng đầu trên nhiều benchmark toàn cầu và có thể tự tạo PowerPoint hoàn chỉnh chỉ từ tiêu đề hoặc prompt, phục vụ hiệu quả cho giáo dục, hợp tác doanh nghiệp, báo cáo nội bộ.
Đặc điểm nổi bật và tính năng chính
- GLM-4.5 ngang hoặc vượt qua nhiều mô hình hàng đầu như Claude 4 Sonnet, Claude 4 Opus, Gemini 2.5 Pro, chỉ xếp sau OpenAI GPT-4 và xAI Grok 4 trong top 3 ở 12 benchmark quan trọng
- Cung cấp 2 chế độ hoạt động: Thinking mode (suy luận sâu, dùng công cụ) và No-thinking mode (phản hồi nhanh)
- Có thể tạo slide PowerPoint tự động, hỗ trợ sáng tác nội dung sáng tạo, PR thương hiệu, viết kịch bản cho social media
- Ứng dụng trong phát triển nhân vật ảo, đối thoại phân vai, hỗ trợ khách hàng, kể chuyện số
- GLM-4.5-Air tối ưu về tốc độ suy luận, phù hợp với nhóm cần chi phí vận hành thấp, inference nhanh
- Các phiên bản chuyên biệt: GLM-4.5-X, GLM-4.5-AirX (suy luận siêu tốc), GLM-4.5-Flash (miễn phí, tối ưu cho code & reasoning)
Hiệu suất benchmark và khả năng ứng dụng
- GLM-4.5 đạt 26.4% BrowseComp, vượt Claude 4 Opus (18.8%), 91% AIME24, 98.2% MATH 500 và dẫn đầu ở nhiều tác vụ code/agent
- GLM-4.5-Air vào top 6, lý tưởng cho tổ chức cần kiểm soát hiệu suất/chí phí
- Dễ tích hợp qua API, hỗ trợ vLLM, SGLang, inference chuẩn OpenAI-style
- Hỗ trợ streaming output, context caching và structured JSON responses – tối ưu cho hệ thống thời gian thực hoặc doanh nghiệp lớn
Kiến trúc kỹ thuật tinh gọn và khả năng đào tạo linh động
GLM-4.5 sử dụng kiến trúc Mixture-of-Experts với 355 tỷ parameters (32 tỷ active), bản Air nhẹ hơn với 106 tỷ tổng (12 tỷ active). Mô hình ứng dụng công nghệ Grouped-Query Attention, nhiều attention heads, lớp Multi-Token Prediction (MTP) cho decoding nhanh. Dữ liệu tiền huấn luyện trên 22 nghìn tỷ tokens và bổ sung 1,1 nghìn tỷ cho code chuyên biệt, reasoning dài.
Quy trình hậu huấn luyện dựa trên RL (reinforcement learning) nội bộ, với kỹ thuật rollouts mixed-precision và adaptive curriculum learning giúp tối ưu hóa hiệu suất agent. Theo CEO Zhang Peng (Nguồn: CNBC), GLM-4.5 chạy hiệu quả chỉ với 8 card NVIDIA H20, tiết kiệm tài nguyên phần cứng so với các đối thủ.
Chính sách sử dụng mã nguồn mở và giá dịch vụ API
Giấy phép Apache 2.0 và các kênh phân phối
- Toàn bộ mô hình phát hành dưới giấy phép Apache 2.0, linh hoạt sử dụng thương mại, tự lưu trữ, tuỳ chỉnh hoặc re-distribute
- Model code được đăng tải lên HuggingFace, ModelScope, tích hợp API qua Z.ai, vLLM và SGLang
- Hỗ trợ đầy đủ cho developer, dễ kết nối vào ứng dụng hoặc hệ thống doanh nghiệp
Bảng giá API cụ thể
- GLM-4.5: 0.60 USD/2.20 USD cho mỗi 1 triệu tokens input/output
- GLM-4.5-Air: 0.20 USD/1.10 USD cho mỗi 1 triệu tokens input/output
- Bảng giá ưu đãi khi dùng nhỏ lẻ: bản Air chỉ 0.11 USD/0.28 USD cho lô nhỏ (dưới 32,000 input + 200 output tokens/lần)
Lưu ý: Vì Z.ai đặt trụ sở tại Trung Quốc, các cá nhân/doanh nghiệp phương Tây cần kiểm tra tiêu chuẩn nội bộ khi làm việc với API về mặt dữ liệu.
Làn sóng mã nguồn mở AI Trung Quốc: Thách thức mới trên thị trường
Bên cạnh Z.ai, thị trường AI Trung Quốc liên tục xuất hiện các mô hình mã nguồn mở mạnh mẽ như Qwen của Alibaba, Moonshot với Kimi K2, định hình lại cuộc đua với các giải pháp thay thế mô hình đóng từ Mỹ. Các mô hình này đều phát hành giấy phép thương mại thân thiện (Apache 2.0), hỗ trợ tự triển khai và hoạt động trong nhiều hệ thống.
Llama 4 của Meta và OpenAI đều đối mặt sức ép về tính minh bạch và hiệu suất khi cộng đồng AI ngày càng kỳ vọng cao với mã nguồn mở thực sự.
Cơ hội cho doanh nghiệp, kỹ sư AI và developer toàn cầu
GLM-4.5 và Air tối ưu cho doanh nghiệp và developer, đặc biệt những ai muốn làm chủ nền tảng AI, audit, tích hợp theo tiêu chuẩn bảo mật riêng. Mô hình hỗ trợ liên thông tốt với các pipeline CI/CD, cloud hoặc on-premise, giảm chi phí thử nghiệm và tự động hóa V&V đầu-cuối.
Bộ đôi GLM-4.5 và GLM-4.5-Air từ Z.ai đang mở rộng biên giới ứng dụng AI mã nguồn mở tại Trung Quốc và toàn cầu. Nhờ hiệu suất benchmark xuất sắc, khả năng tích hợp linh hoạt cũng như chi phí cạnh tranh, hai mô hình này được kỳ vọng sẽ là nền tảng hấp dẫn cho cá nhân, doanh nghiệp và tổ chức nghiên cứu công nghệ AI.
