Mixture-of-Recursions tăng tốc suy luận LLM gấp đôi, tiết kiệm bộ nhớ cho doanh nghiệp - AI News Hub