Tencent trình làng R-Zero: LLM tự huấn luyện, không cần dữ liệu gán nhãn - AI News Hub