Sáng ngày hôm nay, hàng loạt dịch vụ AI và web lớn bất ngờ bị ngừng hoạt động do sự cố trên Google Cloud Platform. Sự kiện ảnh hưởng tới các nền tảng AI nổi bật cùng nhiều website phổ biến, làm gián đoạn trải nghiệm người dùng trên toàn cầu.
Sự cố Google Cloud ảnh hưởng hàng loạt dịch vụ AI toàn cầu
Hàng loạt công cụ và nền tảng phát triển trí tuệ nhân tạo (AI) đã trải qua tình trạng ngừng hoạt động quy mô lớn do sự cố từ Google Cloud Platform (GCP). Sự việc xảy ra khoảng 10 giờ sáng (giờ PT), làm ảnh hưởng tới không chỉ hệ sinh thái AI mà còn nhiều website internet lớn.
Nhiều nền tảng AI và website lớn đồng loạt bị sập dịch vụ
- Các dịch vụ AI được sử dụng rộng rãi như ChatGPT, Claude, Replit, LlamaIndex nằm trong nhóm bị ảnh hưởng nặng nề.
- Nền tảng phát triển di động Firebase của Google cũng đồng thời gặp trục trặc.
- Các công cụ LlamaIndex’s LlamaCloud, Weights & Biases, Windsurf, Supabase và Replit ghi nhận lỗi nghiêm trọng.
- Bên cạnh công cụ AI, các trang Spotify, Discord cũng ghi nhận hiện tượng "down" trong cùng thời điểm.
Dịch vụ bị ảnh hưởng và cảnh báo từ Google
Theo xác nhận từ phát ngôn viên GCP, các dịch vụ như API Gateway, Agent Assist, Cloud Data Fusion, Contact Center AI Platform, Google App Engine, Google BigQuery, Google Cloud Storage, Identity Platform, Speech-to-Text, Text-to-Speech và Vertex AI Search nằm trong danh sách bị gián đoạn.
Người dùng được khuyến khích theo dõi bảng trạng thái dịch vụ công khai do Google cập nhật liên tục.
Đánh giá tác động và rủi ro hạ tầng đám mây
Phản ánh thách thức khi phụ thuộc một nhà cung cấp đám mây
Sự cố lần này cho thấy mức độ rủi ro khi các doanh nghiệp và người dùng đều tập trung vào một nền tảng dịch vụ cloud hoặc database duy nhất. Khi một mảnh ghép trong hệ thống đám mây gặp sự cố, nhiều doanh nghiệp và cá nhân có thể bị đình trệ truy cập, đăng nhập hoặc luồng dữ liệu bị gián đoạn.
Lịch sử sự cố và vị thế của Google Cloud
Google Cloud gần đây gia tăng sức mạnh tại mảng AI doanh nghiệp nhờ hàng loạt công cụ nhà phát triển mới. Tuy nhiên, các sự cố tương tự như lần này từng diễn ra, với lần lớn gần nhất vào tháng 7 năm ngoái khi CrowdStrike gây ra ảnh hưởng trên diện rộng đến người dùng Microsoft Windows.
Sự cố trên Google Cloud Platform một lần nữa nhấn mạnh rủi ro khi quá nhiều dịch vụ cùng phụ thuộc vào hạ tầng chung. Việc đảm bảo tính liên tục và phân tán hệ thống trở nên cấp thiết hơn bao giờ hết với các doanh nghiệp và cộng đồng AI.
