Theo trang công nghệ The Verge, nền tảng điện toán đám mây Amazon Web Services (AWS) đã gặp sự cố ngừng hoạt động quy mô lớn vào rạng sáng 19/10 (giờ Việt Nam). Vấn đề ảnh hưởng trực tiếp đến nhiều dịch vụ nổi tiếng đang vận hành trên hạ tầng AWS như Snapchat, Netflix, Disney+, Tinder, Roku, Fortnite, League of Legends, Alexa và công cụ AI Perplexity.
CEO Aravind Srinivas của Perplexity xác nhận trên X rằng nền tảng AI này đã ngừng hoạt động hoàn toàn, nguyên nhân được xác định là do sự cố từ AWS. Ông cho biết đội ngũ kỹ thuật đang phối hợp khẩn trương để khôi phục dịch vụ.
Trên các diễn đàn như Reddit, X (Twitter) hay Facebook, hàng nghìn người dùng báo cáo việc Alexa không phản hồi lệnh thoại, Snapchat không thể gửi tin nhắn, và Netflix load chậm bất thường. Trang theo dõi sự cố Downdetector cũng ghi nhận hơn 5.500 báo cáo lỗi AWS, cùng hàng chục nghìn thông báo liên quan từ các ứng dụng phụ thuộc nền tảng này.
AWS sau đó xác nhận sự cố xuất phát từ khu vực US-EAST-1, trung tâm dữ liệu đặt tại bang Virginia (Mỹ) – nơi tập trung lượng máy chủ lớn nhất của hệ thống. “Chúng tôi đã ghi nhận sự cố từ 3h11 (giờ địa phương) và đang nỗ lực khắc phục để giảm thiểu ảnh hưởng tới khách hàng,” đại diện Amazon cho biết.
Đến khoảng 18h (giờ Hà Nội), AWS thông báo phần lớn dịch vụ đã được khôi phục, tuy nhiên vẫn có một số hệ thống ghi nhận độ trễ cao hoặc gián đoạn cục bộ.
Ra mắt từ năm 2006, AWS là nền tảng điện toán đám mây lớn nhất thế giới, cung cấp hạ tầng lưu trữ, xử lý và phân phối dữ liệu cho hàng triệu doanh nghiệp, tổ chức và người dùng cá nhân. Các dịch vụ tiêu biểu của AWS gồm EC2 (máy chủ ảo), S3 (lưu trữ đám mây), Lambda (điện toán không máy chủ) và CloudFront (mạng phân phối nội dung).
Nhờ tính linh hoạt và mô hình “trả phí theo mức sử dụng”, AWS được nhiều công ty toàn cầu tin tưởng sử dụng, từ các startup nhỏ đến tập đoàn lớn như Netflix, Airbnb, Zoom, Samsung, Adobe. Tuy nhiên, việc phụ thuộc vào cùng một hạ tầng khiến các sự cố tại AWS thường tạo ra hiệu ứng domino, ảnh hưởng đến hàng loạt dịch vụ Internet cùng lúc.
Đây không phải lần đầu AWS gặp trục trặc. Trong các năm 2020, 2021 và 2023, khu vực US-EAST-1 cũng từng xảy ra các sự cố tương tự, khiến hàng chục website, ứng dụng và dịch vụ thương mại điện tử ngừng hoạt động nhiều giờ liền.
Giới chuyên môn cho rằng sự cố lần này tiếp tục gióng lên hồi chuông cảnh báo về mức độ phụ thuộc quá lớn vào các “ông lớn” đám mây như AWS, Google Cloud hay Microsoft Azure, đồng thời nhấn mạnh tầm quan trọng của việc đa dạng hóa hạ tầng số trong kỷ nguyên AI và dữ liệu toàn cầu.