ผู้สื่อข่าวรายงาน ช่วงบ่ายวันที่ 20 ต.ค. 68 มีรายงานว่า เกิดเหตุขัดข้องครั้งใหญ่ในระบบคลาวด์ของ Amazon Web Services หรือ AWS ส่งผลให้หลายบริการออนไลน์ประสบปัญหาขัดข้องครั้งใหญ่ ทำให้ไม่สามารถใช้งานได้ตามปกติ ทั้ง Amazon.com, Alexa, Snapchat, Fortnite, ChatGPT, Roblox, Duolingo, Canva, Ring, Airtable, Perplexity, ไปจนถึงแอปฯ McDonald’s และอีกหลายแพลตฟอร์มที่ใช้โครงสร้างพื้นฐานของ AWS
เว็บไซต์ติดตามสถานะระบบของ AWS รายงานว่า มีหลายบริการได้รับผลกระทบจากปัญหาการทำงานภายในดาต้าเซ็นเตอร์ภูมิภาค US-EAST-1 ในรัฐเวอร์จิเนียเหนือ (North Virginia) ซึ่งเป็นหนึ่งในโหนดสำคัญของโครงสร้างอินเทอร์เน็ตระดับโลก ขณะเดียวกันบริการในภูมิภาคอื่นทั่วโลกก็ได้รับผลกระทบตามไปด้วย
AWS ระบุว่า กำลังดำเนินการอย่างแข็งขันเพื่อบรรเทาผลกระทบและค้นหาต้นตอของปัญหา โดยจะให้ข้อมูลเพิ่มเติมภายใน 45 นาที หรือเร็วกว่านั้นหากมีรายละเอียดใหม่ พร้อมระบุว่าขณะนี้ กำลังตรวจสอบอัตราความผิดพลาด และความหน่วงของระบบ
นอกจากนี้ ยังมีผู้ใช้จำนวนมาก โพสต์รายงานบน Reddit ว่า Alexa ผู้ช่วยอัจฉริยะ ไม่สามารถตอบคำถามหรือทำงานตามคำสั่งได้ รวมถึงฟังก์ชันอัตโนมัติ เช่น การตั้งนาฬิกาปลุกก็ไม่ทำงาน ขณะที่บริการอื่น ๆ ที่รันอยู่บนระบบคลาวด์ของ AWS อย่าง Perplexity, Airtable, Canva และแอปฯ ของ McDonald’s ก็ไม่สามารถเข้าถึงได้เช่นกัน
ส่วนข้อมูลจากเว็บไซต์ Downdetector ซึ่งติดตามการล่มของบริการออนไลน์ เผยให้เห็นกราฟสีแดงจำนวนมาก ที่แสดงถึงการล่มของหลากหลายแอปฯ ที่เกิดขึ้นพร้อมกัน และสามารถยืนยันว่าปัญหาดังกล่าวไม่ได้จำกัดอยู่เพียงแอปฯ เดียว
ตัวอย่างบริการหลักที่ได้รับผลกระทบ
- โซเชียลมีเดีย: Snapchat
- เกม: Roblox, Fortnite, Epic Games Store, Clash Royale, Clash of Clans, Rocket League, Dead by Daylight, VRChat, Tom Clancy’s Rainbow Six Siege, PlayStation Network
- การทำงานและการศึกษา: Canva, Duolingo, Canvas by Instructure
- บริการของ Amazon: Amazon.com, Alexa, Ring, Amazon Prime Video
- การเงินและสตรีมมิ่ง: Venmo, Robinhood, Chime, Coinbase, Crunchyroll
ทั้งนี้ ดาต้าเซ็นเตอร์พื้นที่ US-EAST-1 เคยเกิดเหตุระบบล่มในปี 2020 2021 และ 2023 ซึ่งส่งผลกระทบเป็นวงกว้างเช่นกัน และต้องใช้เวลาหลายชั่วโมงก่อนที่ระบบจะกลับมาใช้งานได้ตามปกติ
AWS เผยสาเหตุการล่มเบื้องต้น
AWS ออกแถลงการณ์ล่าสุด ระบุถึงสาเหตุเบื้องต้นของปัญหาที่เกิดขึ้นว่า จากการตรวจสอบเบื้องต้น สาเหตุของการล่มในครั้งนี้ อาจเกี่ยวข้องกับการแก้ไขชื่อโดเมน (DNS resolution) ของปลายทาง (endpoint) ของบริการ DynamoDB ในภูมิภาคดังกล่าว ซึ่งขณะนี้ทีมวิศวกรกำลังดำเนินการหลายแนวทางเพื่อเร่งฟื้นฟูระบบให้กลับมาใช้งานได้เร็วที่สุด พร้อมยืนยันว่าปัญหานี้ส่งผลกระทบต่อบริการอื่น ๆ ภายในภูมิภาค US-EAST-1 ด้วย
นอกจากนี้ บริการหรือฟีเจอร์ระดับโลกของ AWS ที่พึ่งพาโครงสร้างในภูมิภาค US-EAST-1 เช่น การอัปเดต IAM (Identity and Access Management) และ DynamoDB Global Tables อาจได้รับผลกระทบเช่นกัน
AWS ยังแจ้งด้วยว่า ในช่วงเวลานี้ ลูกค้าอาจไม่สามารถสร้างหรืออัปเดตคำร้องขอความช่วยเหลือ (Support Cases) ได้ตามปกติ และแนะนำให้ผู้ใช้งานลองส่งคำขอ (requests) ที่ล้มเหลวอีกครั้งในภายหลัง
ที่มา: Data Economy / The Verge / AWS Service health