شهدت خدمات Amazon Web Services (AWS)، أكبر مزود للحوسبة السحابية عالميًا، انقطاعًا واسع النطاق
صباح الإثنين 20 أكتوبر 2025، مما أدى إلى توقف أو تباطؤ عشرات المنصات والخدمات الرقمية حول العالم.
بدأت المشكلة حوالي الساعة 06:56 بالتوقيت العالمي (09:56 بتوقيت مكة)، وتركزت في منطقة US-EAST-1 (فرجينيا الشمالية)، وهي المنطقة الأكثر ازدحامًا في شبكة AWS، حيث تعتمد عليها نسبة كبيرة من العملاء العالميين.
أبرز المنصات والخدمات المتأثرة:
أمازون نفسها: توقف جزئي في موقع التسوق، وخدمات مثل برايم فيديو وأليكسا.
منصات التواصل الاجتماعي: سناب شات، سيغنال.
الألعاب الإلكترونية: فورتنايت، روبلوكس.
الخدمات المالية: كوين بيس، روبن هود، فينمو.
أدوات الإنتاجية: كانفا، أسانا.
تطبيقات أخرى مثل طلبات ماكدونالدز ودولينغو.
وفقًا لـ Downdetector، تم تسجيل أكثر من 4 ملايين بلاغ عن مشاكل في الخدمات خلال الساعات الأولى، وهو أكثر من ضعف المعدل اليومي المعتاد.
السبب المبدئي:
أعلنت AWS أن العطل مرتبط بخلل في نظام أسماء النطاقات (DNS) الخاص بخدمة DynamoDB في منطقة US-EAST-1، مما أدى إلى سلسلة من الأعطال في خدمات أخرى.
ثانيًا: التحليل الفني للعطل:
النطاق الجغرافي والتأثير
تركز العطل في US-EAST-1، وهي منطقة حيوية تستضيف مراكز بيانات ضخمة، مما جعل التأثير عالميًا بسبب الاعتماد الكبير على هذه المنطقة.
الخدمات المتأثرة تقنيًا:
DynamoDB: قاعدة بيانات NoSQL عالية الاعتمادية، أي خلل فيها ينعكس على التطبيقات التي تعتمد عليها.
خدمات DNS الداخلية: أي مشكلة في نظام التوجيه تؤدي إلى فشل في استدعاء واجهات برمجة التطبيقات (APIs).
الأسباب المحتملة:
خلل في تحديثات الشبكة أو التكوينات.
زيادة مفاجئة في الحمل أدت إلى انهيار بعض المسارات.
الإجراءات التصحيحية:
AWS أعلنت أنها عملت على مسارات متوازية متعددة لإعادة الخدمة تدريجيًا.
تم رصد بوادر تعافٍ بعد حوالي 3 ساعات من بدء الانقطاع، لكن بعض الخدمات استمرت في مواجهة مشاكل حتى المساء.
الدروس المستفادة:
الاعتماد الكبير على منطقة واحدة (US-EAST-1) يمثل نقطة فشل حرجة.
ضرورة توزيع الحمل جغرافيًا واستخدام Multi-Region Architecture لتقليل المخاطر.