London, 2024-12-03

Big Data

نظرة عامة

نظرة عامة على الدورة

في دورة البيانات الضخمة في الأكاديمية البريطانية للتدريب والتطوير، سيتعلم المتدربون كيف تدفع البيانات الضخمة التغيير التنظيمي والتحديات الرئيسية التي تواجهها المؤسسات عند محاولة تحليل مجموعات البيانات الضخمة.

سيستكشف المتدربون تقنيات أساسية مثل التنقيب عن البيانات ومعالجة التدفقات. سيتعلمون أيضًا كيفية تصميم وتنفيذ خوارزميات PageRank باستخدام MapReduce، وهو نموذج برمجي يسمح بالتوسع الهائل عبر المئات أو الآلاف من الخوادم في مجموعة Hadoop. ستغطي الدورة كيف حسنت البيانات الضخمة عمليات البحث على الويب وكيف تعمل أنظمة الإعلان عبر الإنترنت.

بنهاية هذه الدورة، سيكتسب المشاركون فهمًا أفضل للتطبيقات المختلفة لأساليب البيانات الضخمة في الصناعة والبحث.

الأهداف والفئة المستهدفة

من يجب أن يحضر؟

  • محللو البيانات
  • مهندسو البرمجيات
  • المبرمجون

المعرفة والفوائد:

بعد إكمال البرنامج، سيكون المشاركون قادرين على إتقان ما يلي:

  • المعرفة وتطبيق MapReduce
  • فهم معدل حدوث الأحداث في البيانات الضخمة
  • كيفية تصميم خوارزميات لمعالجة التدفقات وحساب العناصر المتكررة في البيانات الضخمة
  • فهم وتصميم خوارزميات PageRank
  • فهم خوارزميات السير العشوائي الأساسية
 
4o mini
محتوى البرنامج

محتوى الدورة

  • أساسيات العمل مع البيانات الضخمة:
    فهم الأربع V’s للبيانات الضخمة (الحجم، السرعة، والتنوع)؛ بناء نماذج للبيانات؛ فهم حدوث الأحداث النادرة في البيانات العشوائية.

  • الشبكات الإلكترونية والاجتماعية:
    فهم خصائص الشبكة والشبكات الاجتماعية؛ نمذجة الشبكات الاجتماعية؛ تطبيق خوارزميات لاكتشاف المجتمعات في الشبكات.

  • تجميع البيانات الضخمة:
    تجميع الشبكات الاجتماعية؛ تطبيق التجميع الهرمي؛ تطبيق تجميع k-means.

  • بحث الويب من جوجل:
    فهم مفهوم PageRank؛ تنفيذ الخوارزمية الأساسية لـ PageRank للرسوم البيانية المترابطة بشكل قوي؛ تنفيذ PageRank مع الضريبة للرسوم البيانية غير المترابطة بشكل قوي.

  • الحوسبة الموازية والموزعة باستخدام MapReduce:
    فهم العمارة للحوسبة الموزعة والموازية الضخمة؛ تطبيق MapReduce باستخدام Hadoop؛ حساب PageRank باستخدام MapReduce.

  • حساب الوثائق المشابهة في البيانات الضخمة:
    قياس أهمية الكلمات في مجموعة من الوثائق؛ قياس تشابه المجموعات والوثائق؛ تطبيق التجزئة الحساسة محليًا لحساب الوثائق المشابهة.

  • المنتجات المشتراة بشكل متكرر معًا في المتاجر:
    فهم أهمية مجموعات العناصر المتكررة؛ تصميم قواعد الارتباط؛ تنفيذ خوارزمية A-priori.

  • توصيات الأفلام والموسيقى:
    فهم الاختلافات في أنظمة التوصية؛ تصميم أنظمة التوصية المعتمدة على المحتوى؛ تصميم أنظمة التصفية التعاونية للتوصية.

  • نظام Google AdWordsTM:
    فهم نظام AdWords؛ تحليل الخوارزميات عبر الإنترنت من حيث نسبة المنافسة؛ استخدام المطابقة عبر الإنترنت لحل مشكلة AdWords.

  • تنقيب البيانات المتدفقة بسرعة:
    فهم أنواع الاستفسارات لتدفقات البيانات؛ تحليل طرق أخذ العينات لتدفقات البيانات؛ عد العناصر المميزة في تدفقات البيانات؛ تصفية تدفقات البيانات.

 
4o mini