البرنامج التعليمي

تصنيف خوارزميات التعلم الآلي: الانحدار الخطي والتصنيف والتكتل

التعلم الآلي له أوجه تشابه كبيرة مع التحسين الرياضي ، والذي يوفر طرقًا ونظريات ومجالات تطبيق. 

تمت صياغة التعلم الآلي على أنه "مشاكل تقليل" لوظيفة الخسارة مقابل مجموعة معينة من الأمثلة (مجموعة التدريب). تعبر هذه الميزة عن التناقض بين القيم التي تنبأ بها النموذج الذي يتم تدريبه والقيم المتوقعة لكل مثيل مثال. 

الهدف النهائي هو تعليم النموذج القدرة على التنبؤ بشكل صحيح على مجموعة من الحالات غير الموجودة في مجموعة التدريب.

الطريقة التي يمكن من خلالها التمييز بين فئات مختلفة من الخوارزمية هي نوع الإخراج المتوقع من نظام معين من آلة التعلم

من بين الفئات الرئيسية نجد:

  • La تصنيف: يتم تقسيم المدخلات إلى فئتين أو أكثر ويجب أن ينتج نظام التعلم نموذجًا قادرًا على تخصيص فئة واحدة أو أكثر من بين تلك المتاحة للمدخلات.تتم معالجة هذه الأنواع من المهام عادةً باستخدام تقنيات التعلم تحت الإشراف. 

    مثال على التصنيف هو تخصيص علامة واحدة أو أكثر لصورة بناءً على الكائنات أو الموضوعات الموجودة فيها ؛

  • La تراجع: يشبه من الناحية المفاهيمية التصنيف مع الاختلاف في أن الناتج له مجال مستمر وغير منفصل.تدار عادة من خلال التعلم تحت الإشراف. 

    مثال على الانحدار هو تقدير عمق المشهد من تمثيله في شكل صورة ملونة. 

    في الواقع ، مجال المخرجات المعنية هو في الواقع لانهائي ، ولا يقتصر على مجموعة منفصلة معينة من الاحتمالات ؛

  • Il المجموعات: أين هي تنقسم مجموعة البيانات إلى مجموعات غير معروفة مسبقًا ، على عكس التصنيف.إن طبيعة المشكلات التي تنتمي إلى هذه الفئة تجعلها عادةً مهام تعليمية غير خاضعة للإشراف.
نموذج الانحدار الخطي البسيط

الانحدار الخطي هو amنموذج مستخدم على نطاق واسع لتقدير القيم الحقيقية مثل:

  • تكلفة المنازل ،
  • عدد المكالمات
  • إجمالي المبيعات لكل شخص ،

ويتبع معيار المتغيرات المستمرة:

  • متر مربع،
  • الاشتراك في حساب جاري ،
  • تعليم الشخص

في الانحدار الخطي ، يتم اتباع العلاقة بين المتغيرات المستقلة والمتغيرات التابعة من خلال خط يمثل عادةً العلاقة بين المتغيرين.

يُعرف الخط الملائم بخط الانحدار ويتم تمثيله بمعادلة خطية من النوع Y = a * X + b.

تعتمد الصيغة على استيفاء البيانات لربط خاصيتين أو أكثر ببعضهما البعض. عندما تقوم بتزويد الخوارزمية بخاصية إدخال ، فإن الانحدار يُرجع الخاصية الأخرى.

نموذج الانحدار الخطي المتعدد

عندما يكون لدينا أكثر من متغير مستقل ، فإننا نتحدث عن الانحدار الخطي المتعدد ، بافتراض نموذج مثل ما يلي:


ص = ب0 + ب1x1 + ب2x2 +… + بnxn

  • y هي الاستجابة للقيم ، أي أنها تمثل النتيجة التي تنبأ بها النموذج ؛
  • b0 هو التقاطع ، أي قيمة y عند xi كلهم يساوي 0 ؛
  • السمة الأولى ب1 هو معامل x1;
  • بعد ميزة أخرى بn هو معامل xn;
  • x1,x2، ... ، Xn هي المتغيرات المستقلة للنموذج.

تشرح المعادلة بشكل أساسي العلاقة بين متغير تابع مستمر (y) ومتغيرين مستقلين أو أكثر (x1 ، x2 ، x3 ...). 

على سبيل المثال ، إذا أردنا تقدير انبعاثات ثاني أكسيد الكربون من سيارة (متغير تابع y) مع مراعاة قوة المحرك وعدد الأسطوانات واستهلاك الوقود. هذه العوامل الأخيرة هي المتغيرات المستقلة x2 و x1 و x2. الثوابت ثنائية هي أرقام حقيقية وتسمى معاملات الانحدار المقدرة للنموذج. Y هو المتغير التابع المستمر ، أي أنه مجموع b3 ، b0 x1 ، b1 x2 ، إلخ. سيكون y عددًا حقيقيًا.

تحليل الانحدار المتعدد هو طريقة تستخدم لتحديد تأثير المتغيرات المستقلة على المتغير التابع.

إن فهم كيفية تغير المتغير التابع مع تغير المتغيرات المستقلة يسمح لنا بالتنبؤ بتأثيرات أو تأثيرات التغييرات في المواقف الحقيقية.

باستخدام الانحدار الخطي المتعدد ، من الممكن فهم كيفية تغير ضغط الدم مع تغير مؤشر كتلة الجسم مع مراعاة عوامل مثل العمر والجنس وما إلى ذلك ، وبالتالي افتراض ما يمكن أن يحدث.

مع الانحدار المتعدد يمكننا الحصول على تقديرات لاتجاهات الأسعار ، مثل الاتجاه المستقبلي للنفط أو الذهب.

أخيرًا ، يجد الانحدار الخطي المتعدد اهتمامًا أكبر في مجال التعلم الآلي والذكاء الاصطناعي لأنه يسمح بالحصول على نماذج التعلم المؤدية حتى في حالة وجود عدد كبير من السجلات المراد تحليلها.

نموذج الانحدار اللوجستي

الانحدار اللوجستي هو أداة إحصائية تهدف إلى نمذجة نتيجة ذات حدين بمتغير واحد أو أكثر من المتغيرات التفسيرية.

يتم استخدامه بشكل عام للمسائل الثنائية ، حيث يوجد فئتان فقط ، على سبيل المثال نعم أو لا ، 0 أو 1 ، ذكر أو أنثى ، إلخ ...

وبهذه الطريقة يمكن وصف البيانات وشرح العلاقة بين متغير ثنائي تابع ومتغير واحد أو أكثر من المتغيرات المستقلة الاسمية أو الترتيبية.

يتم تحديد النتيجة بفضل استخدام وظيفة لوجستية ، والتي تقدر الاحتمالية ثم defiينهي أقرب فئة (موجبة أو سلبية) لقيمة الاحتمال التي تم الحصول عليها.

يمكننا اعتبار الانحدار اللوجستي طريقة لتصنيف عائلة خوارزميات التعلم تحت الإشراف.

باستخدام الأساليب الإحصائية ، يسمح الانحدار اللوجستي بتوليد نتيجة تمثل ، في الواقع ، احتمال أن تنتمي قيمة إدخال معينة إلى فئة معينة.

في مشاكل الانحدار اللوجستي ذات الحدين ، يكون احتمال أن ينتمي الناتج إلى فئة واحدة هو P ، بينما ينتمي إلى الفئة الأخرى 1-P (حيث P هو رقم بين 0 و 1 لأنه يعبر عن احتمال).

يعمل الانحدار اللوجستي ذي الحدين بشكل جيد في جميع الحالات التي يكون فيها المتغير الذي نحاول التنبؤ به ثنائيًا ، أي أنه يمكن أن يأخذ قيمتين فقط: القيمة 1 التي تمثل الفئة الموجبة ، أو القيمة 0 التي تمثل الفئة السالبة.

أمثلة على المشاكل التي يمكن حلها عن طريق الانحدار اللوجستي هي:

  • البريد الإلكتروني هو بريد عشوائي أم لا ؛
  • الشراء عبر الإنترنت احتيالي أم لا ، وتقييم شروط الشراء ؛
  • المريض يعاني من كسر ، وتقييم نصف قطره.

باستخدام الانحدار اللوجستي ، يمكننا إجراء تحليل تنبؤي ، وقياس العلاقة بين ما نريد توقعه (متغير تابع) ومتغير واحد أو أكثر ، أي الخصائص. يتم تقدير الاحتمالية من خلال وظيفة لوجستية.

يتم تحويل الاحتمالات لاحقًا إلى قيم ثنائية ، ومن أجل جعل التنبؤ حقيقيًا ، يتم تخصيص هذه النتيجة للفئة التي تنتمي إليها ، بناءً على ما إذا كانت قريبة من الفئة نفسها أم لا.

على سبيل المثال ، إذا كان تطبيق الوظيفة اللوجيستية يعيد 0,85 ، فهذا يعني أن المدخلات ولّدت فئة موجبة عن طريق تخصيصها للفئة 1. وبالعكس إذا حصلت على قيمة مثل 0,4 أو بشكل أكثر عمومًا <0,5 ..

النشرة الإخبارية
لا تفوّت أهم أخبار الابتكار. قم بالتسجيل لتلقيهم عن طريق البريد الإلكتروني.

يستخدم الانحدار اللوجستي الوظيفة اللوجستية لتقييم تصنيف قيم الإدخال.

الوظيفة اللوجيستية ، والتي تسمى أيضًا السيني ، هي منحنى قادر على أخذ أي عدد من القيمة الحقيقية وتعيينه إلى قيمة بين 0 و 1 ، باستثناء النهايات. الوظيفة هي:

حيث:

  • هـ: أساس اللوغاريتمات الطبيعية (رقم أويلر أو دالة إكسل ())
  • b0 + b1 * x: هي القيمة الرقمية الفعلية التي تريد تحويلها.

التمثيل المستخدم للانحدار اللوجستي

يستخدم الانحدار اللوجستي معادلة كتمثيل ، مثل الانحدار الخطي

يتم دمج قيم الإدخال (س) خطيًا باستخدام الأوزان أو قيم المعامل ، للتنبؤ بقيمة الإخراج (ص). يتمثل الاختلاف الرئيسي عن الانحدار الخطي في أن قيمة الإخراج النموذجية هي قيمة ثنائية (0 أو 1) بدلاً من قيمة رقمية.

فيما يلي مثال على معادلة الانحدار اللوجستي:

ص = ه ^ (b0 + b1 * س) / (1 + ه ^ (b0 + b1 * س))

حيث:

  • y هو المتغير التابع ، أي القيمة المتوقعة ؛
  • b0 هو مصطلح الاستقطاب أو التقاطع ؛
  • b1 هو المعامل لقيمة المدخلات الفردية (x).

يحتوي كل عمود في بيانات الإدخال على معامل b مرتبط (قيمة حقيقية ثابتة) يجب تعلمه من بيانات التدريب.

التمثيل الفعلي للنموذج الذي ستقوم بتخزينه في الذاكرة أو ملف هو المعاملات في المعادلة (قيمة بيتا أو قيمة ب).

يتنبأ الانحدار اللوجستي بالاحتمالات (النطاق الفني)

نماذج الانحدار اللوجستي احتمالية الفئة الافتراضية.

كمثال ، لنفترض أننا نمذجة جنس الناس كذكر أو أنثى من طولهم ، يمكن أن تكون الفئة الأولى ذكرًا ، ويمكن كتابة نموذج الانحدار اللوجستي على أنه احتمال أن يكون المرء ذكرًا نظرًا لارتفاع الشخص ، أو أكثر. رسميا:

ف (الجنس = ذكر | الطول)

مكتوب بطريقة أخرى ، نحن نمذجة احتمال أن أحد المدخلات (X) ينتمي إلى الفئة السابقةdefinite (Y = 1) ، يمكننا كتابتها على النحو التالي:

الفوسفور (س) = الفوسفور (ص = 1 | س)

يجب تحويل التنبؤ الاحتمالي إلى قيم ثنائية (0 أو 1) من أجل إجراء توقع احتمالي بالفعل.

الانحدار اللوجستي هو طريقة خطية ، لكن التنبؤات يتم تحويلها باستخدام الوظيفة اللوجستية. تأثير ذلك هو أننا لم نعد قادرين على فهم التنبؤات كمجموعة خطية من المدخلات كما نستطيع مع الانحدار الخطي ، على سبيل المثال ، المتابعة من الأعلى ، يمكن التعبير عن النموذج على النحو التالي:

ص (X) = e ^ (b0 + b1 * X) / (1 + e ^ (b0 + b1 * X))

الآن يمكننا عكس المعادلة على النحو التالي. لعكس ذلك ، يمكننا المضي قدمًا عن طريق إزالة e من جانب بإضافة لوغاريتم طبيعي على الجانب الآخر.

ln (p (X) / 1 - p (X)) = b0 + b1 * X

بهذه الطريقة نحصل على حقيقة أن حساب الناتج على اليمين يكون خطيًا مرة أخرى (تمامًا مثل الانحدار الخطي) ، والمدخلات على اليسار هي لوغاريتم احتمالية الفئة الافتراضية.

يتم حساب الاحتمالات كنسبة من احتمال وقوع الحدث مقسومًا على احتمال عدم وجود حدث ، على سبيل المثال 0,8 / (1-0,8) نتيجته 4. لذلك يمكننا بدلاً من ذلك كتابة:

ln (الاحتمالات) = b0 + b1 * X

نظرًا لأن الاحتمالات يتم تحويلها إلى سجل ، فإننا نسمي هذا الاحتمالات أو الاحتمالات على الجانب الأيسر.

يمكننا إعادة الأس إلى اليمين وكتابته على النحو التالي:

الاحتمال = e ^ (b0 + b1 * X)

كل هذا يساعدنا على فهم أن النموذج لا يزال في الواقع مزيجًا خطيًا من المدخلات ، لكن هذه المجموعة الخطية تشير إلى احتمالات السجل للفئة السابقةdefiنيتا.

تعلم نموذج الانحدار اللوجستي

يتم تقدير المعاملات (قيم بيتا أو ب) لخوارزمية الانحدار اللوجستي في مرحلة التعلم. للقيام بذلك ، نستخدم أقصى تقدير للاحتمالية.

تقدير الاحتمالية القصوى هو خوارزمية تعليمية تستخدمها العديد من خوارزميات التعلم الآلي. تتنبأ المعاملات الناتجة عن النموذج بقيمة قريبة جدًا من 1 (على سبيل المثال ذكر) للفصل الدراسي السابقdefinite وقيمة قريبة جدًا من 0 (على سبيل المثال أنثى) للفئة الأخرى. أقصى احتمال للانحدار اللوجستي هو إجراء لإيجاد قيم للمعاملات (قيم بيتا أو قيم ob) التي تقلل الخطأ في الاحتمالات التي تنبأ بها النموذج بالنسبة لتلك الموجودة في البيانات (على سبيل المثال ، الاحتمال 1 إذا كانت البيانات هي الفئة الأساسية) .

سنستخدم خوارزمية تصغير لتحسين أفضل قيم المعامل لبيانات التدريب. غالبًا ما يتم تنفيذ ذلك في الممارسة العملية باستخدام خوارزمية تحسين رقمية فعالة.

Ercole Palmeri


النشرة الإخبارية
لا تفوّت أهم أخبار الابتكار. قم بالتسجيل لتلقيهم عن طريق البريد الإلكتروني.

المقالات الأخيرة

يوقع الناشرون وOpenAI اتفاقيات لتنظيم تدفق المعلومات التي تتم معالجتها بواسطة الذكاء الاصطناعي

أعلنت صحيفة فاينانشيال تايمز يوم الاثنين الماضي عن صفقة مع OpenAI. "فاينانشيال تايمز" ترخص صحافتها ذات المستوى العالمي...

أبريل 30 2024

المدفوعات عبر الإنترنت: إليك كيف تجعلك خدمات البث تدفع إلى الأبد

يدفع الملايين من الأشخاص مقابل خدمات البث، ويدفعون رسوم الاشتراك الشهرية. من الشائع أنك…

أبريل 29 2024

يتميز Veeam بالدعم الأكثر شمولاً لبرامج الفدية، بدءًا من الحماية وحتى الاستجابة والاسترداد

سوف تستمر شركة Coveware by Veeam في تقديم خدمات الاستجابة لحوادث الابتزاز السيبراني. ستوفر Coveware إمكانات الطب الشرعي والمعالجة...

أبريل 23 2024

الثورة الخضراء والرقمية: كيف تعمل الصيانة التنبؤية على تغيير صناعة النفط والغاز

تُحدث الصيانة التنبؤية ثورة في قطاع النفط والغاز، من خلال اتباع نهج مبتكر واستباقي لإدارة المحطات.

أبريل 22 2024

اقرأ الابتكار بلغتك

النشرة الإخبارية
لا تفوّت أهم أخبار الابتكار. قم بالتسجيل لتلقيهم عن طريق البريد الإلكتروني.

تابعنا