تمت صياغة التعلم الآلي على أنه "مشاكل تقليل" لوظيفة الخسارة مقابل مجموعة معينة من الأمثلة (مجموعة التدريب). تعبر هذه الميزة عن التناقض بين القيم التي تنبأ بها النموذج الذي يتم تدريبه والقيم المتوقعة لكل مثيل مثال.
الهدف النهائي هو تعليم النموذج القدرة على التنبؤ بشكل صحيح على مجموعة من الحالات غير الموجودة في مجموعة التدريب.
الطريقة التي يمكن من خلالها التمييز بين فئات مختلفة من الخوارزمية هي نوع الإخراج المتوقع من نظام معين من آلة التعلم.
من بين الفئات الرئيسية نجد:
مثال على التصنيف هو تخصيص علامة واحدة أو أكثر لصورة بناءً على الكائنات أو الموضوعات الموجودة فيها ؛
مثال على الانحدار هو تقدير عمق المشهد من تمثيله في شكل صورة ملونة.
في الواقع ، مجال المخرجات المعنية هو في الواقع لانهائي ، ولا يقتصر على مجموعة منفصلة معينة من الاحتمالات ؛
الانحدار الخطي هو amنموذج مستخدم على نطاق واسع لتقدير القيم الحقيقية مثل:
ويتبع معيار المتغيرات المستمرة:
في الانحدار الخطي ، يتم اتباع العلاقة بين المتغيرات المستقلة والمتغيرات التابعة من خلال خط يمثل عادةً العلاقة بين المتغيرين.
يُعرف الخط الملائم بخط الانحدار ويتم تمثيله بمعادلة خطية من النوع Y = a * X + b.
تعتمد الصيغة على استيفاء البيانات لربط خاصيتين أو أكثر ببعضهما البعض. عندما تقوم بتزويد الخوارزمية بخاصية إدخال ، فإن الانحدار يُرجع الخاصية الأخرى.
عندما يكون لدينا أكثر من متغير مستقل ، فإننا نتحدث عن الانحدار الخطي المتعدد ، بافتراض نموذج مثل ما يلي:
ص = ب0 + ب1x1 + ب2x2 +… + بnxn
تشرح المعادلة بشكل أساسي العلاقة بين متغير تابع مستمر (y) ومتغيرين مستقلين أو أكثر (x1 ، x2 ، x3 ...).
على سبيل المثال ، إذا أردنا تقدير انبعاثات ثاني أكسيد الكربون من سيارة (متغير تابع y) مع مراعاة قوة المحرك وعدد الأسطوانات واستهلاك الوقود. هذه العوامل الأخيرة هي المتغيرات المستقلة x2 و x1 و x2. الثوابت ثنائية هي أرقام حقيقية وتسمى معاملات الانحدار المقدرة للنموذج. Y هو المتغير التابع المستمر ، أي أنه مجموع b3 ، b0 x1 ، b1 x2 ، إلخ. سيكون y عددًا حقيقيًا.
تحليل الانحدار المتعدد هو طريقة تستخدم لتحديد تأثير المتغيرات المستقلة على المتغير التابع.
إن فهم كيفية تغير المتغير التابع مع تغير المتغيرات المستقلة يسمح لنا بالتنبؤ بتأثيرات أو تأثيرات التغييرات في المواقف الحقيقية.
باستخدام الانحدار الخطي المتعدد ، من الممكن فهم كيفية تغير ضغط الدم مع تغير مؤشر كتلة الجسم مع مراعاة عوامل مثل العمر والجنس وما إلى ذلك ، وبالتالي افتراض ما يمكن أن يحدث.
مع الانحدار المتعدد يمكننا الحصول على تقديرات لاتجاهات الأسعار ، مثل الاتجاه المستقبلي للنفط أو الذهب.
أخيرًا ، يجد الانحدار الخطي المتعدد اهتمامًا أكبر في مجال التعلم الآلي والذكاء الاصطناعي لأنه يسمح بالحصول على نماذج التعلم المؤدية حتى في حالة وجود عدد كبير من السجلات المراد تحليلها.
الانحدار اللوجستي هو أداة إحصائية تهدف إلى نمذجة نتيجة ذات حدين بمتغير واحد أو أكثر من المتغيرات التفسيرية.
يتم استخدامه بشكل عام للمسائل الثنائية ، حيث يوجد فئتان فقط ، على سبيل المثال نعم أو لا ، 0 أو 1 ، ذكر أو أنثى ، إلخ ...
وبهذه الطريقة يمكن وصف البيانات وشرح العلاقة بين متغير ثنائي تابع ومتغير واحد أو أكثر من المتغيرات المستقلة الاسمية أو الترتيبية.
يتم تحديد النتيجة بفضل استخدام وظيفة لوجستية ، والتي تقدر الاحتمالية ثم defiينهي أقرب فئة (موجبة أو سلبية) لقيمة الاحتمال التي تم الحصول عليها.
يمكننا اعتبار الانحدار اللوجستي طريقة لتصنيف عائلة خوارزميات التعلم تحت الإشراف.
باستخدام الأساليب الإحصائية ، يسمح الانحدار اللوجستي بتوليد نتيجة تمثل ، في الواقع ، احتمال أن تنتمي قيمة إدخال معينة إلى فئة معينة.
في مشاكل الانحدار اللوجستي ذات الحدين ، يكون احتمال أن ينتمي الناتج إلى فئة واحدة هو P ، بينما ينتمي إلى الفئة الأخرى 1-P (حيث P هو رقم بين 0 و 1 لأنه يعبر عن احتمال).
يعمل الانحدار اللوجستي ذي الحدين بشكل جيد في جميع الحالات التي يكون فيها المتغير الذي نحاول التنبؤ به ثنائيًا ، أي أنه يمكن أن يأخذ قيمتين فقط: القيمة 1 التي تمثل الفئة الموجبة ، أو القيمة 0 التي تمثل الفئة السالبة.
أمثلة على المشاكل التي يمكن حلها عن طريق الانحدار اللوجستي هي:
باستخدام الانحدار اللوجستي ، يمكننا إجراء تحليل تنبؤي ، وقياس العلاقة بين ما نريد توقعه (متغير تابع) ومتغير واحد أو أكثر ، أي الخصائص. يتم تقدير الاحتمالية من خلال وظيفة لوجستية.
يتم تحويل الاحتمالات لاحقًا إلى قيم ثنائية ، ومن أجل جعل التنبؤ حقيقيًا ، يتم تخصيص هذه النتيجة للفئة التي تنتمي إليها ، بناءً على ما إذا كانت قريبة من الفئة نفسها أم لا.
على سبيل المثال ، إذا كان تطبيق الوظيفة اللوجيستية يعيد 0,85 ، فهذا يعني أن المدخلات ولّدت فئة موجبة عن طريق تخصيصها للفئة 1. وبالعكس إذا حصلت على قيمة مثل 0,4 أو بشكل أكثر عمومًا <0,5 ..
يستخدم الانحدار اللوجستي الوظيفة اللوجستية لتقييم تصنيف قيم الإدخال.
الوظيفة اللوجيستية ، والتي تسمى أيضًا السيني ، هي منحنى قادر على أخذ أي عدد من القيمة الحقيقية وتعيينه إلى قيمة بين 0 و 1 ، باستثناء النهايات. الوظيفة هي:
حيث:
يستخدم الانحدار اللوجستي معادلة كتمثيل ، مثل الانحدار الخطي
يتم دمج قيم الإدخال (س) خطيًا باستخدام الأوزان أو قيم المعامل ، للتنبؤ بقيمة الإخراج (ص). يتمثل الاختلاف الرئيسي عن الانحدار الخطي في أن قيمة الإخراج النموذجية هي قيمة ثنائية (0 أو 1) بدلاً من قيمة رقمية.
فيما يلي مثال على معادلة الانحدار اللوجستي:
ص = ه ^ (b0 + b1 * س) / (1 + ه ^ (b0 + b1 * س))
حيث:
يحتوي كل عمود في بيانات الإدخال على معامل b مرتبط (قيمة حقيقية ثابتة) يجب تعلمه من بيانات التدريب.
التمثيل الفعلي للنموذج الذي ستقوم بتخزينه في الذاكرة أو ملف هو المعاملات في المعادلة (قيمة بيتا أو قيمة ب).
نماذج الانحدار اللوجستي احتمالية الفئة الافتراضية.
كمثال ، لنفترض أننا نمذجة جنس الناس كذكر أو أنثى من طولهم ، يمكن أن تكون الفئة الأولى ذكرًا ، ويمكن كتابة نموذج الانحدار اللوجستي على أنه احتمال أن يكون المرء ذكرًا نظرًا لارتفاع الشخص ، أو أكثر. رسميا:
ف (الجنس = ذكر | الطول)
مكتوب بطريقة أخرى ، نحن نمذجة احتمال أن أحد المدخلات (X) ينتمي إلى الفئة السابقةdefinite (Y = 1) ، يمكننا كتابتها على النحو التالي:
الفوسفور (س) = الفوسفور (ص = 1 | س)
يجب تحويل التنبؤ الاحتمالي إلى قيم ثنائية (0 أو 1) من أجل إجراء توقع احتمالي بالفعل.
الانحدار اللوجستي هو طريقة خطية ، لكن التنبؤات يتم تحويلها باستخدام الوظيفة اللوجستية. تأثير ذلك هو أننا لم نعد قادرين على فهم التنبؤات كمجموعة خطية من المدخلات كما نستطيع مع الانحدار الخطي ، على سبيل المثال ، المتابعة من الأعلى ، يمكن التعبير عن النموذج على النحو التالي:
ص (X) = e ^ (b0 + b1 * X) / (1 + e ^ (b0 + b1 * X))
الآن يمكننا عكس المعادلة على النحو التالي. لعكس ذلك ، يمكننا المضي قدمًا عن طريق إزالة e من جانب بإضافة لوغاريتم طبيعي على الجانب الآخر.
ln (p (X) / 1 - p (X)) = b0 + b1 * X
بهذه الطريقة نحصل على حقيقة أن حساب الناتج على اليمين يكون خطيًا مرة أخرى (تمامًا مثل الانحدار الخطي) ، والمدخلات على اليسار هي لوغاريتم احتمالية الفئة الافتراضية.
يتم حساب الاحتمالات كنسبة من احتمال وقوع الحدث مقسومًا على احتمال عدم وجود حدث ، على سبيل المثال 0,8 / (1-0,8) نتيجته 4. لذلك يمكننا بدلاً من ذلك كتابة:
ln (الاحتمالات) = b0 + b1 * X
نظرًا لأن الاحتمالات يتم تحويلها إلى سجل ، فإننا نسمي هذا الاحتمالات أو الاحتمالات على الجانب الأيسر.
يمكننا إعادة الأس إلى اليمين وكتابته على النحو التالي:
الاحتمال = e ^ (b0 + b1 * X)
كل هذا يساعدنا على فهم أن النموذج لا يزال في الواقع مزيجًا خطيًا من المدخلات ، لكن هذه المجموعة الخطية تشير إلى احتمالات السجل للفئة السابقةdefiنيتا.
يتم تقدير المعاملات (قيم بيتا أو ب) لخوارزمية الانحدار اللوجستي في مرحلة التعلم. للقيام بذلك ، نستخدم أقصى تقدير للاحتمالية.
تقدير الاحتمالية القصوى هو خوارزمية تعليمية تستخدمها العديد من خوارزميات التعلم الآلي. تتنبأ المعاملات الناتجة عن النموذج بقيمة قريبة جدًا من 1 (على سبيل المثال ذكر) للفصل الدراسي السابقdefinite وقيمة قريبة جدًا من 0 (على سبيل المثال أنثى) للفئة الأخرى. أقصى احتمال للانحدار اللوجستي هو إجراء لإيجاد قيم للمعاملات (قيم بيتا أو قيم ob) التي تقلل الخطأ في الاحتمالات التي تنبأ بها النموذج بالنسبة لتلك الموجودة في البيانات (على سبيل المثال ، الاحتمال 1 إذا كانت البيانات هي الفئة الأساسية) .
سنستخدم خوارزمية تصغير لتحسين أفضل قيم المعامل لبيانات التدريب. غالبًا ما يتم تنفيذ ذلك في الممارسة العملية باستخدام خوارزمية تحسين رقمية فعالة.
أعلنت صحيفة فاينانشيال تايمز يوم الاثنين الماضي عن صفقة مع OpenAI. "فاينانشيال تايمز" ترخص صحافتها ذات المستوى العالمي...
يدفع الملايين من الأشخاص مقابل خدمات البث، ويدفعون رسوم الاشتراك الشهرية. من الشائع أنك…
سوف تستمر شركة Coveware by Veeam في تقديم خدمات الاستجابة لحوادث الابتزاز السيبراني. ستوفر Coveware إمكانات الطب الشرعي والمعالجة...
تُحدث الصيانة التنبؤية ثورة في قطاع النفط والغاز، من خلال اتباع نهج مبتكر واستباقي لإدارة المحطات.