بضائع

حلقة الخصوصية: الذكاء الاصطناعي في متاهة الخصوصية وحقوق النشر

هذه هي المقالة الأولى من مقالتين أتناول فيهما العلاقة الدقيقة بين الخصوصية وحقوق النشر من ناحية، والذكاء الاصطناعي من ناحية أخرى.

علاقة إشكالية حيث يثبت التطور التكنولوجي أنه سريع للغاية بحيث يجعل أي تعديل تنظيمي عفا عليه الزمن منذ تطبيقه الأول.

إن معالجة القضايا الشائكة المتعلقة بحقوق الناس وبياناتهم الشخصية تتطلب الاهتمام والكفاءة والنقاش الذي لا غنى عنه بين المثقفين والمتخصصين في عصرنا هذا. إننا نكتشف أننا لسنا بالسرعة الكافية في تكييف القواعد الاجتماعية مع التحديات التي تفرضها علينا الإبداعات التكنولوجية. تجد التكنولوجيات الناشئة نفسها على نحو متزايد تعمل في المجال المفتوح، في ظل غياب تام للقواعد التنظيمية التي تحد من تطبيقها، وهي حرة في إحداث الضرر، وبالتالي تفعل ذلك مع الإفلات التام من العقاب.

فهل يمكن تصور سيطرة تعود بسلسلة التطور التكنولوجي إلى البحث العلمي وأهدافه الإستراتيجية؟

هل من المعقول أن نحكم تطور جنسنا البشري مع الحفاظ على الاحترام الراسخ للحريات الفردية؟

خصوصية؟

"كلما حاولت الاختباء، كلما جذبت الانتباه أكثر. لماذا من المهم جدًا ألا يعرف أحد عنك؟ – من فيلم “حالاً” تأليف وإخراج أندرو نيكول – 2018

في الفيلم "حالافي عام 2018، أصبح مجتمع المستقبل مكانًا مظلمًا، تحت السيطرة المباشرة لنظام كمبيوتر عملاق يسمى الأثير، قادر على مراقبة كل ركن من أركان الأمة من خلال مراقبته من خلال عيون نفس الأشخاص الذين يسكنونها. كل إنسان هو رقيب عن الأثير ومسؤوليته الأولى بالطبع هي مراقبة نفسه وسلوكه.

الأثير هو أفضل حليف لقوات الشرطة: من خلال الأثير، يمكن للعملاء تتبع تجربة أي شخص من خلال استرجاعها بأعينهم وحل أي نوع من الجرائم.

يتساءل ضابط الشرطة سال لماذا يجب أن تقاتل من أجل حماية خصوصيتك: ما الفائدة عندما لا يكون لديك سبب للاختباء؟ ففي نهاية المطاف، في عصر تتطلب فيه التقنيات التي نبنيها لزيادة سلامة منازلنا وشوارعنا تسجيل مثل هذه المعلومات ومراقبتها والتحقق منها لصالح الأشخاص أنفسهم الذين يطلبون الحماية، كيف يمكننا أن نتوقع ضمان ذلك؟ خصوصيتهم؟

لإثبات مدى خطورة الوصول إلى حياة الآخرين، سيسيطر أحد المتسللين على إيثر وسينزل كابوس رهيب على حياة الملايين من الأشخاص: التهديد بالاضطرار إلى مشاهدة صور أكثر الناس كمتفرجين عاجزين. لحظات معذبة من حياتهم، تبث مباشرة في شبكية أعينهم.

حلقة

Le الشبكات العصبية الاصطناعية التي يقوم عليها عمل الذكاء الاصطناعي الحديث، تدور حول ثلاثة عناصر رئيسية: المعلومات الأساسية التي تسمى كذلك الإحضارل خوارزمية لاستيعاب المعلومات و ذاكرة لحفظهم.

لا تقتصر الخوارزمية على التحميل العادي للمعلومات في الذاكرة، بل تقوم بمسحها بحثًا عن العناصر التي تربطها ببعضها البعض. سيتم نقل مزيج من البيانات والعلاقات إلى الذاكرة والتي ستشكل ملفًا نموذج.

داخل النموذج، لا يمكن تمييز البيانات والعلاقات تمامًا، ولهذا السبب يكاد يكون من المستحيل إعادة بناء مجموعة معلومات التدريب الأصلية من شبكة عصبية مدربة.

هذا صحيح بشكل خاص عندما تحتوي النصوص على كميات كبيرة من البيانات. وهذا هو حال النظم اللغوية الكبيرة المعروفة ب Large Language Models (LLM للاختصار) بما في ذلك ChatGpt سيئ السمعة. تدين بفعاليتها إلى الكم الكبير من المعلومات المستخدمة في التدريب: يتطلب التدريب الجيد حاليًا بضعة تيرابايت على الأقل من البيانات ونظرًا لأن تيرابايت واحد يتوافق مع 90 مليار حرف، أي ما يقرب من 75 مليون صفحة من النص، فمن السهل أن نفهم أن هناك هناك الكثير من المعلومات اللازمة.

ولكن إذا لم يكن من الممكن إلغاء هندسة النماذج، فلماذا ينبغي لنا أن نسأل أنفسنا مشكلة انتهاكات الخصوصية؟

هيمنة البيانات

"من هو مجنون يمكنه أن يطلب إعفاءه من مهمات الطيران، لكن من يطلب إعفاءه من مهمات الطيران ليس مجنونا". – مستوحى من رواية “كاتش 22” للكاتب جوزيف هيلر.

النشرة الإخبارية
لا تفوّت أهم أخبار الابتكار. قم بالتسجيل لتلقيهم عن طريق البريد الإلكتروني.

إن جمع البيانات بهذا الحجم الذي يسمح بإنشاء مشاريع مثل ChatGpt أو غيرها من المشاريع المماثلة هو اليوم من اختصاص الشركات الكبيرة متعددة الجنسيات التي تمكنت، من خلال أنشطتها الرقمية، من وضع أيديها على أكبر مستودع للمعلومات في العالم: الويب.

إن شركتي جوجل ومايكروسوفت، اللتين أدارتا لسنوات محركات البحث التي تفحص الويب وتستنتج كميات هائلة من المعلومات، هما أول المرشحين لإنشاء ماجستير إدارة الأعمال، وهما نماذج الذكاء الاصطناعي الوحيدة القادرة على استيعاب كميات من المعلومات مثل تلك الموصوفة أعلاه.

من الصعب تصديق أن Google أو Microsoft ستكون قادرة على إخفاء المعلومات الشخصية في بياناتها قبل استخدامها كمجموعة في تدريب الشبكة العصبية. إن إخفاء هوية المعلومات في حالة الأنظمة اللغوية يُترجم إلى تحديد البيانات الشخصية داخل مجموعة البيانات واستبدالها ببيانات مزيفة. دعونا نتخيل مجموعة بحجم بضعة تيرابايت نريد تدريب نموذج بها، ودعنا نحاول تخيل مقدار العمل اللازم لإخفاء هوية البيانات التي تحتوي عليها يدويًا: سيكون ذلك مستحيلًا عمليًا. ولكن إذا أردنا الاعتماد على خوارزمية للقيام بذلك تلقائيًا، فإن النظام الوحيد القادر على القيام بهذه المهمة سيكون نموذجًا آخر كبير ومتطور بنفس القدر.

نحن أمام مشكلة Catch-22 الكلاسيكية: "لتدريب ماجستير في القانون باستخدام بيانات مجهولة المصدر، نحتاج إلى ماجستير قادر على إخفاء هوية البيانات، ولكن إذا كان لدينا ماجستير قادر على إخفاء هوية البيانات، فلن يتم تدريبه باستخدام بيانات مجهولة المصدر". ".

اللائحة العامة لحماية البيانات (GDPR) عفا عليها الزمن

اللائحة العامة لحماية البيانات (GDPR) التي تملي (تقريبًا) عالميًا قواعد احترام خصوصية الأشخاص، في ضوء هذه المواضيع هي بالفعل أخبار قديمة ولم يتم التفكير في حماية البيانات الشخصية المشاركة في مجموعة التدريب.

في اللائحة العامة لحماية البيانات، يتم تنظيم معالجة البيانات الشخصية بغرض تعلم الارتباطات والارتباطات العامة جزئيًا فقط بموجب المادة 22 التي تنص على ما يلي: "يحق لصاحب البيانات عدم التعرض لقرار يعتمد فقط على المعالجة الآلية، بما في ذلك التنميط، والذي يترتب عليه آثار قانونية أو تؤثر عليه تأثيراً مماثلاً وهاماً".

تقدم هذه المقالة الحظر المفروض على مراقبي البيانات لاستخدام البيانات الشخصية لموضوع ما كجزء من عملية اتخاذ قرار مؤتمتة بالكامل لها آثار قانونية مباشرة على هذا الموضوع. لكن الشبكات العصبية، التي يمكن استيعابها بسهولة في عمليات صنع القرار الآلية، بمجرد تدريبها تكتسب القدرة على اتخاذ قرارات تلقائية يمكن أن تؤثر على حياة الناس. لكن هذه القرارات ليست دائما "منطقية". في الواقع، أثناء التدريب، تتعلم كل شبكة عصبية ربط المعلومات مع بعضها البعض، وغالبًا ما تربطها ببعضها البعض بطريقة غير خطية على الإطلاق. وغياب «المنطق» لا يسهل المهمة على المشرع الذي يريد أن يرفع درعاً دفاعاً عن خصوصية الناس.

إذا اختار المرء أيضًا تطبيق سياسة تقييدية للغاية، على سبيل المثال حظر استخدام أي بيانات حساسة ما لم يتم التصريح بذلك صراحةً من قبل المالك، فإن الاستخدام القانوني للشبكات العصبية سيكون غير عملي. والتخلي عن تقنيات الشبكات العصبية سيكون خسارة كبيرة، فكر فقط في نماذج التحليل المدربة على البيانات السريرية لأفراد مجموعة سكانية تأثرت جزئيًا بمرض معين. تساعد هذه النماذج على تحسين سياسات الوقاية من خلال تحديد الارتباطات بين العناصر الموجودة في البيانات والمرض نفسه، وهي ارتباطات غير متوقعة قد تبدو في نظر الأطباء غير منطقية تمامًا.

إدارة الاحتياجات

إن طرح مشكلة احترام خصوصية الأشخاص بعد التصريح بجمعها بشكل عشوائي لسنوات هو أمر نفاق على أقل تقدير. اللائحة العامة لحماية البيانات نفسها، بتعقيداتها، مسؤولة عن العديد من التلاعبات التي تسمح بالحصول على ترخيص لمعالجة البيانات الشخصية من خلال استغلال غموض البنود وصعوبة الفهم.

نحن بالتأكيد بحاجة إلى تبسيط القانون الذي يسمح بتطبيقه وتعليم حقيقي في الاستخدام الواعي للمعلومات الشخصية.

اقتراحي هو عدم السماح للشركات بمعرفة البيانات الشخصية للمستخدمين الذين يسجلون للحصول على خدماتها، حتى لو كانت خدمات مدفوعة الأجر. يجب أن يتم استخدام البيانات الشخصية المزيفة من قبل الأفراد تلقائيًا عند استخدامهم للأنظمة عبر الإنترنت. وينبغي أن يقتصر استخدام البيانات الحقيقية على عملية الشراء وحدها، مما يضمن أن تكون دائمًا منفصلة تمامًا عن قاعدة بيانات الخدمة.

إن معرفة أذواق وتفضيلات الموضوع دون السماح بربط اسم أو وجه بهذا الملف الشخصي ستكون بمثابة شكل من أشكال إخفاء الهوية يتم إجراؤه في المراحل الأولية والذي سيسمح تلقائيًا بجمع البيانات واستخدامها ضمن أنظمة التشغيل الآلي مثل الذكاء الاصطناعي.

أرتيكولو دي Gianfranco Fedele

النشرة الإخبارية
لا تفوّت أهم أخبار الابتكار. قم بالتسجيل لتلقيهم عن طريق البريد الإلكتروني.

المقالات الأخيرة

يوقع الناشرون وOpenAI اتفاقيات لتنظيم تدفق المعلومات التي تتم معالجتها بواسطة الذكاء الاصطناعي

أعلنت صحيفة فاينانشيال تايمز يوم الاثنين الماضي عن صفقة مع OpenAI. "فاينانشيال تايمز" ترخص صحافتها ذات المستوى العالمي...

أبريل 30 2024

المدفوعات عبر الإنترنت: إليك كيف تجعلك خدمات البث تدفع إلى الأبد

يدفع الملايين من الأشخاص مقابل خدمات البث، ويدفعون رسوم الاشتراك الشهرية. من الشائع أنك…

أبريل 29 2024

يتميز Veeam بالدعم الأكثر شمولاً لبرامج الفدية، بدءًا من الحماية وحتى الاستجابة والاسترداد

سوف تستمر شركة Coveware by Veeam في تقديم خدمات الاستجابة لحوادث الابتزاز السيبراني. ستوفر Coveware إمكانات الطب الشرعي والمعالجة...

أبريل 23 2024

الثورة الخضراء والرقمية: كيف تعمل الصيانة التنبؤية على تغيير صناعة النفط والغاز

تُحدث الصيانة التنبؤية ثورة في قطاع النفط والغاز، من خلال اتباع نهج مبتكر واستباقي لإدارة المحطات.

أبريل 22 2024

اقرأ الابتكار بلغتك

النشرة الإخبارية
لا تفوّت أهم أخبار الابتكار. قم بالتسجيل لتلقيهم عن طريق البريد الإلكتروني.

تابعنا