مصدر المعلومات المرجعية
على الذكاء الاصطناعي

البحث في <span dir="ltr">intelligence artificielle</span>

إلغاء التعلّم الآلي: Google Research تُثبت اختبار تدقيق، لكن ليس بعد على نماذج اللغة الكبيرة

قدّمت Google Research في AISTATS 2026 اختبارًا إحصائيًا جديدًا لتدقيق machine unlearning يقلّص الكلفة التجريبية بشكل كبير، لكنه ما زال غير مُثبت على نماذج اللغة الكبيرة. وبينما يتيح RGPD والـAI Act حق المحو والشفافية، تبقى طريقة إثبات الإزالة الفعلية داخل النماذج مسألة تقنية غير محسومة.

STStephane Nachez · · ·4 min
إلغاء التعلّم الآلي: Google Research تُثبت اختبار تدقيق، لكن ليس بعد على نماذج اللغة الكبيرة
المحتويات

قدّمت Google Research في مؤتمر AISTATS 2026 اختبارًا إحصائيًا مخصصًا لتدقيق machine unlearning، أي الإزالة المستهدفة للبيانات من نموذج جرى تدريبه مسبقًا. ويَعِد إطار Regularized f-Divergence Kernel Tests، الذي وقّعه كلٌّ من Mónica Ribero وAntonin Schrab وArthur Gretton، بخفض كبير في الكلفة التجريبية لبعض عمليات التدقيق: ففي ما يخص آلية SVT3 الخاصة بالخصوصية التفاضلية، يكتشف انتهاكات باستخدام بضعة آلاف من العينات، في حين كان DP-Auditorium قد يتطلب ملايين العينات. لكن نطاقه لا يزال محدودًا: فالتحققات المنشورة تقتصر على benchmarks اصطناعية ومجموعات بيانات من فيزياء الطاقة العالية، وليس على نماذج اللغة الكبيرة، رغم أن هذه الأخيرة هي التي تتركز حولها التوترات التنظيمية المتعلقة بالإزالة، وقابلية التتبع، وحوكمة البيانات.

ما الذي يصححه الاختبار وما الذي يتركه مفتوحًا

تستهدف الأداة خللًا معروفًا في اختبار العينتين القياسي (MMD). فالنموذجان اللذان يُعاد تدريبهما من الصفر على البيانات نفسها لكن بأحجام دفعات مختلفة ينتجان توزيعات متباينة، ما يطلق إنذارًا كاذبًا بفشل unlearning. ويتجاوز الاختبار الجديد هذا الفخ عبر اختبار نسبي لثلاث عينات، مع اختيار تلقائي لـ f-divergence — أي مقياس المسافة بين التوزيعات — الأنسب لكل نوع من الانحراف.

ويُعدّ فارق الكلفة التجريبية الحجة الرئيسية هنا. ففي آلية SVT3 (Sparse Vector Technique) ضمن الخصوصية التفاضلية، يكتشف الإطار الانتهاكات باستخدام بضعة آلاف من العينات، مقابل ملايين في DP-Auditorium — الأداة المرجعية التي نشرتها Google Research عام 2024 (arXiv:2307.05608) — مع معدل كشف مماثل. لكن التفاصيل مهمة: فهذه المكاسب موثقة على SVT3 فقط، وليس على جميع آليات الخصوصية التفاضلية، ويؤكد المؤلفون أنه لا توجد divergence واحدة تتفوق دائمًا على غيرها. كما اعتُبرت ثلاث طرق — Selective Synaptic Dampening (SSD) وpruning وfinetuning — عاجزة عن محو البيانات المستهدفة فعليًا ضمن الظروف التجريبية المبسطة في الورقة؛ ولم ينجح في الاختبار النسبي لثلاث عينات سوى أسلوب random label، وهي حدود يعترف بها المؤلفون.

أما الاتساع خارج مجال الرؤية، فلا يزال بحاجة إلى إثبات. وتُظهر أعمال arXiv:2506.00688 المنشورة في أكتوبر 2025 أن النموذج لا يمكنه أبدًا أن ينسى البيانات بشكل كامل عبر تعديل معلماته الحالية فقط: إذ تبقى بصمة متبقية للمعلومات المفترض حذفها — وهو عائق بنيوي يقيسه اختبار Ribero وآخرين لكنه لا يرفعه. كما أن Feng وآخرين (CMU، UK AI Security Institute، Oxford)، في preprint من مايو 2025، يرون أن التقييمات الحالية لـ unlearning على نماذج اللغة الكبيرة غير حاسمة، بينما نشر Chen وآخرون (LMU Munich، Oxford، Siemens) في الوقت نفسه إطار تدقيق مخصصًا لنماذج اللغة الكبيرة — وهو إطار لم تتم مقارنته في ورقة AISTATS 2026.

التزام بالنتيجة من دون طريقة قابلة للاحتجاج

يفتح RGPD، عبر مادته 17 المتعلقة بالحق في المحو، المجال أمام الشخص لطلب حذف بياناته: وعند تطبيق ذلك على نموذج ذكاء اصطناعي، يصبح المطلوب إثبات أن البيانات المعنية لم تعد تؤثر في المخرجات. يفرض RGPD التزامًا بالمحو عندما تتحقق شروط المادة 17؛ لكن عند تطبيقه على نماذج الذكاء الاصطناعي، تصطدم هذه الالتزامات بمنطقة رمادية تقنية: كيف يمكن إثبات أن البيانات المعنية لم تعد تؤثر في سلوك النموذج؟

وعلى المستوى الأوروبي، لا يسدّ الإطار الأحدث هذه الفجوة. فـCode de bonnes pratiques GPAI، الذي نشرت المفوضية الأوروبية نسخته النهائية في يوليو 2025، هو أداة طوعية تغطي الشفافية وحقوق الطبع والنشر والأمن، وتساعد المزودين على إثبات امتثالهم للمادة 53 من لائحة AI Act، التي تفرض ملخصًا عامًا للمحتويات المستخدمة في التدريب (المادة 53(1)(d)، السارية منذ 2 أغسطس 2025). غير أن الوثيقة — في النسخة التي تمت مراجعتها — لا تنص على أي طريقة للتحقق من الحذف الفعلي لبيانات داخل نموذج تم نشره بالفعل.

إن الفجوة تضيق عبر الأدوات لا عبر النصوص. وهذا تحديدًا هو الفراغ الذي يسعى اختبار Ribero وSchrab وGretton إلى معالجته، عبر تقديم قياس إحصائي يمكن الدفاع عنه لنجاح الحذف. لكن الاختبار الحاسم لم يُنجز بعد: فما دام التحقق التجريبي لم يخرج من benchmarks الاصطناعية ونماذج الفيزياء ليلتحق بنماذج اللغة الكبيرة حيث تتركز طلبات الحذف، فإن سلسلة الإثبات التي ينتظرها مسؤول حماية البيانات ستظل غير مكتملة.

ST
Stephane Nachez
subscriber

هيئة تحرير ActuIA — أخبار وبيانات وتحليلات حول الذكاء الاصطناعي لصنّاع القرار.