تدريب الذكاء الاصطناعي على بيانات من انتاجه رهان محفوف بالمخاطر

اخبار اليوم الصحيفة, تدريب الذكاء الاصطناعي اخبار اليوم الصحيفة, تدريب الذكاء الاصطناعي

اذا اُخضعت نماذج الذكاء الاصطناعي لتدريب متكرر باستخدام بيانات مُنتَجة اصلاً بهذه التقنية، فستبدا بعرض محتويات متضاربة بصورة متزايدة، وهي مشكلة يتناولها عدد كبير من الدراسات العلمية.
النماذج القائمة على ادوات الذكاء الاصطناعي التوليدي مثل برنامج “تشات جي بي تي” والتي تتيح انتاج مختلف انواع المحتوى بناءً على طلب بسيط بلغة يومية، تحتاج الى التدريب من خلال كميات هائلة من البيانات.
وغالباً ما يتم الحصول على هذه البيانات من شبكة الانترنت التي تنتشر فيها كميات متزايدة من الصور والنصوص المُنَتَجة بواسطة الذكاء الاصطناعي.
ويؤدي هذا الوضع الذي يوصف بعبارة “الالتهام الذاتي” اذ يتغذى الذكاء الاصطناعي على نفسه، الى انهيار النماذج فتصبح الادوات مُنتجة لمعلومات غير منطقية حتى تصل الى نتائج لا معنى لها، على ما توصّلت اليه مقالة نُشرت في مجلة “نيتشر” العلمية في نهاية تموز/يوليو.
ومع استخدام هذا النوع من البيانات الذي يُطلق عليه تسمية “بيانات اصطناعية” لانّه مُنتَج بواسطة الات، يقل غنى العيّنة التي تستمد منها نماذج الذكاء الاصطناعي معطياتها لتوفير اجاباتها.
فالوضع مشابه لانشاء نسخة من صورة بتقنية المسح الضوئي ثم طباعتها. ومع تكرار النسخ والطباعة، ستفقد النتيجة جودتها حتى تصبح في النهاية غير مقروءة.
“وباء جنون البقر”
توصّل باحثون من جامعتي “رايس” و”ستانفورد” الامريكيتين الى النتيجة نفسها بعد دراسة نماذج الذكاء الاصطناعي التي تولّد الصور، مثل “ميدجورني” و”دال-اي” و”ستيبل ديفيوجن”.
واظهر الباحثون انّ الصور المُنتَجة اصبحت مليئة بعناصر غير متطابقة كلّما اضافوا بيانات “مُنتَجة بواسطة الذكاء الاصطناعي” الى النموذج، وشبّهوا هذه الظاهرة بمرض “جنون البقر”.
فهذا الوباء الذي ظهر في المملكة المتحدة، يعود مصدره الى استخدام العلف الحيواني الذي يتم الحصول عليه من اجزاء غير ماكولة من جيف ابقار وحيوانات تحمل الفيروس، لتغذية المواشي.
وتستخدم شركات الذكاء الاصطناعي في مرات كثيرة “بيانات اصطناعية” لتدريب برامجها، بسبب سهولة الحصول عليها ووفرتها وتكلفتها المنخفضة مقارنة ببيانات ابتكرها البشر.
وفي حديث الى وكالة فرانس برس، يقول الباحث المتخصص في التقنيات الجديدة لدى جامعة موناش في استراليا جاثان سادوفسكي، انّ “مصادر البيانات البشرية غير المستغلة وعالية الجودة والقابلة للقراءة الياً تصير اكثر ندرة”.
ويقول ريتشارد بارانيوك، احد معدّي المقالة المنشورة في “نيتشر”، في بيان “في حال لم تتم مراقبة الوضع على مرّ اجيال عدة، فسنكون امام نتيجة كارثية تتمثل في متلازمة انهيار نماذج ستؤثر سلباً على جودة البيانات في الانترنت وتنوّعها”.
وكما انّ ازمة جنون البقر اثرت بشكل كبير على مجال انتاج اللحوم في تسعينات القرن العشرين، قد تهدد شبكة الانترنت المليئة بمحتوى مُنتَج بواسطة الذكاء الاصطناعي ونماذج تحوّلت الى “مجنونة”، مستقبل مجال الذكاء الاصطناعي الذي يشهد ازدهاراً كبيراً وتبلغ قيمته مليارات الدولارات، بحسب هؤلاء العلماء.
ويقول جاثان سادوفسكي انّ “التساؤل الفعلي بالنسبة الى الباحثين والشركات الذين يعملون على بناء انظمة ذكاء اصطناعي هو في اي مرحلة يتجاوز استخدام البيانات الاصطناعية الحد اللازم؟”.
سيناريو غير واقعي كثيراً
يرى بعض المتخصصين الاخرين انّ المشكلة مبالغ فيها وليست حتمية قط.
وفي حديث الى وكالة “فرانس برس”، تؤكد شركتا “انثروبك” و”هاغينغ فايس” المتخصصتان في مجال الذكاء الاصطناعي، انهما تستخدمان بيانات مُنتَجَة بواسطة الذكاء الاصطناعي.
ويقول انتون لوزكوف، وهو مهندس متخصص في التعلّم الالي لدى شركة “هاغينغ فايس” ان المقالة المنشورة في مجلة “نيتشر” توفر رؤية نظرية مثيرة للاهتمام لكن غير واقعية الى حد كبير.
ويؤكد ان “تدريب النماذج على مجموعات عدة من البيانات الاصطناعية لا يتم في الواقع”.
ويقرّ لوزكوف بانّ الخبراء في الذكاء الاصطناعي يشعرون بالاحباط من واقع الانترنت، على غرار ما ينتاب الجميع.
ويضيف “انّ جزءاً من الانترنت هو مجرد قمامة”، مشيراً الى انّ شركته بدات تبذل جهوداً كبيرة لتنظيف البيانات التي تم جمعها، وحذفت احياناً ما يصل الى 90% منها.تدريب الذكاء الاصطناعي على بيانات من انتاجه رهان محفوف بالمخاطر

صحيفة الجامعة

أحدث المقالات

تدريب الذكاء الاصطناعي على بيانات من انتاجه رهان محفوف بالمخاطر

مقارنة إجابات نماذج الذكاء الاصطناعي في حل لغز “خالد والساعة الأثرية” – تحليل شامل وتقييم مفصل

انخفاض عدد سكان الصين للعام الثالث على التوالي

ترامب يدرس خيارات للحفاظ على “تيك توك” في اميركا

ريال مدريد يقلب الطاولة على سيلتا فيجو بخماسية ويعبر لربع نهائي كاس الملك