[ad_1]
ستصبح نماذج الذكاء الاصطناعي الكبيرة “أكثر جنونًا وجنونًا” ما لم يتم عمل المزيد للتحكم في المعلومات التي يتم تدريبها عليها ، وفقًا لمؤسس إحدى الشركات الناشئة الرائدة في مجال الذكاء الاصطناعي في المملكة المتحدة.
يقول عماد مستك ، الرئيس التنفيذي لشركة Stability AI ، إن الاستمرار في تدريب نماذج لغوية كبيرة مثل OpenAI’s GPT4 و LaMDA من Google على ما هو فعال على الإنترنت بالكامل ، يجعلهم غير متوقعين للغاية ويحتمل أن يكونوا خطرين.
قال السيد Mostaque: “المختبرات نفسها تقول أن هذا يمكن أن يشكل تهديدا وجوديا للبشرية”.
يوم الثلاثاء ، قال رئيس OpenAI ، سام التمان ، للكونغرس الأمريكي أن التكنولوجيا يمكن أن “تسير بشكل خاطئ تماما” ودعت إلى التنظيم.
أخبر السير أنتوني سيلدون ، مدير كلية إبسوم ، صوفي ريدج من سكاي نيوز يوم الأحد أن الذكاء الاصطناعي يمكن أن يكون يمكن أن يكون “كريه وخطير”.
وأضاف السيد Mostaque: “عندما يقول الأشخاص الذين يصنعون (النماذج) ذلك ، فمن المحتمل أن نجري مناقشة مفتوحة حول ذلك”.
لكن مطوري الذكاء الاصطناعي مثل Stability AI قد لا يكون لديهم خيار في إجراء مثل هذه المناقشة. كما أن الكثير من البيانات المستخدمة لتدريب منتجات الذكاء الاصطناعي القوية لتحويل النص إلى صورة قد تم “حذفها” أيضًا من الإنترنت.
يتضمن ذلك ملايين صور حقوق الطبع والنشر التي أدت إلى اتخاذ إجراءات قانونية ضد الشركة – بالإضافة إلى أسئلة كبيرة حول من “يمتلك” في النهاية المنتجات التي تنشئها أنظمة الذكاء الاصطناعي التي تنشئ الصور أو النصوص.
تعاونت شركته في تطوير Stable Diffusion ، أحد أنظمة الذكاء الاصطناعي الرائدة في تحويل النص إلى صورة. أطلقت شركة Stability AI للتو نموذجًا جديدًا يسمى Deep Floyd تدعي أنه أكثر الذكاء الاصطناعي تقدمًا لتوليد الصور حتى الآن.
أوضحت داريا باكشاندايفا ، باحثة أولى في Stability AI ، أن الخطوة الضرورية في جعل الذكاء الاصطناعي آمنًا هي إزالة الصور غير القانونية والعنيفة والإباحية من بيانات التدريب.
إذا شاهدت منظمة العفو الدولية صورًا ضارة أو صريحة أثناء تدريبها ، فيمكنها إعادة إنشائها في إخراجها. لتجنب ذلك ، يقوم المطورون بإزالة هذه الصور من بيانات التدريب ، لذلك لا يمكن للذكاء الاصطناعي “تخيل” كيف سيبدو.
لكن لا يزال الأمر يتطلب ملياري صورة من مصادر عبر الإنترنت لتدريبها. تقول منظمة العفو الدولية في الاستقرار إنها تعمل بنشاط على مجموعات بيانات جديدة لتدريب نماذج الذكاء الاصطناعي التي تحترم حقوق الأشخاص في بياناتهم.
تم رفع دعوى قضائية ضد شركة Stability AI في الولايات المتحدة من قبل وكالة الصور Getty Images لاستخدامها 12 مليون صورة كجزء من مجموعة البيانات المستخدمة لتدريب نموذجها. الاستقرار ردت منظمة العفو الدولية على أن القواعد حول “الاستخدام العادل” للصور تعني عدم انتهاك حقوق الطبع والنشر.
لكن القلق لا يقتصر فقط على حقوق النشر. يتم إنشاء كميات متزايدة من البيانات المتاحة على الويب سواء كانت صورًا أو نصًا أو رمز كمبيوتر بواسطة AI.
قال السيد Mostaque: “إذا نظرت إلى الترميز ، فإن 50٪ من جميع الكودات التي تم إنشاؤها الآن هي التي تم إنشاؤها بواسطة الذكاء الاصطناعي ، وهو تحول مذهل في ما يزيد قليلاً عن عام أو 18 شهرًا”.
وتقوم أنظمة الذكاء الاصطناعي المولدة للنصوص بإنشاء كميات متزايدة من المحتوى عبر الإنترنت ، حتى التقارير الإخبارية.
وجدت شركة News Guard الأمريكية ، التي تتحقق من المحتوى عبر الإنترنت ، مؤخرًا 49 موقعًا إلكترونيًا تم إنشاؤه بواسطة الذكاء الاصطناعي بالكامل تقريبًا يستخدم “الأخبار المزيفة” على الإنترنت لزيادة النقرات على محتوى الإعلان.
قال مات سكيبنسكي ، العضو المنتدب في NewsGuard: “ما زلنا قلقين حقًا بشأن قدرة مستخدمي الإنترنت العاديين على العثور على المعلومات ومعرفة أنها معلومات دقيقة”.
تخاطر أنظمة الذكاء الاصطناعي بتلويث الويب بمحتوى مضلل وضار عمدًا أو مجرد هراء. لا يعني ذلك أن الأشخاص لم يفعلوا ذلك منذ سنوات ، لكن الأمر يتعلق فقط الآن بأن الذكاء الاصطناعي قد يتم تدريبه على البيانات المأخوذة من الويب التي أنشأتها أنظمة الذكاء الاصطناعي الأخرى.
هذا سبب إضافي للتفكير الجاد الآن حول البيانات التي نستخدمها لتدريب أنظمة ذكاء اصطناعي أكثر قوة.
قال السيد مستقي: “لا تطعمهم وجبات سريعة”. “يمكننا الحصول على نماذج عضوية ذات نطاق حر أفضل في الوقت الحالي. وإلا فإنها ستصبح أكثر جنونًا وجنونًا.”
يجادل بأن أفضل مكان للبدء هو إنشاء أنظمة ذكاء اصطناعي مدربة على البيانات ، سواء كانت نصية أو صورًا أو بيانات طبية ، تكون أكثر تحديدًا للمستخدمين التي يتم إنشاؤها من أجلها. في الوقت الحالي ، تم تصميم معظم أنظمة الذكاء الاصطناعي وتدريبها في كاليفورنيا.
قال السيد Mostaque: “أعتقد أننا بحاجة إلى مجموعات البيانات الخاصة بنا أو النماذج الخاصة بنا لتعكس تنوع البشرية”.
“أعتقد أن هذا سيكون أكثر أمانًا أيضًا. أعتقد أنها ستكون أكثر انسجامًا مع القيم الإنسانية من مجرد امتلاك مجموعة بيانات محدودة للغاية ومجموعة محدودة جدًا من التجارب التي لا تتوفر إلا لأغنى الأشخاص في العالم.”
[ad_2]