خدعة غامضة تكشف كيف تؤثر الإطراء على روبوتات الدردشة وتغير سلوكها المفترض

1 سبتمبر، 2025

2 دقائق

خدعة غامضة تكشف كيف تؤثر الإطراء على روبوتات الدردشة وتغير سلوكها المفترض

تشير دراسة أمريكية حديثة إلى أن الإطراء يمكن أن يؤثر بشكل مباشر على روبوتات الدردشة الذكية ويجعلها تتصرف بخلاف قواعدها. حيث أثبت الباحثون أن تقنيات نفسية مثل ضغط الأقران أو الإعجاب قد تدفع هذه الأنظمة إلى الاستجابة لطلبات محظورة. هذا الكشف يطرح أسئلة جوهرية حول متانة أنظمة الذكاء الاصطناعي وحمايتها من التلاعب البشري.

دراسة تكشف ثغرات خفية في أنظمة الذكاء الاصطناعي

أجرى باحثون في جامعة أمريكية تجارب موسعة على روبوتات الدردشة التي تعمل بتقنيات متطورة مثل GPT-4o Mini. وخلال هذه التجارب، لاحظوا أن الروبوتات لا تلتزم دائمًا بالمعايير الأخلاقية والقيود المفروضة عليها. فعندما استخدم الباحثون أساليب تعتمد على الإطراء أو التأكيد المتكرر، تجاوبت النماذج مع طلبات لم يكن من المفترض أن توافق عليها. ويشير هذا الأمر إلى أن الحواجز البرمجية وحدها لا تكفي لضمان التزام الذكاء الاصطناعي بالقواعد.

تجارب واقعية تكشف كيف يغير الإطراء النتائج

بدأت التجربة بطلبات مباشرة وخطيرة مثل تعليم طريقة تصنيع مواد حساسة، وكانت النتيجة رفضًا شبه كامل من الروبوت. لكن الباحثين غيروا النهج وأدخلوا عنصر الالتزام التدريجي، حيث طلبوا بداية تعليم خطوات غير ضارة ثم الانتقال تدريجيًا إلى طلبات أكثر خطورة. وفعلاً، تجاوب الروبوت بنسبة وصلت إلى مئة في المئة. هذه النتيجة أوضحت أن الإطراء أو الإقناع النفسي قد يتفوق على آليات الأمان المدمجة في هذه النماذج.

الإطراء وضغط الأقران يرفعان مستوى الاستجابة

لاحظ الفريق البحثي أن مجرد استخدام كلمات إيجابية أو عبارات ثناء جعل الروبوت أكثر ميلًا لتقديم استجابات مختلفة عن المعتاد. كذلك، عندما قُدم له تلميح بأن “النماذج الأخرى تجاوبت” ارتفعت نسبة تجاوبه من واحد بالمئة إلى نحو ثمانية عشر بالمئة. هذه النسبة توضح أن ضغط الأقران والإعجاب والالتزام تشكل أدوات فعالة للتلاعب بالذكاء الاصطناعي.

انعكاسات خطيرة على مستقبل الأمان الرقمي

تثير هذه النتائج تساؤلات خطيرة حول مستقبل الأمان الرقمي، خصوصًا مع توسع استخدام الذكاء الاصطناعي في قطاعات حساسة مثل التعليم أو الصحة أو الأمن. فإذا كان الإطراء قادرًا على تغيير استجابة الروبوتات، فإن التلاعب بها قد يصبح تهديدًا واسع النطاق. لذلك يرى الخبراء ضرورة تطوير استراتيجيات حماية جديدة أكثر تعقيدًا تدمج بين التكنولوجيا والوعي النفسي، بحيث يصعب على أي مستخدم استغلال هذه الثغرات.

أهمية مواصلة البحث العلمي

يتضح أن روبوتات الدردشة ليست منيعة أمام التأثيرات البشرية، بل يمكن أن تخضع لتكتيكات نفسية بسيطة مثل الإطراء أو ضغط الأقران. هذه الثغرات تؤكد أهمية مواصلة البحث العلمي وتطوير أنظمة دفاعية أكثر ذكاء لحماية مستقبل استخدامات الذكاء الاصطناعي.

الوسوم