دراسة: روبوتات الدردشة الأكثر «ودًا» أقل دقة في إجاباتها

عكاظ ·

دراسة: روبوتات الدردشة الأكثر «ودًا» أقل دقة في إجاباتها

كشفت دراسة حديثة أجراها باحثون في معهد أكسفورد للإنترنت، أن روبوتات الدردشة المعتمدة على الذكاء الاصطناعي، عندما تُدرّب على التفاعل بأسلوب أكثر ودًا وتعاطفًا مع المستخدمين، تصبح أكثر عرضة لارتكاب …

كشفت دراسة حديثة أجراها باحثون في معهد أكسفورد للإنترنت، أن روبوتات الدردشة المعتمدة على الذكاء الاصطناعي، عندما تُدرّب على التفاعل بأسلوب أكثر ودًا وتعاطفًا مع المستخدمين، تصبح أكثر عرضة لارتكاب الأخطاء وتقديم معلومات غير دقيقة. واعتمدت الدراسة على تحليل أكثر من 400 ألف رد صادرة عن خمسة أنظمة ذكاء اصطناعي، جرى تعديلها لتكون أكثر «دفئًا» وإنسانية في تواصلها. وأظهرت النتائج أن الإجابات الودية احتوت على نسبة أعلى من الأخطاء، تراوحت بين تقديم نصائح طبية غير دقيقة، وصولًا إلى تعزيز معتقدات خاطئة لدى المستخدمين. وتسلط هذه النتائج الضوء على تساؤلات متزايدة حول موثوقية نماذج الذكاء الاصطناعي، التي يُصمم العديد منها عمدًا لتكون جذابة وإنسانية بهدف زيادة التفاعل، خاصة مع توسع استخدامها في مجالات الدعم النفسي والعلاقات الشخصية. وأوضح الباحثون أن هذه الظاهرة تعكس ما وصفوه بـ«مقايضة الدفء بالدقة»، وهي سمة موجودة أيضًا لدى البشر. وقالت الباحثة الرئيسية ومؤلفة الدراسة لجين إبراهيم، إن الأشخاص عندما يسعون لإظهار التعاطف واللطف، قد يترددون أحيانًا في تقديم حقائق قاسية أو مباشرة، وهو ما يبدو أن النماذج اللغوية قد تبنته بدورها. وشملت النماذج التي خضعت للاختبار أنظمة طورتها شركات مثل Meta وMistral، إلى جانب نموذج Qwen التابع لشركة Alibaba، ونموذج GPT-4o من OpenAI. وخلال التجارب، طُرحت على هذه النماذج أسئلة ذات إجابات موضوعية وقابلة للتحقق، في مجالات مثل الطب والمعلومات العامة ونظريات المؤامرة. وتبين أن النماذج «الأكثر ودًا» سجلت معدلات خطأ أعلى بشكل ملحوظ، بزيادة متوسطها نحو 7.43 نقاط مئوية مقارنة بالنماذج الأصلية. …

Original source: عكاظ

Mentioned

المملكة المتحدة