هاشتاغ
بحث

معايير FACTS تضع الذكاء الاصطناعي تحت المجهر.. دقة محدودة ومخاطر متزايدة

14/12/2025

معايير-FACTS-تضع-الذكاء-الاصطناعي-تحت-المجهر

شارك المقال

A
A


كشفت شركة "غوغل ديب مايند"، التابعة لشركة "غوغل"، مؤخراً عن مجموعة معايير جديدة تحمل اسم "FACTS Benchmark Suite"، تهدف إلى قياس مدى موثوقية نماذج الذكاء الاصطناعي في تقديم إجابات دقيقة ومتوافقة مع الحقائق، في خطوة تسلط الضوء على أحد أكثر التحديات إلحاحاً في سباق تطوير هذه التقنيات.


وبحسب تقرير نشره موقع "بيزنس إنسايدر"، تختبر هذه المعايير أداء نماذج الذكاء الاصطناعي بأربعة محاور رئيسية، تشمل:


الإجابة عن الأسئلة المعلوماتية اعتماداً على المعرفة الداخلية للنموذج.


استخدام البحث في الإنترنت بفعالية ودقة.


دعم الإجابات بوثائق طويلة ومعقدة لإثبات صحتها.


تفسير الصور وربطها بالسياق الصحيح.

نتائج أقل من التوقعات


أظهرت نتائج الاختبارات أن أفضل النماذج أداءً كان "جيميني 3 برو" التابع لـ"غوغل"؛ إذ حقق نسبة دقة بلغت 69% فقط، في حين جاءت نتائج النماذج الرائدة الأخرى أقل من ذلك بكثير.


وتظهر هذه الأرقام فجوة واضحة بين الطلاقة اللغوية العالية التي تتمتع بها نماذج الذكاء الاصطناعي، وبين قدرتها الفعلية على تقديم معلومات موثوقة خالية من الأخطاء.

مخاطر تتجاوز الأخطاء البسيطة


يحذر التقرير من أن انخفاض مستوى الدقة لا يُعد مشكلة تقنية فحسب؛ بل قد تكون له تداعيات خطرة في قطاعات حساسة مثل المالية والرعاية الصحية والقانون؛ إذ يمكن لخطأ صغير في معلومة أو مرجع أن يؤدي إلى قرارات خاطئة ذات كلفة بشرية أو قانونية أو مالية مرتفعة.


وفي مثال لافت على ذلك، أشار التقرير إلى واقعة فصلت فيها إحدى الشركات موظفاً بعد تقديمه مستنداً قانونياً احتوى على قضايا وأحكام وهمية، تبيّن لاحقاً أنها من اختلاق تطبيق "شات جي بي تي"، بعد ما استعان به محامٍ في إعداد الملف من دون التحقق من صحة المعلومات.

تحذير وخارطة طريق


تُعد معايير "FACTS" بمنزلة جرس إنذار بقدر ما هي أداة تقييم؛ إذ تسعى "غوغل ديب مايند" بها إلى تحديد نقاط الضعف في نماذج الذكاء الاصطناعي، وفهم كيفية نشوء الأخطاء، تمهيداً لمعالجتها وتسريع وتيرة التحسين في المستقبل.


وعلى الرغم من التقدم المتواصل في قدرات الذكاء الاصطناعي، يخلص التقرير إلى حقيقة واضحة، الذكاء الاصطناعي يتحسن بسرعة، لكنه ما زال يخطئ في نحو ثلث الحالات، وهذا يجعل الاعتماد الكامل عليه من دون رقابة بشرية أمراً محفوفاً بالمخاطر في الوقت الراهن.

موثوقية تحت المجهر


مع تزايد اعتماد الأفراد والشركات على تطبيقات الذكاء الاصطناعي في حياتهم اليومية وقراراتهم المصيرية، تزداد أهمية مثل هذه المعايير التي لا تختبر سرعة الإجابة أو بلاغتها فقط؛ بل تضع الحقيقة والدقة في صميم التقييم، بوصفهما حجر الأساس لبناء ثقة مستدامة بين الإنسان والتكنولوجيا.

التعليقات

منشور حديثاً

الأكثر قراءة

تابعنا

مقالات ذات صلة

يستخدم موقع هاشتاغ والمنصات التابعة له ملفات تعريف الارتباط لتحسين تجربتك على الموقع، وتقديم محتوى مخصص، وتحليل استخدام الموقع. هل توافق على استخدامنا للملفات لهذه الأغراض؟ يمكنك رفض ذلك، وسنستخدم فقط الملفات الضرورية لتشغيل الموقع.

هاشتاغ بيحكي عنك

مؤسسة إعلامية مستقلة تعنى في مناصرة المواطنين في المنطقة العربية وتمكينهم والدفاع عنهم ونقل أخبارهم وفق المواثيق الأممية والقواعد المهنية

أسّسها محمد محمود هرشو

محمد محمود هرشو

جميع الحقوق محفوظة - Hashtag هاشتاغ © 2015 - 2026