نموذج جديد للذكاء الاصطناعي يُتقن التفكير العميق

كشف فريق بحثي مشترك من جامعات إلينوي أوربانا-شامبين، فرجينيا، ستانفورد، وهارفارد، إلى جانب باحثين من "أمازون GenAI"، عن تطوير نموذج ذكاء اصطناعي جديد يُدعى "المحوّل القائم على الطاقة" (Energy-Based Transformer - EBT)، يهدف إلى تحسين قدرة الأنظمة على التفكير التحليلي التدريجي، مما يعزز الكفاءة والتعميم في مواجهة مهام معقدة وغير مألوفة.

محاكاة التفكير البشري

يستلهم النموذج ما يُعرف في علم النفس بنظامي التفكير البشري: النظام 1 (سريع وبديهي)، والنظام 2 (تحليلي وبطيء).

وبينما تتفوق النماذج الحالية في مهام النظام 1 مثل التعرف على الأنماط، يقدم "EBT" مقاربة جديدة لمعالجة التحديات التي تتطلب استدلالاً معقداً، مثل المنطق المتقدم أو الرياضيات.

ووفقاً لتفاصيل الدراسة المنشورة على منصة الأبحاث العلمية "arXiv"، فالنموذج لا يولد الإجابات مباشرة، بل يستخدم مفهوم "دالة الطاقة" لتقييم توافق الحلول مع السياق، ثم يحسّن التوقعات تدريجياً عبر خفض قيمة الطاقة باستخدام التحسين التدريجي للوصول إلى الحل الأمثل.

تجاوز حدود التقنيات التقليدية

الطرق الحالية مثل التعلم المعزز (Reinforcement Learning - RL)، التي تكافئ النموذج على إنتاج تسلسلات استدلالية، أو طريقة "best-of-N" التي تختار أفضل إجابة من بين عدة محاولات، أثبتت فعاليتها في مهام محدودة مثل الرياضيات والبرمجة، لكنها تفتقر إلى القدرة على التعميم في المهام الإبداعية أو غير المألوفة.

ويتفوق نموذج EBT عبر دمج آلية التوليد والتحقق في نموذج واحد، مما يمنحه مرونة أكبر في تخصيص الموارد الحسابية.

نتائج واعدة

في مقارنات مع نماذج متقدمة مثل Transformer++ وDiffusion Transformers (DiTs)، أظهر النموذج الجديد كفاءة تدريب أعلى بنسبة 35% من حيث البيانات والموارد الحسابية.

كما حسّن دقة الاستدلال بنسبة تصل إلى 29% بفضل القدرة على التفكير المطول، التي تتيح تحسين الأداء عبر تخصيص موارد حسابية إضافية أثناء التشغيل، خاصة في المهام التي تختلف عن بيانات التدريب.

وفي اختبارات معالجة الصور، تفوق EBT على نماذج DiTs مع تقليل عمليات التمرير بنسبة 99%.

كما أظهرت التجارب أن تمثيلات الصور التي تعلمها النموذج حققت دقة تصنيف أعلى بعشر مرات تقريباً على قاعدة بيانات (ImageNet-1k)، مما يشير إلى فهم أعمق للمحتوى.

واللافت أن الباحثين طوروا نسختين من النموذج: إحداهما مستوحاة من معمارية GPT (أحادية الاتجاه)، والأخرى شبيهة بـ BERT (ثنائية الاتجاه)، مما يمنح مرونة إضافية للتكيف مع مهام متنوعة.

تحديات قائمة

رغم هذه النجاحات، يتطلب تدريب EBT قوة حوسبية أعلى بمقدار 3.3 إلى 6.6 أضعاف مقارنة بالمحولات التقليدية، مما قد يحد من تطبيقه في بعض السيناريوهات.

كما أن التجارب أجريت على نماذج صغيرة نسبياً، ولا يزال من غير المؤكد ما إذا كانت المزايا ستبقى عند التوسع إلى نماذج أكبر.

جاهزية للتطبيقات المستقبلية

رغم اختلاف آلية عمله، يتوافق EBT مع البنى التحتية الحديثة مثل وحدات GPU وTPU، ما يجعله قابلاً للتكامل مع الأنظمة الحالية. وكفاءته العالية في استخدام البيانات تجعله مناسباً للبيئات التي تعاني من محدودية موارد التدريب.

ويتوقع الباحثون أن يساهم هذا الابتكار في تطوير جيل جديد من تطبيقات الذكاء الاصطناعي القادرة على التعامل مع تحديات معقدة بدقة وأمان أكبر.

يقرأون الآن