تمت مناقشة طالب الماجستير ( حيدر صلاح عبد الامير ) عن رسالته
‏(An Autonomous Vehicle With Deep Reinforcement Learning for Collision Avoidance) التي انتجت القيادة الذاتية للمركبة باستخدام خوارزمية التعليم المعزز العميق لتجنب التصادم، حيث توضح كيفية تدريب سياسة القيادة الحضرية الكاملة لمحاكاة القيادة CARLA من خلال الجمع بين التعلم المعزز العميق (على وجه الخصوص ، تحسين السياسة القريبة (PPO)) مع تعلم المناهج.
وخرج الباحث عبر هذه الأطروحة، بنتائج التجارب مع وكيل قائم على المناهج في مجموعة واسعة من المقاييس والمدن والطقس وحالات المرور.
وإلى جانب ذلك ، تسليط الضوء على سببين رئيسيين لعدم الاستقرار وهما:
تعلم وظيفة القيمة V (s) وتوحيد وظيفة الميزة المتوقعة A هما خطوتان أساسيتان في خوارزميات RL (s ، a).
حيث تقدم مناهج جديدة لمعالجة هذه المخاوف. يمكن تحسين أي خوارزمية RL قائمة على القيمة ، بما في ذلك خوارزميات الممثل والناقد .

ترأس لجنة المناقشة الأستاذ الدكتور عباس حنون الاسدي جامعة البصرة / كلية علوم الحاسوب وتكنولوجيا المعلومات ، وكان في عضويتها كل من

أ.م.د مصطفى جواد رديف من جامعة القادسية / كلية علوم الحاسوب وتكنولوجيا المعلومات
أ.م.د قصي عمران موسى من جامعة القادسية / كلية علوم الحاسوب وتكنولوجيا المعلومات.
والمشرف أ. د. علي عبيد شراد من جامعة القادسية / كلية علوم الحاسوب وتكنولوجيا المعلومات.

لقد قدم الباحث في هذه الدراسة تصميما لمركبة ذاتية القيادة دون تدخلات البشرية باستخدام خوارزمية التعليم المعزز العميق لسلامة الناس من الحوادث وتقليل الوفيات المرورية وتغيير الروتين اليومي .
ولقد قُبلت الرسالة بتقدير إمتياز.