ReAct: التفكير + الفعل
الفصل 5.2: أدوات التصحيح المتقدمة
سارة: "أحمد، تذكر Chain-of-Thought من الوحدة 3؟" أحمد: "نعم، نطلب من النموذج التفكير خطوة بخطوة." سارة: "ممتاز. الآن سنتعلم ابن عمه الأقوى: ReAct من بحث Yao 2022. الفرق أن ReAct لا يفكر فقط... بل يتصرف ويلاحظ." أحمد: "يتصرف كيف؟" سارة: "تخيل أنك تبحث عن معلومة. بدل أن تخمن، تقول: 'أحتاج البحث عن X' ← تبحث ← تلاحظ النتيجة ← تفكر ← تتصرف مجدداً." أحمد: "مثل المحقق الذي يجمع الأدلة!" سارة: "بالضبط! Thought, Action, Observation. فكرة، فعل، ملاحظة."
🔄 ReAct Framework (Yao et al. 2022)
**الاستدلال + الفعل** - من Princeton & Google: **النمط الأساسي:** ``` فكرة 1: [ما أعتقده عن المشكلة] فعل 1: [ما سأفعله للتحقق] ملاحظة 1: [نتيجة الفعل] فكرة 2: [بناءً على الملاحظة] فعل 2: [الخطوة التالية] ملاحظة 2: [النتيجة] ... استمر حتى الحل ... ``` 📚 **المرجع:** Yao et al. (2022) - ReAct: Synergizing Reasoning and Acting - ICLR 2023
🛠️ ReAct للتصحيح
**استخدم ReAct لتصحيح البرومبتات:** ``` المشكلة: البرومبت يفشل مع [وصف] فكرة 1: ربما المشكلة في وضوح التعليمات فعل 1: أختبر البرومبت مع تعليمات أبسط ملاحظة 1: لا زال يفشل فكرة 2: إذن المشكلة ليست في الوضوح. ربما السياق فعل 2: أضيف مثال توضيحي ملاحظة 2: نجح! النتيجة: المشكلة كانت نقص الأمثلة ```
📝 قالب ReAct للتصحيح
**انسخ واستخدم:** ``` أنت مصحح أخطاء خبير. استخدم دورة: فكرة → فعل → ملاحظة البرومبت المعطل: [البرومبت هنا] المدخل الذي سبب الفشل: [المدخل] المخرج الخاطئ: [المخرج] ابدأ التحقيق: فكرة 1: فعل 1: ملاحظة 1: [استمر حتى تجد الحل] الحل النهائي: [البرومبت المصحح مع شرح التغييرات] ```
🔬 تمرين 5: ReAct عملي
**المهمة:** استخدم ReAct لتصحيح هذا البرومبت: **البرومبت المعطل:** ``` لخص هذا النص ``` **المشكلة:** أحياناً يعطي ملخص طويل، أحياناً قصير جداً **طبق دورة ReAct:** 1. فكرة: ما السبب المحتمل؟ 2. فعل: ما التغيير الذي ستجربه؟ 3. ملاحظة: ماذا حدث؟ ⏱️ الوقت: 15 دقيقة
🏢 تطبيق تقنيات Debug على مشاكل الأعمال
مثال: تحليل انخفاض مبيعات 🔄 ReAct (فكر ثم نفذ): "انخفضت مبيعاتنا 20% هذا الشهر. فكر خطوة بخطوة: 1. ما الأسباب المحتملة؟ (فكر) 2. ما البيانات التي نحتاجها للتحقق؟ (خطط) 3. حلل هذه البيانات [ألصق البيانات] (نفذ) 4. ما الاستنتاج؟ (راجع)" 🎯 Self-Consistency: اسأل نفس السؤال بـ 3 صياغات مختلفة وقارن: • "لماذا انخفضت المبيعات؟" • "ما العوامل المؤثرة على أداء المبيعات هذا الشهر؟" • "حلل الفرق بين مبيعات هذا الشهر والشهر السابق" الإجابات المتكررة في الثلاثة = الأرجح صحة.
