أساسيات Vision Prompting
الفصل 6.2: تحليل الصور
أحمد: "كيف أطلب من AI تحليل صورة بشكل صحيح؟" سارة: "المفتاح هو توجيه 'نظر' النموذج - أخبره أين ينظر وماذا يبحث عنه!" أحمد: "مثل توجيه كاميرا نحو هدف محدد؟" سارة: "بالضبط! البرومبت العام يعطي نتيجة عامة. البرومبت الموجه يعطي نتيجة دقيقة. تذكر إطار GOLDS من الوحدة 3 - نفس المبادئ تنطبق هنا!"
👁️ صيغة Vision Prompting
**الصيغة الأساسية:** ``` انظر إلى [المنطقة/العنصر] وحلل [الجانب المحدد] من حيث [المعايير] ``` **مثال:** ``` انظر إلى الجدول في الصورة واستخرج جميع الأرقام بتنسيق JSON مع أسماء الأعمدة ```
📊 3 مستويات من التفصيل
**المستوى 1: عام** ``` ما في هذه الصورة؟ ``` → وصف سطحي **المستوى 2: موجه** ``` صف العناصر في الزاوية العلوية اليمنى ``` → تركيز على منطقة محددة **المستوى 3: تحليلي** ``` حلل التكوين البصري: الألوان، التوازن، نقطة التركيز، والرسالة المقصودة ``` → تحليل عميق ومنظم
⚙️ إعداد detail في API
**OpenAI تقدم 3 مستويات:** • `detail: low` = 85 token فقط - سريع ورخيص - للأسئلة البسيطة • `detail: high` = حتى 1536 token - دقة عالية - للتفاصيل الدقيقة • `detail: auto` = النموذج يقرر - الخيار الافتراضي 💡 **نصيحة:** استخدم `low` للأسئلة البسيطة لتوفير التكلفة
🔬 تمرين 4: 3 طرق للسؤال
**المهمة:** خذ صورة واحدة (لقطة شاشة لتطبيق) واكتب 3 برومبتات بمستويات مختلفة: **1. عام:** ``` ماذا ترى في هذه الصورة؟ ``` **2. موجه:** ``` صف قائمة التنقل الرئيسية وعناصرها ``` **3. تحليلي:** ``` حلل تجربة المستخدم: التخطيط، الألوان، سهولة الاستخدام، ونقاط التحسين المقترحة ``` **قارن النتائج!** ⏱️ الوقت: 15 دقيقة
