الفصل 06

دخول عالم الصوت بالذكاء الاصطناعي

الفصل 6.4: Text-to-Speech, Speech-to-Text

2 دقيقة قراءة

أحمد: "سارة، تعلمت النصوص والصور. ماذا عن الصوت؟" سارة: "عالم مثير! يمكنك الآن تحويل النص لصوت بشري طبيعي، أو العكس - تحويل الكلام لنص. حتى استنساخ الأصوات!" أحمد: "استنساخ الأصوات؟ يبدو كخيال علمي!" سارة: "ElevenLabs يحتاج فقط 30 ثانية من صوتك لإنشاء نسخة مقنعة جداً. و Whisper من OpenAI يفهم 99 لغة!" أحمد: "لكن كيف أكتب برومبت للصوت؟" سارة: "مختلف عن النص والصور. هنا تتحكم في النبرة، السرعة، والعاطفة."

✦

🎙️ Text-to-Speech (TTS)

**أشهر أدوات تحويل النص للصوت:** 🔹 **ElevenLabs** - الأكثر واقعية • استنساخ الصوت • تحكم عاطفي متقدم 🔹 **OpenAI TTS** - سهل ومتكامل • 6 أصوات مختلفة • سريع ورخيص 🔹 **Google Cloud TTS** • دعم ممتاز للعربية • WaveNet عالي الجودة 🔹 **Azure Neural TTS** • أصوات مخصصة • دعم عربي متميز

✦

🎤 Speech-to-Text (STT)

**تحويل الصوت لنص:** 🔹 **Whisper (OpenAI)** • مجاني ومفتوح المصدر • 99 لغة (بما فيها العربية) • دقة تصل 95%+ 🔹 **AssemblyAI** • تحليل المشاعر • تحديد المتحدثين **عناصر برومبت الصوت:** 1. النص الأساسي 2. الصوت/المتحدث 3. العاطفة/النبرة 4. السرعة (0.75x → 1.5x) 5. الاستقرار والتنوع

✦

🎮 تمرين: إنشاء ملف صوتي

**السيناريو:** مقدمة بودكاست تعليمي 1️⃣ **اكتب النص (30-50 كلمة):** _________________________________ 2️⃣ **حدد خصائص الصوت:** الصوت: ___ النبرة: ___ السرعة: ___ العاطفة: ___ 3️⃣ **اختر الأداة:** [ ] ElevenLabs [ ] OpenAI TTS 4️⃣ **قيّم النتيجة:** وضوح: __/10 طبيعية: __/10 ⏱️ الوقت: 15 دقيقة

🏆

🏆 مكافأة

أتقنت تحويل النص لصوت احترافي؟

⭐+10 نقطة XP

🏅شارة: مهندس الصوت 🎙️

العودة إلى الفهرس