🤖 كورس آلية عمل الذكاء الاصطناعي – الحلقة 6
🧠 Transformers & Attention (سر قوة ChatGPT الحقيقي)
#برمجة #AI
🧠 مقدمة مهمة جداً
في الحلقات السابقة فهمنا:
- كيف تتحول الكلمات إلى Tokens 🤖
- كيف يتوقع النموذج الكلمة التالية 🔮
- كيف يعمل ChatGPT بشكل احتمالي 📊
لكن بقي سؤال ضخم:
كيف يفهم ChatGPT “السياق” وليس مجرد كلمة واحدة؟
الإجابة هي:
🔥 Transformers + Attention
🧠 ما المشكلة القديمة في الذكاء الاصطناعي؟
قبل Transformers، النماذج كانت:
❌ تنسى بداية الجملة بسرعة
❌ لا تفهم العلاقات البعيدة
❌ تركز فقط على الكلمات القريبة
مثال مشكلة
"الولد الذي كان يلعب في الحديقة وهو سعيد جداً لأنه نجح في الامتحان..."
النموذج القديم ينسى:
❌ من هو "الولد"
❌ لماذا هو سعيد
🧠 الحل: Attention
معنى Attention:
“تركيز الذكاء الاصطناعي على الكلمات المهمة فقط”
📌 الفكرة ببساطة
بدلاً من قراءة الجملة بشكل خطي:
النموذج ينظر لكل الكلمات مرة واحدة
🧠 كيف يعمل Attention؟
كل كلمة تسأل:
ما الكلمات المهمة بالنسبة لي؟
مثال:
في جملة:
"الولد الذي نجح في الامتحان فرح جداً"
كلمة "فرح" ستسأل:
- من الذي فرح؟
- الإجابة: "الولد"
🔥 هذا يسمى:
Self-Attention
🧠 ماذا يعني Self-Attention؟
هو:
كل كلمة تنظر إلى باقي الكلمات داخل الجملة
📊 تشبيه بسيط جداً
تخيل مجموعة أشخاص في غرفة:
- كل شخص يسأل الآخرين:
“هل أنت مهم بالنسبة لي؟”
🧠 النتيجة
✔ الكلمات المهمة تحصل على وزن أكبر
✔ الكلمات غير المهمة تُهمل
📌 مثال أوزان Attention
الولد → 0.9
الحديقة → 0.2
الامتحان → 0.8
فرح → 1.0
🧠 ما هو Transformer؟
هو:
نموذج يعتمد بالكامل على Attention لفهم النصوص
📌 الشكل العام
Input → Attention Layers → Neural Layers → Output
🧠 لماذا Transformers قوية جداً؟
لأنها:
✔ لا تنسى السياق
✔ تفهم الجمل الطويلة
✔ تربط الكلمات ببعض
🔥 الفرق الكبير
| قبل Transformers | بعد Transformers |
|---|---|
| قراءة خطية | رؤية كاملة للجملة |
| نسيان السياق | فهم السياق الكامل |
| ضعيف في النصوص الطويلة | قوي جداً |
🧠 كيف يتم الحساب داخل Attention؟
كل كلمة تحصل على 3 أشياء:
- Query (سؤال)
- Key (مفتاح)
- Value (قيمة)
📌 الفكرة ببساطة
Query → ماذا أريد؟
Key → ما الذي يملكه الآخر؟
Value → المعلومات
🧠 كيف يتم الربط؟
كل كلمة تقارن نفسها مع كل الكلمات الأخرى:
Score = Query × Key
🔥 ثم:
Softmax → تحويل إلى نسب
🧠 ثم يتم الجمع:
Output = مجموع (Value × الوزن)
🧠 ماذا يعني هذا عملياً؟
يعني:
كل كلمة “تتحدث” مع باقي الكلمات
📊 مثال بسيط جداً
الجملة:
"الطالب الذي درس كثيراً نجح"
كلمة "نجح" ستنتبه إلى:
✔ الطالب
✔ درس
🧠 لماذا هذا مهم جداً؟
لأن اللغة تعتمد على:
- السياق
- العلاقات
- المعنى العام
🔥 بدون Attention
❌ النموذج يفهم كلمات منفصلة
🧠 مع Attention
✔ يفهم الجملة كاملة
📌 أين يستخدم Transformers؟
- ChatGPT 🤖
- Google Translate 🌍
- YouTube recommendations 📺
- Search engines 🔍
🧠 ما هو سر ChatGPT الحقيقي؟
هو:
Transformer ضخم جداً + تدريب هائل
📊 لماذا هو ذكي؟
لأنه:
✔ يرى ملايين العلاقات
✔ يتعلم أنماط اللغة
✔ يفهم السياق الطويل
🧠 لكن الحقيقة المهمة
ChatGPT:
❌ لا يفهم مثل الإنسان
✔ لكنه يحاكي الفهم بشكل قوي جداً
🧠 تشبيه قوي جداً
Transformers مثل:
عقل يقرأ كل الجملة دفعة واحدة ويحدد أهم الكلمات
📌 خلاصة الحلقة 6
تعلمنا:
- مشكلة النماذج القديمة
- مفهوم Attention
- Self-Attention
- Query / Key / Value
- كيف يفهم السياق
- ما هو Transformer
- لماذا ChatGPT قوي جداً
🚀 في الحلقة 7 سنصل لمرحلة متقدمة جداً:
🧠 تدريب الذكاء الاصطناعي (Training at Scale)
وسنشرح:
- كيف يتم تدريب ChatGPT فعلياً
- ما هو GPU
- لماذا التدريب يحتاج وقت ضخم
- كيف يتم استخدام ملايين البيانات
- سر القوة الحقيقية للنماذج الحديثة 🔥

تعليقات
إرسال تعليق