العودة للوحة التحكم

QudahWay SS

NLP and Computer Vision | معالجة اللغات والرؤية الحاسوبية

Introduction to NLP & CV Slide 01
Slide 1
البداية.. نظرة عامة 🌟
هون مبلشين نعرف شو يعني NLP و Computer Vision وكيف بيكملوا بعض في الأنظمة الذكية.
Yann LeCun's Vision (Nvidia GTC 2025) Slide 02
Slide 2
يانو ليكون فجرها بوجه الـ LLMs!
الأب الروحي للذكاء الاصطناعي Yann LeCun بطلع بمؤتمر Nvidia GTC2025 وبقولك "أنا بطلت مهتم بالـ LLMs"! ليش يا يانو؟
طواحين Tokens: بقولك الـ LLMs الحالية مجرد مولدات لرموز (Token generators) ومحصورة في "فضاء محدد" (discrete space).
الجيل الجاي لازم يعمل 3 شغلات:
  • يفهم العالم الفيزيائي (understand physical world).
  • يكون عنده ذاكرة دائمة (persistent memory).
  • والأهم: يكون عنده قدرة على التخطيط والمنطق (plan and reason).
يعني بالعربي، إنتو بتلعبوا بالكلمات، بس إحنا بدنا ذكاء حقيقي بفهم كيف الدنيا ماشية! 🧠🌍
Background in NLP Slide 03
Slide 3
تاريخ وماهية الـ NLP 📖⏳
شو يعني NLP أصلاً؟ هو فرع من فروع الـ AI واللغويات اللي بخلي الكمبيوتر "يفهم" و "يفسر" لغة البشر (نصوص أو كلام) زينا تماماً.
ليش طلع الـ NLP؟ عشان يحل مشاكل التفاعل بين الإنسان والآلة. السلايد بيعرض أهم المهام اللي بنشوفها اليوم مثل:
Machine Translation (الترجمة)، Sentiment Analysis (تحليل المشاعر)، وحتى الـ Speech Recognition (تحويل الكلام لنص).
NLP Task: Machine Translation Slide 04
Slide 4
المهمة 1: الترجمة الآلية (Machine Translation) 🌐🔠
ببساطة هي عملية "نقل" المعنى من لغة للغة ثانية بدون تدخل بشري.
الهدف: الكمبيوتر بياخد الـ Input Text بلغة معينة، وبطلعه باللغة الهدف (Target Language). زي ما بنشوف بـ Google Translate والمترجمات القوية.
NLP Task: Sentiment Analysis Slide 05
Slide 5
المهمة 2: تحليل المشاعر (Sentiment Analysis)
هون بنخلي الموديل يقدر "يحس" بالكلام!
مهمة الـ Sentiment Analysis إنها تحدد "النبرة" أو الشعور المكتوب في النص بـ 3 حالات رئيسية:
  • إيجابي (Positive): زي " الأكل كان فخم!".
  • سلبي (Negative): "الأكل بارد وما بنوكل".
  • محايد (Neutral): "طلبت الأكل ووصلني".
مفيدة جداً للشركات عشان تشوف آراء الناس بمنتجاتها.
NLP Task: Text Generation Slide 06
Slide 6
المهمة 3: توليد النصوص (Text Generation) ✍️🤖
هون بنلعب لعبة الـ ChatGPT! إنتاج نص يشبه كتابة البشر بناءً على مدخلات معينة.
أمثلة: ردود الـ Chatbots، كتابة محتوى جديد، وحتى التلخيص (Summarization).
زي ما إحنا شايفين بالمثال عن Michelle Obama، الموديل بياخد معلومات مفككة وبحولها لقصة متكاملة ومترابطة.
NLP Task: Text Classification Slide 07
Slide 7
المهمة 4: تصنيف النصوص (Text Classification) 📁🏷️
بدنا نرتب "كركبة" الداتا! الموديل بوخد النص وبحطه في "خزانة" أو فئة معينة مسبقاً.
ضروري جداً عشان ننظم كميات الداتا العظيمة. بالسلايد معطينا أمثلة زي تصنيف المقالات لـ: Art (فنون)، Business (بيزنس)، Culture (ثقافة)، أو Entertainment (ترفيه).
NLP Task: Named Entity Recognition (NER) Slide 08
Slide 8
المهمة 5: التعرف على الكيانات المسماة (NER)
تخيل الموديل معه "هاي لايتر" وبنقي الكلمات المهمة! مهمته يحدد ويصنف الكلمات اللي بتمثل أسماء أشخاص، أماكن، أو منظمات.
أشهر الكيانات:
- PER: شخص (زي محمد القضاه).
- LOC: مكان (زي عمان).
- ORG: منظمة (زي Nvidia).
بالمثال: نص الوظيفة بـ Atlanta GA الموديل لقطها فوراً إنها Location.
NLP Task: Question Answering Slide 09
Slide 9
المهمة 6: الإجابة على الأسئلة (Question Answering) ❓💡
هون بنحكي عن بناء أنظمة بتقدر "تجاوب" على أسئلة البشر بلغة طبيعية.
الموديل بيقرأ النص (Context)، وبستخرج منه الإجابة المناسبة. بالمثال مفرجينا سؤال "شو عاصمة ألمانيا؟" (Question)، والموديل بطلع الإجابة "Berlin" من النص الموجود.
NLP Task: Speech Recognition Slide 10
Slide 10
المهمة 7: التعرف على الكلام (Speech Recognition) 🎤➡️📝
تحويل "الصوت" لـ "نص". هاي بنسميها Speech-to-text.
العملية بتمر بخطوات فنية:
تعديل وتحسين الصوت (Speech Enhancement) ⬅️ استخراج الميزات (Feature Extraction) ⬅️ والـ Phonetic unit recognition (التعرف على الوحدات الصوتية) عشان بالنهاية تطلع كلمة "Hello" مكتوبة.
Why NLP Matters? Slide 11
Slide 11
ليش الـ NLP بغير حياتنا؟ (Why NLP Matters) 🌟📈
الـ NLP هو "الجسر" اللي بشبك بين تواصلنا كبشر وفهم الآلات إلنا.
تطبيقات عملية:
  • Customer Support: بالـ Automated chatbots اللي بتجاوب علينا دايماً.
  • Healthcare: تحليل السجلات الطبية بكبسة زر.
  • Finance: فحص التقارير المالية وتحليلها.
  • Social Media Monitoring: تحليل مشاعر الناس على السوشيال ميديا وتلخيص آرائهم.
Intro to Computer Vision Slide 12
Slide 12
فتحنا عيون الكمبيوتر (Computer Vision)! 👀🤖
خلصنا من الكلمات والنصوص، هسا ننتقل لعالم الصور والفيديوهات. الـ Computer Vision هو اللي بخلي الآلة "تشوف" وتفهم المحتوى البصري زينا.
ليش مهم؟ تخيل السيارات ذاتية القيادة، أو أنظمة المراقبة الذكية، وحتى الفلاتر تاعت السناب شات.. كلها بتعتمد على هاض العلم. هون بنحاول نحاكي "العين البشرية" بس ببرمجة ورياضيات.
Computer Vision Tasks Slide 13
Slide 13
CV Task: Classification Slide 14
Slide 14
المهمة 1: تصنيف الصور (Classification) 🐈🐕
هاي أبسط مهمة: "شو في بالصورة؟". بنعطي الموديل صورة Input، وبقولنا هاي "بس" أو "كلب".
كيف بشتغل؟ الصورة بتدخل على طبقات من الشبكات العصبية (Neural Networks) اللي بتتعرف على الأنماط (زي شكل الأذان، العيون، الفرو) عشان بالنهاية تطلع Output تصنيف نهائي.
CV Task: Detection Slide 15
Slide 15
المهمة 2: الكشف عن الأشياء (Object Detection) 📦🚲
هون الكمبيوتر مش بس بحكي شو شايف، لا.. وبقلك "وين" مكانه بالزبط!
الموديل برسم مربع (Bounding Box) حول كل إشي لقطه. شايفين بالمثال؟ لقط البسكليت (bicycle)، والكلب (dog)، والسيارة (car).
هاي المهمة أساسية للسيارات اللي بتمشي لحالها عشان تعرف وين المشاة ووين السيارات الثانية.
CV Task: Segmentation Slide 16
Slide 16
المهمة 3: التجزئة (Segmentation) 🎨🧩
هاي ليفل "الوحش"! مش بس مربعات، هون بنحدد حدود كل إشي "بالبكسل".
بصير الكمبيوتر يلون كل منطقة لحال:
- السما بلون أزرق (Sky).
- الشجر بلون بنفسجي (Trees).
- البس بلون أصفر (Cat).
- العشب بلون أخضر (Grass).
هاض النوع من الدقة مطلوب جداً في الصور الطبية (تحديد الأورام مثلاً) عشان نعرف حجمها ومكانها بالملي.
CV Task: Visual Question Answering (VQA) Slide 17
Slide 17
المهمة 4: الإجابة البصرية (VQA) 🖼️💬❓
هون دمجنا الـ NLP مع الـ CV. بنسأل الكمبيوتر سؤال عن صورة قدامه وهو بجاوب.
أمثلة من السلايد:
- "مين لابس نظارات؟" 🕵️ ⬅️ بجاوبك الزلمة ولا المرة.
- "وين الولد قاعد؟" 👶 ⬅️ بقلك بالثلاجة (fridge).
- "هل المظلية مقلوبة؟" 🌂 ⬅️ بقلك نعم أو لأ.
CV Task: Captioning Slide 18
Slide 18
المهمة 5: وصف الصور (Captioning) 📝🌉
هون بدنا الكمبيوتر يكتب "قصة" قصيرة توصف اللي شايفه.
الموديل لازم يربط بين الأشياء اللي لقطها ويوصف علاقتهم ببعض.
- "كمنجة معروضة بصندوق زجاجي" (a cello is on display).
- "عنكبوت قاعد على الأرض جنب قطعة عملة" (a spider sitting next to a coin).
- "همبرغر وبطاطا بصحن" (A hamburger and fries on a plate).