يا خالي، ركز معي في البوكس الأزرق اللي في الصورة.. هاض هو "السر" اللي رح ينقذنا من كارثة الصفر.
شو اللي تغير؟
بدل ما نعتبر إن الملف هو "بس الكلمات اللي مكتوبة فيه"، صار الملف الآن عبارة عن
Language Model كامل،
بيعطي احتمالية لكل كلمات اللغة، حتى اللي مش موجودة فيه!
📌 مثال "update":
في الموديل القديم، كانت نسبة ظهورها صفر.
أما في الموديل المطور، أعطيناها نسبة صغيرة جداً (مثلاً 0.00001).
النتيجة العظيمة:
لما نيجي نضرب الاحتمالات ببعض، بطلنا نضرب بصفر. النتيجة رح تطلع رقم صغير جداً، بس
مش صفر. وهيك بنقدر
نرتب الملفات حتى لو كان فيها كلمات ناقصة.