سؤال بسيط بس إجابته مش واضحة! لما السيستم يرجع بـ
Documents، شو يقصد
بالظبط؟ هون بنحكي عن موضوع اسمه
Grain Size — يعني "حجم الوحدة".
A file? يعني كل ملف على حدة هو "مستند" واحد — هاض أبسط خيار.
An email? (mbox file) ملف الـ mbox ممكن يحتوي آلاف الإيميلات — هل نعتبر الملف كله مستند واحد؟ ولا
كل إيميل لحاله؟
Email with 5 attachments? إيميل ومعه 5 مرفقات — هل هو مستند
واحد؟ ولا 6 مستندات منفصلة؟ قرارك هون بأثر على دقة نتائج البحث!
A group of files (PPT, LaTeX): عرض PowerPoint أو ملف LaTeX مقسم
على صفحات HTML متعددة — هل كل صفحة مستند؟ ولا المجموعة كلها؟
مافيش إجابة "صح" واحدة — بتعتمد على طبيعة البيانات وشو بدك يطلع بنتائج البحث.