دانلود با لینک مستقیم و پر سرعت .
نوع فایل: word
قابل ویرایش 160 صفحه
مقدمه:
رتبهبندی بخش کاملی از سیستم بازیابی اطلاعات میباشد. در مورد query وب، به علت اندازه وب و ماهیت ویژه کاربران وب، نقش رتبهبندی اهمیت پیدا میکند. داشتن هزاران میلیون نتیجه برای جستجوی تحقیق وب متداول میباشد. از طرفی کاربران وب زمان لازم را برای یافتن چنین مواردی ندارند. اثبات شده است که بیشتر کاربران وب فراتر از اولین صفحه نتایج عمل نمیکنند. بنابراین حصول نتایج مطلوب در صفحات مهم نیست در غیر این صورت عامل تحقیقاتی بیفایده خواهد بود.
بنابراین نیازهای کاربران به موقع جستجوی وب از بازیابی اطلاعات سنتی متفاوت هستند. به عنوان مثال، کاربری که جستجوی «میکروسافت» را به عامل تحقیقاتی وب مطرح میسازد، به احتمال قوی صفحة مخصوص شرکت میکروسافت را به جای صفحه کاربر تصادفی درباره محصولات میکروسافت جستجو میکند. در مفهوم بازیابی اطلاعات سنتی، صفحه کاربر تصادفی ممکن است با این جستجو در ارتباط باشد. اما کاربران وب به صفحات اختیاری علاقمند هستند یعنی منابع اطلاعاتی درست که دارای «حضوری قوی» در وب میباشند. در تحقیق وب، از «ارتباط» به «اختیار» تغییر شکل میدهیم. نقش رتبهبندی، شناسایی و درجه بندی مدارک اختیاری در مجموعه صفحات وب میباشد. بالاخره، وب بافتی غنی از اطلاعات را ارائه مینماید که به واسطه فوق پیوندها نشان داده میشود. فوق پیوندها بافتی را ممکن است تعریف کنند که در آن صفحه وب پدیدار میگردد. بطور استنتاجی، پیوند صفحه p به q ، کیفیت صفحه q را تأیید میکند.
میتوانیم به وب به عنوان شبکهای از توصیههایی فکر کنیم که حاوی اطلاعاتی درباره اعتبار صفحات میباشند.
بوسیله تابع رتبهبندی چنین اطلاعاتی حاصل گردیده و اختیار نسبی صفحات وب را منعکس میسازند. بر اساس این ایده، مقالههای اصلی Kleinberg «رتبهبندی تحلیل پیوندی» را معرفی نمودند که در آن از ساختارهای فوق پیوندی برای رتبهبندی صفحات وب استفاده میگردد.
در این مقاله در چارچوب هابهای تعریف شده توسط Kleinberg (1998) عمل شده است که دارای سه نقش زیر میباشند:
1) برخی از نقاط ضعف بالقوه الگوریتم HITS ارائه شده توسط Kleinberg (1998) را شناسایی کرده و الگوریتمهای جدیدی ارائه شده اند که در آنها از روشهای متناوب برای محاسبه هاب و وزنهای اختیار استفاده میگردد. دو الگوریتم از الگوریتمهای جدید ما به روش آماری بیزی مبتنی هستند.
2) برای مطالعه الگوریتمهای رتبهبندی تحلیل پیوند چارچوبی تئوریکی مشخص شده است. در این چارچوب ویژگیهایی مانند یکنواختی، پایداری، محل و برچسب مستقل مشخص شده است. همچنین ایدههای مختلف شباهت موجود بین الگوریتمهای رتبهبندی تحلیل پیوندی تعریف شده است. این ویژگیها به ما امکان میدهند یک شاخص اصولی از الگوریتم INDEGREE مشخص سازیم که گرهها را مطابق تعداد پیوندهای وارده رتبهبندی میسازند.
3) یک ارزیابی آزمایش وسیعی از الگوریتمها را در مورد جستجوهای متعدد به عمل آورده شده است. ملاحظه میکنیم که هیچ روشی از «طرح موضوعی» کاملاً مصون نیست اما به نظر میرسد که برخی از این روشها نسبت به روشهای دیگر مقاومتر هستند. برای درک بهتر رفتار الگوریتمها، ساختارهای نموداری مورد مطالعه قرار خواهد گرفت. این تحقیق دیدگاه ارزشمندی در قالب دلایلی ارائه مینماید که مسایل جالب توجهی برای تحقیق آتی را مطرح میسازد.
فهرست مطالب:
فصل اول: مقدمه
فصل دوم: زمینه و تحقیق قبلی
2-1)پیشگفتار
2-2)الگوریتم های قبلی
2-2-1)الگوریتم indegree
2-2-2)الگوریتم page rank
2-2-3)الگوریتم hits
2-2-4)الگوریتم salsa
2-2-5)تحقیقات دیگر
فصل سوم: الگوریتم های رتبه بندی تحلیل رابط جدید
3-1)الگوریتم میانگین هاب(hub avg)
3-2)خانواده AT(K) آستانه مرجع الگوریتمها
3-3)الگوریتم max
3-4)الگوریتم جستجوی پهنایی(BFS)
3-5)الگوریتم Basian
6-3)الگوریتم Basian ساده سازی شده
فصل چهارم: چارچوب تئوریکی برای مطالعه الگوریتم های رتبه بندی تحلیل رابط
4-1)الگوریتم های رتبه بندی تحلیل پیوند
4-2)سنجش فاصله بین بردارهای LAR
4-2-1)سنجش های فاصله هندسی
4-2-2)سنجش فاصله مرتبه بندی
4-3)شباهت الگوریتم های LAR
4-3-1)نتایج شباهت
4-3-2)نتایج دیگر
4-4)پایداری
4-5)حالت موضوعی
4-6)یکنواختی
4-7)استقلال نشانه
4-8)ویژگی موضوعی الگوریتم INDEGREE
فصل پنجم: ارزیابی آزمایش
5-1)مجموعه آزمایش
5-2)ارزیابی الگوریتم های LAR
5-3)اثرات مجموعه ای
5-4)تفاوت نتیجه گیری برای تحقیقات آزمایش فصل ششم: رتبه بندی صفحات به صورت ارزش گذاری شده
6-1)قائده رتبه بندی صفحات به صورت ارزش گذاری شده
6-2)الگوریتم رتبه بندی صفحات
6-3)توصیف page rank به صورت ساده شده
6-4)رتبه بندی صفحات به صورت ارزش گذاری شده
6-5)تحقیقات
6-6)ارزیابی
6-7)تعیین ارتباط صفحات با پرسش ارائه شده
6-8)محاسبه و ارزیابی فهرست صفحات مرتبط با سئوال ارائه شده
6-9)تمرکز بر روی موضوع یا عنوان سئوالات ارائه شده
فصل هفتم: نتایج کلی
فهرست شکلها:
شکل 1)الگوریتم hits
شکل 2)یک مثال نادرست برای الگوریتم hits
شکل 3)الگوریتم hub avg
شکل 4)یک مثال نادرست برای الگوریتم hub avg
شکل 5)الگوریتم at(k)
شکل 6)شباهت indegree,hits
شکل 7)شباهت hubavg,hits
شکل 8)مقایسه indegree,hub avg
شکل 9)مقایسه hits_salsa و hub avg_indegree
شکل 10)غیر یکنواختی authority avg
شکل 11-a)گراف G
شکل 11-b)گراف G1
شکل 11-c)گراف G2
شکل 12-a)hub
شکل 12-b)ماتریس نقطه ای با 10 نتیجه hub
شکل 13)نتیجه TCKبرای الگوریتم hits
شکل 14)پرس وجوی سقط جنین
شکل 15)hits,hub avg برای پرسش دستورالعمل ها
شکل 16)الگوریتمat-med,at-avg
شکل 17)پرس و جوی پارک های سرگرمی
شکل 18)ضابطه جسم شناور برای page rank
شکل 19)hub,authorities
شکل 20)یک مثال از عملیات hits
شکل 21)یک مثال از پیوند پیشین
شکل 22)نسخه ساده شده page rank
شکل 23)پیوندها به یک وب سایت
شکل 24)معماری مولفه های سیستم مورد استفاده برای طراحی و ارزیابی الگوریتم W
شکل 25)ارزش رابطه در برابر اندازه مجموعه صفحات پرس و جوی عامل مسافرتی برای WPR,page rank
شکل 26)ارزش رابطه در مقابل اندازه مجموعه
فهرست جداول:
جدول 1
جدول 2
جدول 3
جدول 4)ارزش رابطه برای پرس و جوی عامل مسافرتی page rank,WPR
جدول 5)ارزش رابطه برای پرس و جوی "تحقیق" تولید شده به وسیله page rank,WPR