سایرتحقیق و پژوهش

موتورهای جست وجو

صفحه 1:
موتورهای جست وجو دانشجو: استاده مربوطه : درس مربوطه :

صفحه 2:
جكيده ميلياردها صفحه وب در دنيا وجود دارد که هر روز بر تعداد آن ها افزوده می شود.بدون وجود موتورهای جست وجو استفاده از منلبع موجود در اینترنت بسیار سخت خواهد بود.در واقع موتورهای جست وجوء استفاده از شبکه جهانی وب را برای کابران بسیار راحت کرده اند. جیت توسعه دادن این نرم افزار ها و نیز استفاده ی کاراتر از تن ها در هنگام جست وجو و یا ثبت وبسایت جدید بهتر است که در ابتدا بدانیم ساختار و عملکرد موتور های جست وجویی که درحال حاضر الگوریتم دقیق و چگونگی کار موتور جست وجوی گوگل یا سایر موتورهای جستجو کاملا معلوم نیست. اما کلیات کار بسیاری از موتورهای جستجومشترک ومشابه می باشد. همچنین نیاز است با مباحثی از قبیل انواع سرویس های جست وجو ‏ فاکتورهای مهم در الگوریتم های رتبه بندی نتلیج و بحث بهینه سازی آشنا شویم. چگونگی الگوریتم های رتبه بندی نتلیج , در كيفيت کارکرد موتورهای جست وجو تأثیر بسزایی دارند و عمده ترین تفاوت در کیفیت کارکرد موتورهای جست وجو به وجود تفاوت در سیستم رتبه بندی آّن ها مربوط می شود. البته این الگوریتم ها به دلیل مسائل رقابتی و همچنین جلوگیری از سوء استفاده وب داران معمولا فاش نمی شوند. وجود دارند به چه صورت است.۱

صفحه 3:
مقدمه موتور جستجویا پیمایشگر به طور عمومی به برنامه ای گفته می شسود که کلمات کلیدی را در یک سند یا بلنک اطلاعلتی جستجو می کند. در اینترنت‌به برنامه ای گفته می شود که کلمات کلیدی موجود در فلیل ها و سندهای وب جهلنی » گروه های خبری, منوهای گوفر و آرشیوهای ۳ ۴را جستجو می کند وبه کاربران در جستجوی اطلاعات مورد نظر در میان انبوه اطلاعات موجود در شبکه کمک می کند. در موتور جستجو کاربر کلید واژه ی را وارد کرده و برنامه ی جستجو در بلنک اطلاعاتی خودبه جستجو می پردازد. و سایت های مرتبط با موضوع شما را نمایش خواهند داد. البته امروزه بیشتر موتورهای جستجو دارای اطلاعات طبقه بندی شده مانند دایرکتوری ها می باشند و همچنین اکثر دایرکتوری ها قابلیت جستجو مانند موتورهای جستجو را دارند.

صفحه 4:
تاریخچه در سال ۱۹۵۷ پس از آن که شوروی ساب اولین ماهواره یا قمر مصنوعی زمین به نام اسپوتنیک(500۴۴3) را به فضا پرتاب کرد؛ ایالات متحده آمریکا آژانس پرویٌه های پیشرفته تحقیقاتی(/۵۳) را به عنوان بخشی از وزارت دفاع انا ون کی پیشگامی ایالات متحده در علم و تکنولویی مورد استفاده از ارتش بود. یکی از نامه ای برای آمریکا بود که پس از یک حمله اتمی, کنترلش را بر موشک ها و ن ترتیب شبکه ۸۵۳۸۵۱۱۲ که امروزه‌به عنوان اینترنت شناخته می شود به وجود آمد. اولین اتصالات آرپانت در سال ۱۹۲۹ ایجاد و در اکتبر ۱۹۷۲ این شبکه عمومی شد(البته نه بیای تمام کشورهای جهان). تقريباً ‎7٠‏ سال يس از بيدليش اينترنت به منظور ایجاد امکان تبادل عمومی اطلاعات بر پلیه یک استاندارد فراگیر وب جهلنی(۷۷۷۷۷۷) متولد شد. ‎J‏ جه عنوان زیرساخت اینترنت مورد استفاده قرار گرفت. طبق گفته«تیم برنزلی» سازنده شبکه جهلنی وب: «اینترنت شبکه ای از شبکه ها بوده و اساساً از کامپیوترها و کلبل ها ساخته ده است. وب یک فضای خیللی شامل اطلاعات است. در اینترنت» کامپیوترها و در وب؛ اسناده صداهاء تصاویر ویدئویی و اطلاعات را می یابید. در اینترنت اتصالات از طوبق کابل های میان کامپیوترها و در وب. پیوندهای فیامتتی هستند. بمب افکن های خود حفظ کند.

صفحه 5:
وب به دلیل برنامه هایی که میان کامپیوترهای موجود در اینترشت ارتباط برقرار می کنند. وجود دارد. وب بدون اینترنت معنایی ندارد. از آن جا که مردم واقعاً به اطلاعات جدید علاقه مندند و در عین حال نمی خواهند مجبور باشند مطللبی در مورد کامپیوترها و کلبل ها بدانند. وب باعث شده است اینترنت مفید واقع شود.» به دلیل اطلاعلتی که در کل جهان بین کامپیوترها به اشتراک گذاشته شده به تدریج لازم بود تا لین اطلاعات نظم پیدا کند. در لین راستا موتورهای جستجوی اینترنت به وجود آمدند. اولین وسیله جستجوگر در اینترنت ۸۸۲۱۱16 نام داشت كه در سال ۱۹۹۰ توسط«للن امتیج» یکی از دانشجویان دانشگاه«مک گیل» در مونترال کانادا ایجاد شد. این برنامه با ایجاد یک پایگاه اطلاعلتی قلبل جستجو از اسامی فلیل هاء فهرست فلیل های موجود در سایت های ۲۳ ۴ عمومی ناشناخته را در خود جای داده بود. بعد ازلن جستجوگری به نام«گوفر» در سال ۱۹۹۱ توسط«مارک مک کاهیل» در دانشگاه«مینه سوتاء‌ی آمریکا ساخته شد. در حللی که آرچی فایل های کامپیوتری را فهرست می کرد. گوفر اسناد متنی ساده را ایندکس گذاری می کرد. از آن جلیی که لین ها فلیل های متنی بودند. اغلب سایت های گوفر پس از ایجاد شبکه جهانی وب. به وب سایت تبدیل شدند.

صفحه 6:
دو برنامه دیگر به نام های ورونیکا و جاگهید(01 91163 ل) فایل های ذخیره شده در سیستم های ایندکس گذاری گوفر را جستجو می کردند. برنامه ورونیکا جستجو براساس کلمات کلیدی از اغلب عنامین منوها در تمام لیست های گوفر را فراهم کرد و برنامه جاگهید نیز برای دستیابی به اطلاعات منو از کامپیوترهای شبکه ای(سرور) نوع گوفر بود. در سال ۱۹۹۳ یعنی دو سال بعد, یکی از دانشجویان دانشگاه 101۲ آمریکا به نام‌«متیوگری» اولین روبات جستجوگر اینترنتی به نام ‎world wide‏ ۲ 69 ۷۷ را ساخت. این روبات در ابتدا برای شمارش وب سرورها به منظور اندازه گیری گستردگی وب به کار گرفته شد. در سال۱۹۹2و۱۹۹۵ سه موتور جستجوی آلتاویستاءلایکوز( 605 )و وب کللر(۲۵۷۷۱6۲ 60 ۷۷به وجود آمدند.در همین سال ها موتورهای راهنما نیز پا به عرصه جستجو در شبکه گذاشتند که روش نملیه سازی و بازیابی متفاوت از موتورهای جستجو در شبکه گذاشتند. لین رقابتها در اواخر دهه نود میلادی و تلاشهای صورت گرفته منجربه پیدلیش و عرضه موتورهای جستجوی دیگری از آن جمله معرفی موتور جستجوی گوگل(900916) "گردید.در واقع گوگل در سال های ۱۹۹۷ توسط دو و "لارنس پیج "در دانشگاه استانفورد به وجود آمد.

صفحه 7:
انواع سرویس های جستجو در دهه نود که موتورهای جست و جوپابه عرصه وجود گذاشتند سرویس جست جوبه دو دسته کلی تقسیم می سد.۱:موتورهای راهنما ۲:موتورهای پیمایشی؛ولی با گذشت زمان و به وجود آمدن نسل های دیگری از موتورهای جستجو این تقسیم بندی به شکل های دیگری در آمد. در حال حاضر که در جهان بیش از سیصد موتور جستجو وجود دارد. از موتورهای جستجوی بین المللی بسیار بزرگ تا موتورهای جستجوی کوچکتری که فقط با سایتهای کشورهای خاصی سروکار دارنده این موتورها به چهار دسته تقسیم می شوند. ا: موتورهای پیمایشی: موتور های پیمایشی که نام دیگرلن ها موتورهای متن کامل اسپایدری است , لین موتورها برای فهرست میلیونها و گاهی بیلیونها صفحه ی وب از نرم افزاری به نام عنکبوت ها استفاده میکنند. جستجو در این موتور ها از طویق شاخصی قابل جستجو انجام می پذیرد.

صفحه 8:
چند نمونه از موتورهای پیمایشی که ترافیک اصلی جست وجو بر روی آن ها قرار دارد: ‎Google (www.Google.com)‏ ‎All the Web (www.alltheweb.com)‏ ‎Altavista (www.altavista.com)‏ ‎Yahoo (www.Yahoo.Com)‏ ‎MSN (www.msn.Com) Ask Jeeves (www.Askjeeves.com‏ 27 موتورهای راهنما (قهرست های دست نویس شده) ۶ این موتورها تنها سرفصل ها و عناوین موضوعات را جستجو میکند (مانند یاهو که یاهو مادر همه ی دایرکتوری هاست). این جستجو, شبیه جستجو در فهرست یک کتاب است. موتورهای دایرکتوری یک تفاوت اساسی با موتورهای جستجوی پیمایشی دارند ولّن بکارگیری عنصر انسانی بجای نرم افزارهای عنکبوت . در جمع آوری؛ ذخیره و نگهداری اطلاعات میباشد. راهنماها توسط افراد متخصص خلق و نگهداری میشوند در حالیکه موتورهای جستجو نمایه سازی را به صورت خودکار و توسط نرم افزارهای روبوت یا همان عنکبوت انجام میدهند.

صفحه 9:
مزینهای اصلی موتورهای راهنما ء الف) موتورهای راهنما شامل منابع کمتری در مقایسه با موتورهای جستجو میباشند. ب) بسیاری از موتورهای راهنمءمنابع انتخابی را رتبه بندی, تفسیر و طبقه بندی میکنند. ج) احتمال بازیابی نتایج مربوط افزایش مبیابد. تقاط ضعف موتورهای راهنما * للف) در سازماندهى اختيارى منلبع که روش اصلی موتورهای راهنما است یک موتور راهنما ممکن است منلبع راجه گونه ای طبقه بندی کند که متفاوت از موتور راهنمای دیگر باشد. به اين ترتيب نمیتوان از یک الگوی واحد در همه موتورهای راهنما برای ارزیابی استفاده کرد. ب) انتخاب. رتبه بندی و طبقه بندی صفحات وقتگیر و هزینه زیادی را تحمیل میکند. به لین ترتیب نمیتوان منلبع جدید را به سرعت اضافه نموده در نتیجه منابع بازیابی شده از موتورهای جستجو روزآمد نیستند. ج) افرادبا ذهینت خود در رابطه با مفید بودن یا نبودن منلبع تصمیم گیری میکنند.به لین ترتیب آنچه که از طرف یک نفر ممکن است مفید باشد؛ ممکن است از طرف شخص دیگر مفید نباشد و در فهرست قرار نگیرد.

صفحه 10:
تعداد موتورهای راهنما در مقایسه با موتورهای جستجوی پیمایشی زیاد نمیباشد ولی مهم ترین آنها عبارتند از: ا ۱۱ ۰ )96۷ ]9 دک HotBot Directory (http://hotbot. Lycos.Com) LookSmart (%top)) www.tooksmart.com) Open Directory Project( 1 Yahoo! (http://www.yahoo.Com) Google Directory (www. google.com

صفحه 11:
۳ :موتورهای جست وجوی ت رکیبی با ‎cul‏ مختلط: موتور جست وجوی ترکیبی به موتورهلیی اطلاق میشود که هر دو حللت را در کنار هم نملیش میدهند. غالبا یک موتور جستجوی ترکیبی در صورت نمایش نتیجه جستجو از هر یک از دسته های فوق, نتایج حاصل از دسته دیگر را هم مورد توجه قرار میدهد. مثلا موتور جستجوی ام.اس-ان بیشتر نتایج حاصل از فهرست های (1/1510) تكميل دستى را نشان ميدهد اما در كنار آن نيم نكاهى هم به نتايج حاصل از جستجوی پیمایشی دارد. > :ابرجستجوكرها: اين كونه جديد از موتورهاى جستجوكر كه قدمت جندلنى نيز ندارند عمل جست وجو را با استفاده از تركيب كردن نتايج حاصل از جندين موتورجستجوكرء انجام می دهند؛ بدين معنى كه اين موتور هاء عبارت مورد جست و جو را در جندين موتورجستجوكر جستجو مى كنند و نتليج آنها راجا هم تركيب كرده ويك نتيجه كلى ارليه اين ‎١‏ اين موتور هاء ذاراى يايكاه داده و سيستم شاخ كذارى نمى باشندء واز يايكاه داده ی جندين موتور بايه استفاده مى كنند. به عنوان مثال موتورجستجوكر داك يايل از نتايج حاصل از موتورهاى ۷ - ۷۵۳۵۵ - 600916 و ۱ ۸5 ستفاده می کند. بدیهی است كه سرعت عملكرد لين موتور ها کمی کند بوده و چند انیه طول می کشد تا نتایج را ارایه بدهند. ۱۳

صفحه 12:
لیست کاملی از ابرموتورهای جستجو را میتوان از طریق راهنماها مانند یاهو به دست آورد اما برخی از مهمترین آنها عبارتاند از: Dogple (www.Dogple.Com) Highway 61 (www.Higwa61.Com) Kartoo (www.Kartoo.Com) Mamma (www.Mamma.Com) MetaCrawler (www.Metacrawler.Com) ProFusion (www.Profusion.Com) Vivisimo (www.Vivisimo.Com)

صفحه 13:
۱۳ ساختار موتورهای جستجو به طور کلی همه موتورهای کاوش, فرایند جستجو و بازیابی اطلاعات را از طریق برقراری ارتباط میان سه جزء اصلی تشکیل دهنده خود یعنی رباتها (عنکبوت ها). پایگاه اطلاعاتی و نرم افزار بازیابی اطلاعات [که کاربر از طریق رابط کاربری به آن مرتبط میشود] انجام میدهند. موتورهای جستجو جهت کاهش زمان جستجو بخش های بسیاری از کار خود را از قبل انجام می دهند و پایگاه داده خود را آماده می کنند» تا در لحظه ای که کاربر عبارتی را جست وجو می کند ؛ عمل جست وجو را كه شامل مقایسه و تطبیق دادن عبارت جست و جو شده می باشد. فقط ان داده های موجود در پایگاه داده خود انجام دهندنه از میان میلیاردها وب سایت. بنابرلین لین موتورها . محتویات وب سایت ها را پیش پردازش میکنند. پیش پردازش به کمک نرم افزارهلیی به نام خزنده و عنکبوت انجام می گیرد.خزنده آدرس لینک ها و وب سایت ها را در اختیار نرم افزار عنکبوت (روبات) قرار می دهد. عنکبوت درخواستی را از طریق پروتکل ‎۲٩۲۲۳‏ به سرور سایت ها ارسال می کند و محتویات وب سایت را در قللب کد های ‎Cab SHTML‏ می کند ولن ها را پیملیش می کند تا محتویات صفحات وب را جمع آوری کند.

صفحه 14:
عنکبوت ها در هنگام پیمایش محتویات وب سایت اگربا لینکی مواجه شوند, آن را دنبال می کنند. خزنده تعيين مى کند که عنکبوت, لینک ها را تا چه عمقی دنبال کند که البته ظرفیت دیتا سنتر نیز لحاظ می شود.ممکن است خزنده از قبل برنامه ریزی شده باشد که آدرس های خاصی را طبق برنامه ؛ در اختیار عنکبوت قرار دهد. تمامی اطلاعات جمع آوری شده توسط عنکبوت. در اختیار سیستم شاخ گذاری قرار می گیرد. سیستم شاخ كذارى يك نرم افزار ويقِه اى است که محتویات بازیافتی را تجزیه و تحلیل می کند تا کلمات را استخراج نماید و مشخص کند که لین اطلاعات از کدام صفحه ارسال شده اند. و بعد اين كلمات را همراه با لینکی به صفحه مربوطه در فایل شاخص (در پایگاه داده) ذخیره می کند. پرس و جو های کاربران با همین فایل شاخ مقایسه و مطابقت داده می شود ونه با صفحات وب. کار مهم دیگری که ایندکسر انجام می دهد لین است که عنوان ها , برچسب های ابر متن,تعداد تکرار کلمات کلیدی و مکلنی را که لين کلمات قرار گرفته لند مشخص می کند. در واقع ایندکسر» صفحه راجه بارامترهاى من خرد مى كند و از همه لین ها یک مقیاس عددی در می آورد تا بعدا سیستم رتبه بندی بتولند پارامترهای صفحات مختلف رابا همدیگر مقایسه کند. در واقع خروجی کار لین قسمت از ایندکسر بعدابه سیستم رتبه بندی تحویل خواهد شد. قبل ا سازی کلمات در پایگاه داده. عملیات فشرده سازی انجام می گیرد؛ تا حجم داده ها کاهش یلبد و فضای کمتری اشغال کند.به عنوان مثال موتور جستجوی گوگل برای ذخیره سازی اطلاعات درجه بندی شده فضایی را به اندازه بایت یعنی۱۷بیت را اختصاص می دهد که در این فضا اطلاعاتی نگهداری می کند.

صفحه 15:
شاخص گذاری یک هدف را دنبال می کند : دستیابی به اطلاعات در سریع ترین حالت ممکن. برای ساخت یک فههرست » یکی از روش های موثر » روش ساخت می باشد. در این روش فرمولی ‎Hash Table‏ به کاربرده می شود که به کمک آن برای هر کلمه ای یک ارزش عددی در نظر گرفته می شود. فرمول مذکور به منظور توزیع متعادل اعداد پیش فرض به کار برده می شود. توزیع عددی کلمات کاملابا توزیع کلمات بر حسب حروف الفبا متفاوت است و این تنها کلید موفقیت جدول 1۸5۲۷ می باشد. در زبان انگلیسی . حروف زیادی در ابتدای لغات استفاده می شوند در حللی که برخی دیگر کمتر. مثلا در فرهنگ لغات انگلیسی قسمت مربوط به حرف 1/1 قطورتر از حرف6ا می باشد. اين نا برابرى به اين معنا مى باشد که برای یافتن لغات متداول نسبت به یافتن لغاتی که به مراتب کاربرد کمتری دارند ‏ مدت زمان بیشتری باید صرف کرد.عملیات 65106 (ترتيب بندی لغات بر اساس اعداد) باعث ایجاد تعادل می گردد و سرعت جستجوی بخش های ورودی را کاهش می دهد. فهرست را از سیستم ورودی جدا می سازد. جدول شامل اعداد ‎Hash‏ ‏که هر یک از آنهابه اطلاعات فعلی دلالت می کند وبه موثرترین روشی ممکن ذخیره می شوند. بعد از آنکه تمام مراحل قبل انجام شسد. موتور جستجوگر آماده پاسخ گویی به سوالات کاربران است. کاربران چند کلمه را در جعبه جستجوی(8026 668۲61)آن را وارد می کنند و سپس با فشردن 107181 منتظر ياسخ مى مانند. ۱۳

صفحه 16:
الگوریتم های رتبه بندی الگوریتم رتبه بندی مجموعه ای از دستورالعمل ها است که موتور جستجوگر با اعمال آنها بر پارامترهای صفحات موجود در پایگاه داده اش؛ تصمیم می گیرد که صفحات مرتبط را چگونه در نتایج جستجو مرتب کند. در حال حاضر قدرتمندترین سیستم رتبه بندی را 900916 و ۸51 در اختیار دارند. حتی اگر موتور جستجوگر بهترین و کامل ترین پایگاه داده را داشته باشد اما نتولند پاسخ های مرتبطی را ارلیه کند. یک موتور جستجوگر ضعیف خواهد بود. در حقیقت سیستم رتبه بندی قلب تهنده یک موتور جستجوگر است. الگوریتم های رتبه بندی همان طور که ذکر شد فاش نمی شوند ولی معمولا از قوانین زیر پیروی می کنند. قانون مکا ن/تکرار قانون مکان /تکرار (بسامد) محل قرار گیری و تعداد دفعات ظاهر شدن یک وایّه در یک متن را مورد بررسی قرار می دهد مثلا کلمه ای که درا؟]ل) صفحه, در عنوان متن‌یا در پارگراف اول ياجه عنوان برچسب قرار بگیرد رتبه بیشتری نسبت به واژه ای خواهد داشت که در لابلای متن یا در قسمتهای پایانی متن آورده شده است.

صفحه 17:
عوامل خارج از صفحه عواملی وجود دارند که در رتبه بندی موتورهای جست وجو بکار گرفته می شوند ولی از کنترل وب دار ها خارج هستند.در واقع وب دار ها نمی توانند از لین طریق ء موتورها را فریب دهند.ان عوامل, عوامل خارج از صفحه نامیده می شوند که شامل تجزیه و تحلیل لینک ها وارتباطات هست.موتورهای جست وجو لینک ها را بررسی کرده و از محبوبیت ن ها می فهمند که آن صفحات مهم هستند و شایسته ترفیع رتبه می باشند.علاوه برّن « موتورهای جست وجو بررسی می كنند كه کدام صفحه توسط کاربری که کلمه ای را جست و جو کرده انتخاب شده است.سپس با توجه به تعداد انتخاب هاء رتبه صفحه مورد نظر را تعیین مى کند.

صفحه 18:
معیار مقایسه و رتبه بندی موتور های جست وجو ۱.ندازه پایگاه اطلاعاتی در اختیار موتور؛ حجم صفحاتی از وب که در پایگاه نمایه شده است. بستگی به این اندازه دارد. ۲عمق نمایه سازی؛ که بخشی از صفحه چون کلمات و سطور اول يا کل آن را نمایه کند. ۳ قدرت جستجو که ضعیف باشد یا پیشرفته و با امکان گزینش های مختلف. > روزآمد بودن اطلاعات؛ برخی موتورها هر + روز يا یک ماه از طریق ربات ها اطلاعات خود را روزامد می کنند و برخی کمتر یا بیشتر؛ که البته اين سياست معمولاً فاش نمی شود و بررسی های آماری آن را کشف می کند. 0 تعداد پیوندهای کور؛ روزلنه هزاران صفحه وب. آدرسشان از بین میرود یا تغییر میکند که کاربر با صفحه "51167 4 ۱06مواجه میشود. هرچه اين پیوندها کمتر نمایه شوند امتیاز استد اولویت نمایش . هر جه نمایه مرتبط تر را در ادا نمایش دهد.یک اممتیاز برای موتورجستجو محسوب می شود. ۷ سادگی و قابل فهم بودن رابط كاربرى- ۸ سرعت بازیابی اطلاعات.

صفحه 19:
وب پنهان در حقیقت بخش اعظم وب از دسترسی موتورهای جستجوگر دور است که به آن وب پنهان گفته می شسود. در مقابل می توانید وب نمایان را بخشی از وب بدانید که موتورهای جستجوگر می توانند به ن دسترسی داشته باشند و در نتایج جستجو به میاجعه کنندگان خود نمایش دهند. پایگاه های داده قابل جستجو بخش اعظم وب پنهان همین پایگاههای داده هستند. برای استفاده از اطلاعات موجود در آنها ابتدا بلید کاربر فرمی راچر کند. چون موتور جستجوگر توانلیی انجام لین کار را ندارد بنابرلین نمی تولند به اطلاعات آن دسترسی داشته باشد. در لین پایگاههای داده متناسب با نیاز کاربر صفحه ساخته می شود وبا توجه به حجم بالای اطلاعات عملا نمی توان تمام حالتهای مورد نیاز کاربر را شناسایی کرد و از قبل برای ُن صفحه ای ساخت. اگر کاربری لینک مستقیمی به یکی از لين صفحات تولید شده ایجاد کند آنگاه موتور جستجوگر شلید بتولند.به آن اطلاعات دسترسی يبدا كند.

صفحه 20:
صفحات منفک شده پاره ای از صفحات نیز به دلایلی از تیررس موتورهای جستجوگر دور نگاه داشته شده اند. سیاست کاری صاحبان سایتها و ضعف طراحان سایتها مهم ترین این دلایل هستند. فایلهای پنهان, اسناد نیازمند رمز عبور برای خواندن و پایگاههای داده تجاری مواردی(استفاده از اطلاعات به شرط پرداخت حق عضویت در سایت) را می توان در این گروه قرار داد. تفاوت میان موتورهای جستجو گر با توجه به تعداد زیاد موتورهای جستجو ‏ اجازه بدید در ادامه مطلب فقط یه مقایسه مختصر بین ۰ 600916 9 ۷۵۱۵0 و ۰۸۵0۱ که چهار تا از موتورهای پرکاربردی هستن . اشاره ای داشته باشیم . اولین مقایسه در مورد زبانیهای مختلفه . صفحه جستجوی 600916 رو می تونید به حدود ۱۵۰ زبان مختلف این عدد برای 81۳9 و ۷۵۵۵ حدود ۲۰ ا 4۰ و برای ۰01 فقط 1 زبلنه . اگر چه هر > تای اینها امکان جستجوبه زبان فارسی رو فراهم کردن . اما فقط 6200916 هستش که صفحه اصلیش رو هم ميشه فارسی کرد .

صفحه 21:
عملگرهای ۰۳۳ + و - و ۰608 تقریبا روی هر 6 موتور جستجو کار می کنن . عملگرهای |۰10۲ ‎site:‏ :۱6۲۷06 و 011016]: رو هر > موتور جستجو دارن ؛ اما ۲1اصاااد: و ۱۱:۳۴1616ه: که برای جستجوی چند کلمه تو آدرس و عنوان صفحه هستن . فقط توسط 6 پشتیبانی میشن . و6009 و ۵۸01 قابلیتجستجووینجلعداد رو داین بسه لین معنی‌که مثلابا جستجویعبارتوتبه هایبرتر کنکور ۰۹۰۰/۸۷ تمام عبارتهایرتبه هایسرتر کنکور ۰۸۷ رتبه های‌سرتر کنکور ۰۸۸ پتبه هایسرتر کنکور ‎۸٩‏ و رتبه هایس رتر کنکور ‎٩۰‏ جستجو میشن اصطلاحی داریم به اسم 516101010 . این قابلیت یعنی اینکه موتور جستجو وقتی یه کلمه بهش داده بتونه شکلهای دیگه اون کلمه از همون ريشه رو هم جستجو کنه . مثلاً اكه ما دويدن رو جستجو کنیم » خودش دونده رو هم جستجو کنه . 600016 و ۷۵۲۵۵ برای به سری از کلمات و افعال این قابلیت رو دارن .جستجو بر روی موضوعات مختلف مثل صفحات وب » عکس . ویدئو و اخبار روی هر > موتور جستجو امکان پذیره

صفحه 22:
اگه نگاهی به صفحه نمایش نتایج لین موتورها بندازيم . می بینیم که ۷3۵۵0 و #01 به غیر از لینک صفحات نتایج ‏ سایر جستجوهای انجام شده مرتبط با جستجوی ما رو هم نشون میده . 9 ساير جستجوهائينجام شده مرتبطبا جستجوىماء كلمه ها و عبارتهايوكه قبالاجستجو کردیم و لخبار مرتبط با جستجوىها رو نشون‌میده و در ضمنجازد میده که نتلیج جستجو رو به ۶ ساعنگذشته . هفته گذشته و یا ماد پیشر‌محود کنیم. 6 سایر جستجوهایلنجام سدد مرتبط با جستجوی‌ما لخبار » نقشه ۰ عکسها و میدئوهای مرتبط با جستجویما رو ن شون‌میده و در ضموجازد میده که نتایج جستجو رو از ۲۶ ساعت

صفحه 23:
موتورهای جستجوگر داخلی((ایرانی)) در کشور ما موتور جستجوی گوگل در ابتدای تمامی سایت هایی است که روزلنه توسط مردم ما باز می شود. این كد جتنتو كه كاها فعاليت هاى ضد ايرانى نيز انجام مى دهد يك موتور جسستعوى ‎ea‏ ‏اطلاعاتى بسيار كسترده اى دارد وهمجنين محبوبيت آن در دنيا بسيار زياد است. كوكل در حالى به عنوان پربازدیدتوین سایت توسط کاربران اییانی قرار دارد که تعداد بسیار زیادی موتور جستجوگر ملی در فضای نت وجود دارد. تا به حال تعدادی از موتورهای جسجوی فارسی کار خودشان را در فضای نت آغاز کرده اند که البته شاید به ندرت آن ها را دیده باشیم يا از آن ها استفاده کرده باشیم. این درحالی است که می توانیم از اين سايت ها برای جستجوهایی به زبان فارسی استفاده کنیم.

صفحه 24:
اسامی تعدادی از موتور های جستجو کر داخلی پایاب ۷۷۷۷۷۰ پارس ایند کس ismoon.com ‏پارسی جو‎ Wwww.parsijoo.ir ۷ ۷۷۷۷۷/۰25 جسجو .هواط salam. ‏۷۷فا یاب‎ ۷۷ ۷۸۷۰۲۵۱ 20

صفحه 25:
معرفی تعدادی از موتوهای جستجوگر ایرانی رتم دی م۳۲۱۵ در این سایت میتوانید به جستجوی وب | تصاویر | فیلمها | بپردازید و به جزء جستجو امکانات دیگری مانند سرگرمی کتابخانه و مترجم هم دارد که میتوانید در کنار جستجوی خود از آنها هم استفاده کنید. در قسمت دیکشنری و مترجم شما میتوانید از زبان های فارسی , انگلیسی . اسپانیایی . آلملنی » فرانسوی و ایتالیلیی استفاده کنید که همه لین زبان ها ۲ طرفه هست. همچنین میتوانید همزمان در صفحات یکی از این زبان ها جستجو کنید مثلا با تایپ کلمه سلام و گذاشتن تیک بر روی زبان آلمانی کلمه شما در صفحات آلمانی جستجو میشود. همچنین در این سایت قسمتی به نام تبدیل تاریخ وجود دارد که میتوانید تاریخ های میلادی شمسی و قمری را به یک دیگرتبدیل کند. جستجو در این سایت ساده بوده و بیشتر سعی شده سایت های ایرانی و فارسی در آن لیست شوند.

صفحه 26:
(TENE ‏اناف وال‎ amg این سایت نسبت به سایت قبلی کمی ساده تر است ولی تقریبا همان امکانات را دارد و میتوانید بین صفحات متنی و تصویری جستجو کنید.لین جستجوگر یکی از قدیمی ترین سایت های جستجو ایرلنی هست که از سال ۱۳۸۱ کار خود را شروع کرد نوع سیستم این سایت بر ‎Meta Search 2b‏ 6 میباشد و از بلنک اطلاعات دیگر جستجوگر ها مانند گوگل و یاهو استفاده میکند.پس یعنی اگر شما در اين سايت كلمه اى را سرج كنيد در واقع در جندين سایت جستجوی شما انجام میشود و جواب شما در لين سايت نملیش داده میشود.اما نکته قمتی که در لین سایت وجود دارد سفارشی سازی جستجو های فارسی است که به گفته خود سایت جستجو های فارسی بهتر نمایش داده میشود و نتایج بهتری دارند.همچنین در کنار این سایت قسمتی وجود دارد که سر تیتر اخبار رابه شما نشان میدهد » این سر تیتر ها از سایت های مختلفی جمع آوری شده لند که همانندن را میتوان در سمت چپ گهیا آیتی مشاهده کنید. سرتیتر ها به چند قسمت سیاسی . ورزشی » حوادث , علمی , اجتماعی و... تقسیم میشوند |

صفحه 27:
(CUES Teles ol cE aoa ‏این سایت از مهر ۱۳۸۳ کار خود را سروع کرده هست و نزدیک به یک سال هست که به صورت آزمایشی خدمات‎ ‏میدهد.اگه به این سایت بروید کلمه 878 را مشاهده میکنید که منظور از ن حللت آزمایشی هست و ممکن است‎ ‏هنگلم کار با آن به مشکلاتی برخورد کنید. پرویه ریسمون منحصرا بوسیله شرکت رادکام به اجرا در آمده هست.قابلیت‎ ‏های کلی لين سايت به نقل از خود لین سایت و حامیان ن (البته اکثر سایت های ایرلنی همچنین امکاناتی را ندارند و‎ ‏این یکی از اولین سایت هلیی هست که این چنین امکلناتی را دارد).نمایه سازی اسناد و پرونده هایی با قالبهای‎ ‏با پشتیبانی کامل از زبان‎ 0۳6۳ Office, Text RTF, Microsoft Office, PDF, HTML ‏فارسی,نمایه سازی محتویات فارسی بصورت جامع بطوریکه صفحاتی که با کاف و یای عربی تولید شده لند نیز به‎ ‏صورت فارسی نمایه سازی می شوند و در خروجی جستجو ظاهرمی گردند.نمایه سازی وب سایتهایی که با پروتکل‎ 551 امن شده اند و نمایه سازی اسناد و پرونده هایی که در ۴۲۴ سایت قراردارند و زمانبندی نمایه سازی مجدد.

صفحه 28:
بهره مندی از 3108۳9 برای نگهداری اسناد و صفحات نمایه سازی شده. دسته بندی وب سایتهایی که نملیه سازی می شند و امکان ارلئه خدمات جستجو بصورت یک وب سرویس به وب سایتهای تابعصه پورتالها درد.قابلیست اعتبارسنجی برای ورود به بخشهای اینترانتی که برای دسترسی به آنیها بسه گذرواژسه نیاز ت.پشتیبانی از ۷۷0۲015 560۴ برای مشخص کردن کلمات و یا عباراتی که لازم نیست در نتیجه جستجو ظاهر شوند. مانند حروف اضافه "و" ‎wa MAM OST‏ جستجوی منطقی بصورت ترکیب عطفی فصلی و یا نفی از منطق بولی.بهره مندی از جستجوی پیشرفته با قابلیههایی نظیر محدود کردن جستجو به موضوع مورد نظر و مشخص کردن کلمات یافت شده در نتيجه جستجو اجرای چند نسخه از برنامه نمایه سازی و عملکرد همزمان آنها برای تسریع در امر نمایه سازی. بهره مندی از روال رتبه بندی نتایج جستجو به طوریکه صفحات و اسناد با ار تباط بیشتر رتبه بالاتری در خروجی جستجو دارند. و دیگر امکاناتی مانند نمایش تعداد کل نتایج یافت شده . محاسبه و نمایش زمانی که صرف جستجو ده است و نمایش خلاصه صفحه و یا سند یافت شده در نتیجه جستجو

صفحه 29:
(www. fayab.ir)ob6 ‏فایاب یک سایت بسیار ساده هست که امکان اصلی لن فقط جستجو هست و یک امکان دیگر به نام‎ ‏پرتال خبری دارد که در آن اخبار روز جهان و ایران در تن قرار میگیرد كه برای ورد به آن از این آدرس‎ استفاده كنيد : ‎/http://news.fayab.com‏ یک نقطعه ضعف در لین سایت وجود دارد که آن لین است که نمیتوان در هنگام جستجو انتخاب کنیم که در چه زمینه ای جستجو کنید تصاویر یا متن ها. شما در جستجوبه صورت همزمان هم متن ها برایتان جستجو میشود و هم تصاویر که تصاویر در یک ستون در سمت راست برای شما نمایش داده میشود. همچنین تبلیغات در این سایت کمی زیاد هست که باعث میشه کاربران کمی اشتباه کنند. ولی در کل سرعت عمل این سایت هست.

صفحه 30:
يارسى ‎CD a‏ این موتور جستجو در سال ۱۳۸۷ برای اولین بار و با اطلاعات بسیار کم آغاز به کار کرد. تیم ۱۲ نفره ای از مهندسین برق و کامپیهتر دانشگاه یدبا لاش شبلنه روزی‌به ساخت لین موتور جستجو پوداختند که البته همچنان نیز در حال گسترش است و توقفی ندارد. لین روزها لین سایت دارای نسخه ۳.۲ است و نزدیک به ۱۲۰ میلیون صفحه فارسی را پوشش می دهد و همچنان نیز لين تيم در حال کار بر روی تثبیت کردن میزان صفحه های وب آن هستند . لین موتور جستجو به گون های است که به شما اجازه فعالیت های گسترده ای را می دهد. با ورودبه سایت پارسی جوبا محل سرج و گزینه های مختلفی روبرو می شهید که به شما اجازه سرج بين صفحات وب مطللب علمی ویا دانلودها راحی دهد شما می توانید به بخش سادانا مراجعه کنید که طیف گسترده ای از امکانات را در اختیار شما قرار میدهد. این بخش دارای امکاناتی از جمله قرّن؛ پرسش های علمی تعبیر خواب؛ ماشین حساب و ... است که باعث می شود بتوانید بسیاری از فعالیت های لازم روی نت را به راحتی انجام دهید.

صفحه 31:
جا ماسب ( ‎0.1١‏ 21135 [. لالالالالالا) يكى از موتورهاى جستجوى ايرلنى ديكوى كه شايد كفتن نامش نيز براى شما بسيار سخت باشد جاماسب است. لين موتور جستجو چندی پیش به طور رسمی کار خودش را شروع کرده است والبته صفحات زیادی را نیز در دنیای وب تحت پوشش خودش گرفته است. یکی از امکلنت بسیار خوب لین سایت سیستم نقشه آن است که در میان جستجوگرهای ایرلنی می تولند گفت که منحصر به فید است.در این نقشه تا الان نزدیک به ۱۰۳۰ شهر مختلف و همچنین ۵۳۰۰ روستا به طور کامل پوشش داده شده اند. لین نقشه همچنین راه های ارتباطی را بسیار دق جاده های فرعی را نیز در دل خودش جای داده است. نشان داده است و حتی نزدیک به نیمی از

صفحه 32:
نتیجه گیری کلی در استفاده از موتورهای جستجور داخلی يا خارجی؟ اساسابا وجود غولهائى نظير كوكل و بينكء جه نيازى به امثال يارسى جو است؟ براى ياسخ به اين سؤال كافيست نكاهى به تجربه ديكر كشورها در زمينه موتور جستجوى بومى داشته باشيم. هم اكنون؛ موتور جستجوى بايدو در جين در حدود ۸۰ درصد پرسشیهای مربوط جه موتور جستجو را پاسخ می‌دهد. در حالیکه سهم گوگل تنها ۱۸ درصد است. لین آمار برای موتور جستجوی یاندکس در روسیه و موتور جستجوی ناور در کره جنیبی چیزی نزدیک به ۷۰ درصد می‌باشد. حتی در کشورهای توسعه یافته‌ای نظیر ترکیه و جمهوری چک نیز موتورهای جستجوی بومی به سوعت مورد اقبال عمومی قرار گرفتهاند. دلایل عمده این اقبال شناخت بهتر زبان و فرهنگ کشور و ارائه خدمات متناسب با نیاز جامعه و از همه مهمتر.احساس غرور یک ملت در استفاده از فناوری داخلی می‌باشد.

صفحه 33:
نتیجه گیری وجمع بندی : موئورهای جستجو ابزارهای قدرتمندی هستند که به کاربران در جستجوی اطلاعات مورد نظر در میان آنبوه اطلاعات موجود در شبکه کمک می کند. آنچه تمام صفحات موجود در وب رابه هم پیوند میدهند همان لینکها هستند. موتورهای جستجوبه واسطه ی لینکها اسناد موجود بر روی وب را پیدا میکنند.بنابرلین اگر هیچ لینکی به یک صفحه وجود نداشته باشدبه لین معناست که در "حالت عادی "موتورهای جستجو آن صفحه را پیدا نخواهند کرد. بعد از اينکه موتورها صفحه ها را پیدا کردند وظیفه ی آنها این است که بخشهای منتخبی از صفحات را بر روی هارد دیسکهای خود ذخیره کنند تا وقتی نیاز بود مجدداً آنها را بازیابی کنند. دغدغه های دیگر موتورهای جستجو برای ‎Gol‏ که بتوانند در کسر کوچکی از ثانیه نتایج را از هارد دیسک خود بازیلبی کنند» پایگاه های دادهی بسیار بزرگ در شهرهای مختلفی از دنی ره اندازی کرده لند وبا تکنیک هایی اين اطلاعات را به صورت بهینه ذخیره سازی می کنند. تجهیزات وسیع ذخیره سازی اطلاعات» شامل هزاران ماشین پردازش اطلاعات هستند که بیوقفه حجم بسیار عظیمی از اطلاعات را پردازش میکنند.

صفحه 34:
فهرست منابع www.smcvt.edu www.irandevelopers.com www.searchtools.com/slides/sims/202

جهت مطالعه ادامه متن، فایل را دریافت نمایید.
12,000 تومان