صفحه 1:
Invisible/Deep/Dark Web
وبشامرثى/ ژرفا تاريك
هدايت الله دلاكى
صفحه 2:
rae ید رو Cenc —
دوب نامرتی»: نخستین بار در سال ۱۹۹۴
وب نامرتی؟ وب پنهان؟ وب عمیق؟ وب تاریک؟
اینها در حقیقت معادل یکدیگر نیستند و هر یک
به جنبهاى از نامرئى بودن اشاره میکنند.
hhdallaki@gmail.com
صفحه 3:
Deep Web (96% of
WWW content)
1
+ Surface Web (4%
of WWW content)
ses
صفحات اینترنتیای که ما به طور عادی میپینیم:
وب سطحی
افراد قبل از هر مرجع دیگری از وب برای
جستجوی تحقیقاتشان استفاده میکنند.
موتورهای جستجو Lap jl بهترین نتایج را نمایش
نمی دهند. آنها اطلاعات مخفی یا ژرف موجود
در اینترنت را نمایش نمی دهند.
hhdallaki@gmail.com
صفحه 4:
(Deep web) 3,3 os
مخزن عظیمی از اطلاعات که موتورهای جستجو به آنها دسترسی *
مستقیم ندارند.
خدمات پست الکترونیک +
بانکداری آنلاین +
پایگاه داده کتابخانههای دانشگاهها +
سایتهایی که برای مشاهده آنها نیاز به رمز عبور است +
سایتهایی که به هر دلیل, موتورهای جستجو از فهرستبندی +
آنهاء منع شدهاند.
مخفی ماندن وب ژرف منطقی به نظر میرسد.
hhdaliaki@gmail.com
صفحه 5:
وب ژرف و گوگل
اغلب مردم گوگل را بعنوان دارنده بزرگترین پایگاه داده جستجو
تصور میکنند که حدودا ۸ بیلیون صفحه را فهرست بندی کرده است.
yal رقم بزرگ است ولی اگر وب مخفی را در نظر بگیریم این رقم را ۹
بایستی در ۵۰۰ ضرب کنیم. (رقم دقیق صفحات غیر قابل جستجر ۳
خبری نیست.)
hhdaliaki@gmail.com
صفحه 6:
‘elon!
مسريو ملالا Catone ks Mopihat
اطلاعات موجود در وب ژرف بین ۴۰۰ تا ۰ ۵۵ برا - PNB 1% مدصي "ل
موجود در وب ژرف. بین پرابر wee? AS Lae
عفدم وب عمومی هستند که ما میبینیم
لوسك 1 اذ >
وب ژرف حاوی ۷۵۰۰ ترابایت اطلاعات است, در - cet
ترابایت ذخیره کرده است ۱٩ مقابل وب سطحی
0 5
- بیش از ۲۰۰ هزار وب سایت ژرف وجود دارند
- جالب است بدانید که بیش از نیمی از محتوای وب
ژرف در عنوان سایتهایشان Database aus j1
استفاده کرده اند و اگر این کلمه را در جستجوهایتان
بكار بريد امکان دسترسی تان را به اين سايتها
افزایش میدهید.
hhdallaki@gmail.com
صفحه 7:
دسترسی به آنچه که در لایههای پایین وب می گذرد زیاد ساده نیست. چرا که بیشتر ارتباط ها و خرید و فروش
های اصلی توسط لینک ارتباطی امن بین طرفین برقرار می شود.
وب سایت هایی هم هستند که عموم مردم را مورد هدف قرار میدهند. این وب سایتها بر روی سرورهای ۲08"
راهاندازی شده اند و از طریق مرورگرهای معمولی قابل دستیابی نیستند. آدرسدهی این وبسایتها اغلب
ONION p04 است که در 2115 های ۲0۵0۴ ثبت نشده و فقط بر روی سرورهای ۲008 تعریف شده است.
يكبار به كل مى كندء اغلب اين ويسايتها
همجنين 1٩لا آنهاء بسادگی به یاد سپردنی نیست و هرچند و
دارای صفحات سیاه رنگی حاوی چند متن مختصر هستند. یکی از مراجعی که اطلاعات دسته بندی شده این وب
سایتها را در اختیار کاربران میگذارد !۲۱۱06۳۷۷۱ است.
‘datlaki@gmait.com
صفحه 8:
نکته مهم- خطر برلی. تمرینکنند گلن.
حضور در دارک وب حتی برای کنجکاوی میتولند عواقب جبرانناپذیری برای فرد داشته باشد. لذا مطالبی را که
در این سمینار گفته میشود. صرفاً برای افزایش سطح معلومات خود مطللعه کنید و وسوسه ورود به این قسمت از
وب را برای هميشه از خود دور کنید. حداقل خطر احتمللی این است که مجرمان سایبری از کامپیوتر شما به
عنوان زامبی استفاده کنند و توسط کامپیوتر شما جرم های سنگین انجام بدهند و شما باید در پرابر قانون پاسخگو
باشید.
hdallakig@gmail.com
صفحه 9:
منظور از وب ژرف یا وب پنهان بخشی از شبکه جهان گستر وب است که منابع موجود در آن, خارج از حوزه جستجو و بازیبی
مقدماتی موتورهای جستجوی عمومی قراردارد و بازیابی اطلاعات موجود در این بخش از محیط وب. با استفاده و جستجوی
مستقیم از این موتورها میسر نیست. به عبارت دیگر امکان بازیابی منبع اطلاعاتی وب پنهان یا از نظر فنی برای موتورهای
جستجو مقدور نیست و یا آنها به دلیل محدودیتهای دیگر از دسترسی و ایندکس گذاری این منابع بازمانده اند.
pe
۳"
hdallakig@gmail.com
صفحه 10:
برخی از دلایل عدم دسترسی به وب ژرف يا پنهان
-١ نقاطى از وب هستند که به خاطر احتیاج به نام کاربری و رمز عبور امکان دسترسی به آنها وجود
ندارد.
۲- برخی اطلاعات در صورتی قابل مشاهده می گردند که خریداری شوند. این بخش که به وب
ملکی شهرت دارد نیز از دید موتورهای جستجوگر پنهان است.
۳- بخش دیگری از وب نامرثی, به مجموعهای از اطلاعات الکترونیکی پیوسته اطلاق میشود که آنها
معمولا خارج از حوزه جستجوی موتورهای جستجوگر قرار دارند هریک از این پایگاهها صفحه
جستجوی مبتنی بر وب دارند. که امکان جستجو در آنها برای کاربران را فراهم میکند. اما
خزنده های موتورهای جستجو توان ورود به آنها را ندارند و در نتیجه حجم انبوهی از اطلاعات.
نمایه نشده باقی میماند.
۴- منابع اطلاعاتی غیرمتنی نیز جزء وب پنهان بشمار میروند چون موتورهای جستجوگر برای
ایند کس.گذاری ol pb Hypertext pio wl auld شده اند درحالیکه بسیاری از منابع موجود
در وب در قالبهای دیگر و معمولا غیرمتنی (تصویر. منابع دیداری شنیداری و ...) ظاهر می
شوند و امکان ایندکس گذاری آنها در موتورهای جستجوگر وجود ندارد.
۵- با توجه به استفاده اغلب موتورهای جستجوگر از الگوریتم عنکبوتی, در صورتی که صفحه وبی به
هیچ جا متصل نشده باشد. دسترسی به آن از طریق موتورهای جستجو غیرممکن است.
hhdallaki@gmail.com
صفحه 11:
اهميت وب زرف
به دو دليل مىتوان كفت كه وب ينهان اهميت دارد. نخست از نظر كمى بايد كفت كه حجم اطلاعات
موجود در اين بخش خيلى بيشتر از سطح آشكار است.
بهترين موتورهاى جستجو فقط قادر هستند كه حدود ع١ درصد از اطلاعات موجود در وب را
بازیابی کنند و بنابراین ۸۴ درصد آنها جزء وب پنهان به حساب میا یند.
دیپ وب از نظر دادهها بسیار غنیتر از وب معمولی یا وبی است که ما میشناسیم. میتوان گفت که
كل وب یک کوه یخی است که دیپ وب قسمتی از آن است که در زیر آبها پنهان و قسمت دیگر که
در سطح آب نمایان است همان وبی است که ایندکس شده است.
و از منظر کیفی باید گفت:
اطلاعات بخشهای مختلف این مجموعه به ویژّه منابع اطلاعاتی موجود در وب ژرف. معمولاً منابع
آرزشمند و مفیدی هستند و در بسیاری از موارد پاسخگوی نیاز کاربران میباشند. تقریبا بیش از
نیمی از وب نامرثی را پایگاه های اطلاعاتی موضوعی تشکیل میدهند.
hdaliakigomall.com
صفحه 12:
نمونهای از اعمال غير قانونى در وب زرف
از آنجایی که وب ژرف از دید بسیاری پنهان است. مکان خوبی برای کارهای مشکوک به حساب
میآید و بسیاری از مجرمان اینترنتی در فورومهایی با دسترسی محدود گرد هم میآیند.
شاید وقتی صحبت از بخش تاریک اینترنت به میان بیاید. چیزهایی از قبیل خرید دارو بدون نسخه
هایی | به ذهن ما اما وب ژرف بسیار بسیار فراتر از اینهاست.
تجارت اسلحه. خرید و فروش مواد مخدر. قاتلین اجارهای و تروریسم بخشی از محتوای ناخوشایند
وب ژرف محسوب میشوند که آنرا به بزرگترین بازار سیاه موجود تبدیل کردهاند.
که در آنها کارتهای اعتباری دزدی و مواد مخدر
در وب ژرف میتوانید سایتهایی را
بهراحتی بفروش میرسند.
hdallakig@gmail.com
صفحه 13:
بخشهای مختلف وب نامرتی
۱- وب مات يا تاریک ۷۷/6۵ 00206
بخشی از فضای وب نامرثی به وب مات موسوم گردیده که میتوانسته مورد استفاده کاربران قرار
گیرد. اما به دلايل زير اين اطلاعات در خارج از دسترس کاربران قرار گرفته و موتورهای کاوش
نمیتوانند آنها را بازيابى BES
- از آنجا كه اولاً محيط وب دائماً در تغيير است و هر روز منابع و اطلاعات جديد به OT افزوده
مى كردد و ثانياً صفحاتى در وب وجود دارند كه هيج بيوندى بين آنها با منابع ديكر برقرار نشده.
خزندههای موتورهای جستجو قادر به يافتن اين صفحات و همكام نمودن خود با اين حجم عظيم
اطلاعات نيستند.
- به دليل محدوديت توانايى. نرمافزارهاى خزنده فرصت كافى براى روزآمدسازى صفحات جديد
وب را ندارند. موتورهای کاوش نیز امکان روزآمدسازی حجم عظیمی از اطلاعات و منابع جدید را
ندارند و به همین دلیل بسیاری از این اطلاعات از حوزه موتورهای کاوش دور میمانند .
- محدودیت توان مالی بسیاری از موتورهای کاوش سبب گردیده که موتورهای کاوش نتوانند تمام
صفحات وب سایتها را نمایهسازی کنند. چرا که برای آنها هزینههای زیادی دارد و بنابراین
موتورهای کاوش بنا بر سیاستهای خودشان, تنها بخشی از وب سایتها یا لایههای بیرونی آنها را
نمایهسازی میکنند. بنابراین هميشه بخش عظیم لایههای درونی وب سایتها پنهان میمانند.
hhdallaki@gmail.com
صفحه 14:
بخشهای مختلف وب نامرتی
۳- وب عمیق
بخش دیگری از وب نامرئی, به مجموعهای از اطلاعات الکترونیکی پیوسته اطلاق میشود که بسیاری
از پایگاههای اطلاعرسانی. آنها را از طریق شبکه جهان گستر وب در دسترس عموم قرار دادهاند.
برخی این اطلاعات را به رایگان. و برخی دیگر را با دریافت هزینه در دسترس عموم قرار میدهند.
مندرجات این پایگاهها معمولاً خارج از حوزه جستجوی موتورهای کاوش قرار دارند هریک از اين
پایگاهها صفحه جستجوی مبتنی بر وب دارند. که امکان جستجو در آنها برای کاربران را فراهم
میکند. اما خزندههای موتورهای جستجو توان ورود به آنها را ندارند و در نتیجه حجم انبوهی از
اطلاعات, نمایه نشده باقی میماند. به عنوان نمونه اگر یک متخصص موضوعی (مثلاً یک دانشجوی
شته پزشکی) بخواهد خود را به موتورهای کاوش معمولی محدود کند و نتواند به پایگاههای
اطلاعاتی تخصصی مراجعه نماید یا از وجود آنها آگاه نباشد. از دسترسی به حجم انبوهی از
اطلاعات محروم خواهد ماند. بنابراین کاربر باید در این موارد از طریق موتورهای جستجو
پایگاههای مرتبط با موضوع خود را شناسایی کند و سپس. جداگانه به جستجو در آنها بپردازد تا از
دسترسی به وب عمیق باز نماند.
hhdallaki@gmail.com
صفحه 15:
بخشهای مختلف وب نامرتی
۳ - وب خصوصی ۷۷۵ ۳۲۱۷۵۲6)) و (Proprietary Web ,Ste uy
بخشی دیگر از وب نامرثی وجود دارد که چون اطلاعات موجود در آن جزو داراییهای شخصی یا
خصوصی سازمانها یا افراد میباشد. از حوزه دسترسی موتورهای جستجو پنهان است. مثلاً در برخی
از سازمانها و موسسات خصوصی یا دولتی. به دلایل امنیتی از اطلاعات مربوط به مسائل کاری و
سازمانی و پرسنلی خود حفاظت میکنند اجازه دسترسی به آنها را به دیگران نمیدهند و فقط
کسانی که دارای اسم کاربر و گذرواژه هستند میتوانند از آنها استفاده کنند؛ این بخش, وب
خصوصی محسوب میگردد . بخش دیگر. منابع اطلاعاتی از قبیل نشریات الکترونیکی مبتنی بر وب
میباشند که دسترسی به آنها از طریق پرداخت حق اشتراک و خرید محصولات اطلاعاتی
شرکتهای مختلف صورت میگیرد «وب ملکی» نامیده میشود.
hdaliakigomall.com
صفحه 16:
بخشهای مختلف وب نامرتی
۴ - وب واقعا پنهان ۷۷6۵ ۱۳۷510۱6 ۲۳۵۱۷))
بخش دیگری از وب پنهان وجود دارد که بنا به مسائل فنی و ناکارآمدی ابزارهای جستجو. از
دسترسی کاربران دورمانده است. بسیاری از موتورهای جستجو قادر به بازیابی اطلاعات متنی
اچتیامال هستند. ولی توانایی بازیابی فایلهای پیدیاف را ندارند. یا به دلیل کمبود منابع مالی و فنی
از جستجوی فایلهای غیرمتنی صرفنظر کردهاند. بنابراین منابع اطلاعاتی متنوعی نیز در وب وجود
دارند که تنها به دلیل محدودیتهای فناورانه یا مالی موتورهای جست وجو؛ از حوزه کاوش آنها و
در نتیجه از دسترس کاربران دور ماندهاند.
hdaliakigomall.com
صفحه 17:
شیوههای کسب اطلاعات در وب نامرتی
در حال حاضر ابزارهایی به وجود آمدهاند که منابع وب نامرئی را شناسایی, و کاربران را به
سایتهای مناسب راهنمایی میکنند. این رویکرد توسط بزرگراههای اطلاعاتی و کتابخانههای
مجازی شده است؛ بطوری که فقط توصیفی از پایگاههای اطلاعاتی و مجلات نامرثی را ارائه
میکنند؛ مثل سایت: ۷۷610 ۱۷15[016» که فهرستی از منابع نامرثی و سایت 60۳0۴۵۱66
61 که فهرستی از تقریباً ۴۰۰۰۰ پایگاه اطلاعاتی وب نامرثی را ارائه میدهند.
برخی دیگر از ابزارهای اطلاعیابی نیز وجود دارند که با یک جستجو در اینترنت میتوانید به آنها
دسترسی داشته باشید.
/https://osintframework.com :Jlte wlsic 4)
hdaliakigomall.com
صفحه 18:
افزایش روز افزون منابع اطلاعاتی در اینترنت و مشکلات فنی و غیرفنی موتورهای کاوش باعث
گردیده که حجم زیادی از این اطلاعات از دید کاربران پنهان بماند و به عنوان وب نامرثی مورد
بحث بسیاری از متخصصان اطلاعرسانی قرار گیرد. همانطوری که میدانیم امروزه گرایش بسیاری از
کتابخانهها و مراکز اطلاعرسانی و محققان به سوی دیجیتللی كردن متليع و قراردادن آنها در محیط
اینترنت میباشد. چنانچه دسترسی مطلوب به منابع ذخیرهشده در اینترنت وجود نداشته باشد
بسیاری از میراثهای علمی. پژوهشی. فکری و فرهنگی بشر به هیچ وجه مورد استفاده حال و
آینده قرار نخواهد گرفت. در این میان کتابداران و اطلاعرسانان نیز با آ گاهکردن کاربران از وجود
وب نامرئی و شیوههای دستیابی و اطلاعیابی کاربران از این اطلاعات میتوانند نقش مهمی را در
کاستن سطح نامرثی اطلاعات بر عهده بگیرند.
البتهباید یا آور شد که به دلیل پژوهشها و پیشرفتهای اخیر در حوزه بازیابی اطلاعات چه در بعد
فنی و چه از نظر رویکرد کاربرمدار. آینده رو بيش بينى
میشود . به طور کلی پیشبینی میشود که با پیشرفت ابزارهای بازیابی اطلاعات در وب و بهبود سواد
اطلاعاتی کاربران, به تدریج از سطح ناپیدایی اطلاعات در محیط وب کاسته شود.
اتری در بازیابی اطلاعات در محیط وب
hhdallaki@gmail.com
صفحه 19:
در پایان
لازم به توضیح است که دیپ وب مقدار محتوای بسیاری نیز دارد که به هیچ وجه جالب توجه نیست
و یک دلیل ایندکس نشدن این محتواها نیز همین امر است.
حتوایی که عمدا روی دیپ وب قرار داده شده می تواند فوق العاده جالب توجه باشد.
فرومهای انفورماتیک بسیار پیشرفته و همینطور سایتهای مشتاقان دستکاریها و ساخت و ساز از هر
نوع نظير امواج راديوثى و اسناد بسیار حساس بعضی دولتها روی دیپ وب هستند.
لازم است توضیح داده شود كه با اينهمه بايد محتاط بود و هر محتوائى را كه روى ديب وب يافت مى
شود نبايد دائلود كرد جراكه مى توانند بسيار دروغين و خطرناك باشند.
روى وب زرف همانقدر كه ميتوان محتواى فوق العاده جالب يافت همانقدر هم محتواى غير قانونى
وجود دارد که دسترسی به آنها میتواند باعث دردسر شود. علاوه بر اين ديب وب خالى از خطر
انواع ویروس و آلودگی نیست.
مطالعه بیشتر: ۳۲۲۵6://۵۱9051-1۲.60۳0
hdaliakigomall.com