کامپیوتر و IT و اینترنتعلوم مهندسی

حاشیه نویسی وب معنایی

صفحه 1:
(Coes OCs rte eaten gg Technology ۳ ‏ا ل‎ Semantic Web Annotation سيد امير شيخ 010 ‎RTA‏ ‎sheickahmadi@ce.sharif.edu‏ استاد راهنما: دكتر ابوالحستى استاد مشاور: د كثر قدسى

صفحه 2:
—— لكات الاك سس نتنده 2. تعاریف حاشیه نویسی 3 بررسی روش های حاشیه نویسی رس تب روش نیمه اتوماتیک روش اتوماتيىك 7 جمع بندى روش هاى موجود 5. ايده هاى ما براى حل مساله 8 فهرست منابع 00

صفحه 3:
= موضوعات بررسی شده — ‎YI‏ مسلة 2. تعاریف حاشیه نویسی 3 بررسی روش های حاشیه نویسی رس تب ‎ED)‏ ات روش اتوماتيىك اا ا ا ا اك 5. ايده هاى ما براى حل مساله فهرست منابع ‎a ‎ ‎ ‎00 denier ‎ ‎ ‎

صفحه 4:
5 تعریف مسئله حجم زیاد اطلاعات روی وب * جستجوی امناسب » عدم تبادل اطلاعات توسط عامل ها ۴ وب معنایی: افزودن متاداده به وب فعلی نحوه درج متا داده ها؟ 2

صفحه 5:
ا نتولوزى: ‎rd‏ 2 Ps ‏ا‎ و ‎Joly)"‏ ‏" خصوصيات " نمونه ها 00 denier

صفحه 6:

صفحه 7:
= موضوعات بررسی شده ‎I‏ ار ‎Cee) bey‏ 0 3 بررسی روش های حاشیه نویسی رس تب روش نیمه اتوماتیک روش اتوماتيىك 4. جمع بندى روش هاى موجود ‎sly bb sla ox! 5‏ حل مساله 8 فهرست منابع 00

صفحه 8:
= تعاریف حاشیه نویسی ‎i‏ ‎‘Merriam-Webster ®‏ ‎BIE eee ae ae eee‏ ‎‘HCI ®‏ "" يك 2111101811011 به شكل توضيحى روى يكك"شى كه حاشيه 2 ری مجزا باشدءبررسی می شود. ۳ ده ۱ با ساختار های معنایی درون صفحه های وب با سرورهای خاص می باشد. ‎a‏ حاشیهنویسی وب معنایی ‎ ‎ ‎

صفحه 9:
ار | لت ۳ ۴ تعریف نوع و خصوصیات تابع ا ل ‎SN en etree i‏ ل ‎CS SS‏ ا ل اك 00 denier

صفحه 10:
= موضوعات بررسى زر 2. تعاربف حاشیه نویسی ‎bas Guy 3‏ ما ‎LEI)‏ ‏روش نیمه اتوماتیک روش اتوماتيىك 4. جمع بندى روش هاى موجود ‎sly bb sla ox! 5‏ حل مساله 8 فهرست منابع 00 لم

صفحه 11:

صفحه 12:
> ابزارهاى حاشيه نويسى دستى ‎aa‏ 1 ا ا ال ا و۱ فقط پشتیبانی از اسناد ساختاريافته ۰پ ا ل قبيل -1/1.6610/11 111 حاشیه ا ا م حاشیه نویسیها در پایگاه داده های عمومی ‎٩10۳‏ ذخیره می شوند.(سرورها) ا ا 0 Osh solo (sci ‏ب+صسصصس«سس_-«‎ ‎) ‏از سرورهای متعدد برای حاشیه نویسی استفاده می نماید.(برای مقیاس پذیری‎ ee

صفحه 13:
aa ‏ابزارهاى حاشيه نويسى دستى‎ aa Annotea(f-; \) و ل 10 " 1-1111 :بيوند متحتوا به يدنة حاشيه نويسى ‎GET and POST the metadata :HTTP ®‏ 00 denier

صفحه 14:
[۳ sy Browser/Editor Annotation Servers 1 Document XDoc Thisis a document with ‘annotations. This is @ document with annotations, List stem a iternb| tate annotations ۳ ‏د‎ ‎1 116 tet ofthis document POSTRDF > does mot make much sense 2 btaybe these tems could be explained in more detail?

صفحه 15:
Topics: y Communication: 1 Whale songs: see this > Cognition: aa local __ =a a ‏ححه‎ user interface HTTP Annotea|) ( Server ) RDF store

صفحه 16:
aa ‏ابزارهاى حاشيه نويسى دستى‎ aa ‎weedy‏ 16 جد ‎eae 5‏ استفاذه از ابزارهائى استخراج متن ‏" مبتنى بر آنتولوى مشخصى نمى باشد.كه اين به نوه خود امكان ا ‎PU peel preter wee‏ ‏*اگر کاریر یک سند حاشیه نویسی را ویرایش ‎py cor oe ere ar oo] am, G OO) EN Kc) RULE‏ اشتباه اشاره نماید .بنابراین می تواند ۸۵011201811011 گمراه ‏کننده شود.(تا حدودی جبران شده است.) ‎ ‎00 ‎ ‎ ‎ ‎

صفحه 17:
aa ‏ابزارهاى حاشيه نويسى دستى‎ aa Semantic Word(,-7) محيطى براى تاليف اسناد متنى مبتتى بر ([1/70015 1/15 فى باشد كه هدفش کاهش بار تالیف حاشیه نویسیهای معثایی می باشد. دامنه كاربرد 1/7010 56112213]:10 در موارد زير مناشب تر است: " سندى كه مى خواهد تاليف شود به موضوعات كم ترى محدود ل زا موضوعات باشد .مناسب می باشد. "" درجه بالاى از استفاده مجدد از محتوا هست.امكان استفاده حاشيه نویسیها در محتوا می باشد. ‎wv‏ ویو سای ‎ ‎ ‎

صفحه 18:
بسی دستی حاشيه نوي اك

صفحه 19:
aa ‏ابزارهاى حاشيه نويسى دستى‎ aa SemanticWord ‎ol eID e)‏ م ‎Oa ee enon OLY el cei asl Tee a ‏زیادی برای تالیف توصیفات معنایی می شود‌ندارد.‎ ‏ا ا ا 0 ‏استخراج اطلاعات الككوهاى حاشيه نويسى ‏۳ 99۱۱ ل الل ۱3200۱۰۳۱۱۵ ‏01 حاشیه ا ‎1۳ ip een antes. pry ‏ا‎ 6 a =10 poy a1 ‎ ‎ ‏0 ویو سای ‎ ‎ ‎

صفحه 20:
aa ‏ابزارهاى حاشيه نويسى دستى‎ aa ) (9 هدف 16610/) ایجاد ابزاری برای ایجاد متاداده به صورت راحت و موثرمی باشد. 1 از روش‌حاشیه نویسی‌مبتنی‌بسر آنتولوژی‌لستفاده می ‎Lh‏ يكك ويزْكَى به خصوص 2162112) ايجاد متا داده رابطه اى است كه امكان ايجاد بيوند بين حاشيه نويسى ها را نيز فراهم مى نمايد. 00 denier 3

صفحه 21:
> ابزارهاى حاشيه نويسى دستى ‎aa‏ 2 ‏ات‎ eh eee ‏و رو و‎ (۱۱۱۵۵ ® Sol Op oly Dear em pom puree 0 ‏ل‎ (0) oii ‏را موثهد‎ ۳ ویو سای

صفحه 22:
| با سا 5۲ ی " ميزان آشنايى حاشيه تؤيس با دامنه ‎sas‏ ا ل 0 * حاشیه نویسی دستی یک پروسه گران می باشد ‎PU Cary OU tar Cone yer i Ie‏ از منابع داده ءنبازمند آنتولوزيهاى جندكانه»مى تواند براى يسّتيبانى كاربران متفاوت مفيد 0 ‏۴ حاشيه نويسى دستى حجم اسناد موجود روى وب مى باشد. ‎ ‎ ‎ee ‎ ‎ ‎

صفحه 23:
دا ‎Oe keeles‏ ات ۳5 آتزار حاشیه دوفن استخراج ‎Ea‏ 0 اطلاعات ۳ شده 00 denier

صفحه 24:
Sab gla ‏حاشیه نویسی‎ .. "-[ ۱ تشخص اتوماتیک و کلاس بندی تمام موجودیتهای درون اسناد با دقت کامل وجود ندارد. eC ‏ا‎ ec iere rene oor . ‏نویسی نیاز دارند‎ ۱ err ee en eee ese sr Eats Sie ‏ا‎ ‏برای حاشیه نویسی یکك سند می باشد.‎ ۳ در حاشیه نویسی های نیمه اتوماتیک ما می خواهيم نقش فرد.را از حاشیه نویس به ناظر تغییردهیم. 00

صفحه 25:
حاشیه نویسی نیمه اتوماتیک Application ‘Upper Interfaces | ‘Document Donaaia Oatelozy & Annotations Knowledgebase ee etka eed oe

صفحه 26:
حاشیه نویسی نیمه اتوماتیکک ری را ل ار Multistrategy pe ‏يي‎ Pattern-based Machine Learning-based مر %“ Discovery Rules Probabilistic Induction -Seed ~JAPE* -Hidden Linguistic expansion Taxonomy Markov Structural Models label matching -N-gram analysis

صفحه 27:
Sab gla ‏حاشیه نویسی‎ .. "-[ 9 ‎CCRT ial‏ ا ا ل ا 0 ‎comer mentee Syd‏ 0 ‎D5)‏ ‏ا ۱ ۲-در حالی که کاربر به خاشیه نویسی دومی می پردازد اولی به سیستم "1 برای یادگیری فرستاده می شود. ۳-تگ های اضافه شده را بر داشته وخود شروع به حاشیه : ‎(Qf gan EN‏ ‎Fe 8‏ ا ل م ۵-در این هنگام به کاربر گفته می شود که به حالت ناظر برود و اسناد به شکل ‎ede‏ 0 ۳ ویو سای

صفحه 28:
۳.1 حاشیه نویسی نیمه اتوماتیکی ‏ سح ‎Ara‏ SE Ie ene eon eed mee ae me oe ee ee ۱ ‏لاوا‎ Be Cee teary ese rede Pa Ca Cpr We ۱۳ ‏ابزار فراهم كردن محيطى براى‎ 0 eet eel lO IO ae caer eS) ا ا ۳ 7 ویو سای

صفحه 29:
Me Sls oop ‏ارات‎ 5 تال بر وب ‎ANY EY‏ 0 ممرور صفحه و انتخاب آنتولوژی 1 :انتخاب قسمت دلخواه و مرتبط كردن با آنتولوزى 163111 :اجراى الكوريتم يادكيرى براى آموزش استخراج قوانين ‎itagging , correction‏ " قانون 12601120 :مشخص نمودن قسمتهايى كه بايد حاشية نويسى شوئد. * قوانین درستی: کاهش درجه خطا ۴ 1 می توان با مقایسه قوانین ایجاد شده با صفحات حاشیه نویسی ‎peed NOE A CS ee ree ened‏ را تین نماید. 000۵ : قوانین برای استخراج اتوماتیک و حاشیه نویسی صفحات وب استفاده می شود. 00

صفحه 30:
8 دای ساره تريسى نيد اتوماتيكك ۹ 110 1 2 انلكا ‎jpiManagement)‏ ‏يت ‏* ذخیره و بازیابی معنایی اطلاعات رت "ا نكهدارى مجزاى اسناد,متاداده ها و انتوريّها و 961006 نایب لو زار ۴ 6216 00

صفحه 31:
a ۳ PANKOW: C-PANKOW: ‏لهسم‎ 5200000 00 denier

صفحه 32:
— Ul ‏حر‎ ای 6 ورهار ری روز ر 929 ‎Wee) DANIO yy‏ elecrey ent csc te> eee Sea ۴ استفاده از وب به عنوان منبع داده که این مسئله مشکل پرا کند گی داده را حل می نماید. ۴ میتنی بر الگو purer اتوماتیک نمودن حاشیه نویسی حاشیه نویسی نیمه اتوماتیک نتیجه بهتری را می دهد.

صفحه 33:
حاشیه نویسی اتوماتیکک NINDS Oeste 40h

صفحه 34:
= موضوعات بررسی شده 2. تعاريف حاشيه نويسى 3 بررسی روش های حاشیه نویسی رس تب روش نیمه اتوماتیک روش اتوماتيىك 7 ا ل ا لل 5 ايده هاى ما براق حل مساله 8 فهرست منابع 00 لم

صفحه 35:
Fe ‏اه‎ استفاده از استفاده يادكيري از قوانين ‎ei | pul‏ DAML+O1L Rule AeroDAML[14] Pattern Discovery ‘KIMO (RDFS) 5 , / KIM ‘RDF DAML+O1, L owL Armadillo[8} Vara Ont-O-Mat 2 Amilcare[10] Pattern ‘Ont-O-Mat Discovery PANKOW Rule SemTagI6} ‘Melita AmileCare Semantic word[23] Ey 0 117 2 ‏ل‎ 71

صفحه 36:
= موضوعات بررسی شده 2. تعاريف حاشيه نويسى 3 بررسی روش های حاشیه نویسی رس تب روش نیمه اتوماتیک روش اتوماتيىك 4. جمع بندى روش هاى موجود ‎oils | 5‏ دا دا( ‏8 فهرست منابع ‎ ‎00 ‏لم ‎ ‎ ‎ ‎

صفحه 37:
مي لوان اذ ‎ee‏ استفاده نمو ١-محاسبه‏ شباهت مفاهيم صفحه با 523000000 برس و جو از موتور جستجوى ا يكت ‎OntoSearch‏ شباهت (eel | dere tall (OntoEdit sit)o95 ‏روابط جدید و غنی سازی آن وجوک»‎ 00

صفحه 38:
م ل 6

صفحه 39:
"! معيارهاى استاندارد براى ارزيابى مدل هاى حاشيه نويسى : ۰ (0 ‏ی‎ ‎۱۳299 ‏ب‎ ‎© ‏آله‎ ‎ae accurat ‏لت‎ ‎2 6-1۱ ae ee accifrate+inaccur ate 2 5 تمام حاشیه نویسی هایی است که توسط فرد ایجاد می شود. 6 حاشیه نویس‌ها درستن وسطسیستم 9 ۳ ی = معیارهای ارزیابی مدل —

صفحه 40:
۳ ieee ra ا ا ‎EVE‏ كه " ارائه مدلى براى انتخاب آنتولوى مناسب ه.اماه * انتخاب مدلی مناسب برای استخراج اطلاعات با باد گیری ۵ ماه * پیاده سازی مدل ۲ ماه و ه.اماه ب ۱ ماه 00 00 denier 7

صفحه 41:
[1]Cimiano, P., Handschuh, S., & Staab, S: (2004). Towards the Self- Annotating Web. Thirteenth International Conference on World Wide Web, New York, NY, USA, 462-471 [21S. Handschuh, S. Staab, and F. Ciravegna. S-CREAM — Semi-automatic CREAtion of Metadata.In EKAW02, 13th International Conference on Knowledge Engineering and Knowledge Management,LNCS/LNAI 2473, pages 358-372, Sig’uenza, Spain, October 2002. Springer. [3] S. Handschuh, $. Staab, and A. Maedche. CREAM — Creating relational metadata with a 0 annotation framework. In Proceedings of K-Cap 2001, pages 76-83. ACM Press,2001. ICU eel TPR VON Cootatist Wa OM aeTTe sCoonrtnrLcr TT amcNTTs Mc OmShig ola Untstelrer EY Open RDF Infrastructure for Shared Web Annotations. In Proceedings of the Tenth International World Wide Web Conference, WWW10, Hong Kong, China, May 1-5, 2001, pages 623-632. ACM Press, 2001. [5]N. Kushmerick. Wrapper Induction: Efficiency and Expressiveness. __ Artificial Intelligence, 118(1-2):15-68, 2000. ۰ [6] M. Vargas-Vera, E. Motta, J. Domingue, M. Lanzoni, A, Stutt, and F. Ciravegna. MnM: Ontology Driven Semi-Automatic and Automatic Support for Semantic Markup. In EKAW02, 13th International Conference on Knowledge Engineering and Knowledge Management, LNCS/LNAI 2473, pages 379-391,Sig uenza, Spain, October 2002. Settee [7] Dill, S., Eiron, N., Gibson, D., Gruhl, D., Guha, R., & Jhingran, A. et al. (2003). SemTag and Seeker: Bootstrapping the Semantic Web via Automated Semantic Annotation. Twelfth International World Wide Web ‏لوقه د11 رأكعم03نا8 ,معطم عجرو‎ 176-166

صفحه 42:
mm = [8] Siegfried Handschuh, Steffen Staab, and Raphael Volz. On deep annotation. In Proceeding of the WWW2003 - The Twelfth International World Wide Web Conferenceb (to appear), Budapest, HUNGARY, May 2003. [9] Dingli, A., Ciravegna, F., & Wilks, Y. (2003). Automatic Semantic Annotation using Unsupervised Information Extraction and Integration. Proceedings of the Workshop on Knowledge Markup and Semantic Annotation at the Second International Conference on Knowledge Capture (K-CAP 2003), Florida, USA. [10] Erdmann, A. Maedche, H.-P. Schnurr, and S. Staab. From Manual to Semi-automatic Semantic Annotation:About _ Ontology-based Text Annotation Tools. In P. Buitelaar & K. Hasida (eds). Proceedings of the COLING 2000Workshop on Semantic Annotation and Intelligent Content, Luxembourg, August 2000. [11 Fabio Ciravegna and Yorick Wilks. ‏ی‎ Adaptive Information Extraction for the Semantic Web in Amilcare. Annotation for semantic web, 2003. [12]P. Cross, L. Miller, and S. Palmer. Using RDF to Annotate the (Semantic)Web. In K-Cap Workshop on Knowledge Markup and Semantic Annotation, Victoria,B.C.,Canada, October 2001. 3 ویو سای

صفحه 43:

51,000 تومان