صفحه 1:
(Coes OCs rte eaten gg
Technology
۳ ا ل
Semantic Web Annotation
سيد امير شيخ 010 RTA
sheickahmadi@ce.sharif.edu
استاد راهنما: دكتر ابوالحستى استاد مشاور: د كثر قدسى
صفحه 2:
—— لكات الاك سس
نتنده
2. تعاریف حاشیه نویسی
3 بررسی روش های حاشیه نویسی
رس تب
روش نیمه اتوماتیک
روش اتوماتيىك
7 جمع بندى روش هاى موجود
5. ايده هاى ما براى حل مساله
8 فهرست منابع
00
صفحه 3:
= موضوعات بررسی شده —
YI مسلة
2. تعاریف حاشیه نویسی
3 بررسی روش های حاشیه نویسی
رس تب
ED) ات
روش اتوماتيىك
اا ا ا ا اك
5. ايده هاى ما براى حل مساله
فهرست منابع
a
00 denier
صفحه 4:
5 تعریف مسئله
حجم زیاد اطلاعات روی وب
* جستجوی امناسب » عدم تبادل اطلاعات توسط عامل ها
۴ وب معنایی: افزودن متاداده به وب فعلی
نحوه درج متا داده ها؟
2
صفحه 5:
ا
نتولوزى:
rd 2
Ps ا
و
Joly)"
" خصوصيات
" نمونه ها
00 denier
صفحه 6:
صفحه 7:
= موضوعات بررسی شده I
ار Cee) bey 0
3 بررسی روش های حاشیه نویسی
رس تب
روش نیمه اتوماتیک
روش اتوماتيىك
4. جمع بندى روش هاى موجود
sly bb sla ox! 5 حل مساله
8 فهرست منابع
00
صفحه 8:
= تعاریف حاشیه نویسی i
‘Merriam-Webster ®
BIE eee ae ae eee
‘HCI ®
"" يك 2111101811011 به شكل توضيحى روى يكك"شى كه حاشيه
2 ری مجزا باشدءبررسی می شود.
۳ ده ۱
با ساختار های معنایی درون صفحه های وب با سرورهای خاص می باشد.
a حاشیهنویسی وب معنایی
صفحه 9:
ار
| لت
۳
۴ تعریف نوع و خصوصیات تابع
ا ل
SN en etree i ل
CS SS ا ل اك
00 denier
صفحه 10:
= موضوعات بررسى زر
2. تعاربف حاشیه نویسی
bas Guy 3 ما
LEI)
روش نیمه اتوماتیک
روش اتوماتيىك
4. جمع بندى روش هاى موجود
sly bb sla ox! 5 حل مساله
8 فهرست منابع
00
لم
صفحه 11:
صفحه 12:
> ابزارهاى حاشيه نويسى دستى aa
1
ا ا ال ا
و۱
فقط پشتیبانی از اسناد ساختاريافته
۰پ ا ل
قبيل -1/1.6610/11 111
حاشیه ا ا م
حاشیه نویسیها در پایگاه داده های عمومی ٩10۳ ذخیره می شوند.(سرورها)
ا ا 0
Osh solo (sci
ب+صسصصس«سس_-«
) از سرورهای متعدد برای حاشیه نویسی استفاده می نماید.(برای مقیاس پذیری
ee
صفحه 13:
aa ابزارهاى حاشيه نويسى دستى aa
Annotea(f-; \)
و
ل 10
" 1-1111 :بيوند متحتوا به يدنة حاشيه نويسى
GET and POST the metadata :HTTP ®
00 denier
صفحه 14:
[۳ sy
Browser/Editor Annotation Servers
1 Document XDoc
Thisis a document with
‘annotations. This is @
document with annotations,
List
stem a
iternb|
tate annotations
۳ د
1 116 tet ofthis document POSTRDF >
does mot make much sense
2 btaybe these tems could be
explained in more detail?
صفحه 15:
Topics:
y Communication:
1 Whale songs:
see this
> Cognition:
aa
local __
=a a
ححه
user interface HTTP
Annotea|)
( Server )
RDF store
صفحه 16:
aa ابزارهاى حاشيه نويسى دستى aa
weedy 16 جد
eae 5 استفاذه از ابزارهائى استخراج متن
" مبتنى بر آنتولوى مشخصى نمى باشد.كه اين به نوه خود امكان
ا PU peel preter wee
*اگر کاریر یک سند حاشیه نویسی را ویرایش
py cor oe ere ar oo] am, G OO) EN Kc) RULE
اشتباه اشاره نماید .بنابراین می تواند ۸۵011201811011 گمراه
کننده شود.(تا حدودی جبران شده است.)
00
صفحه 17:
aa ابزارهاى حاشيه نويسى دستى aa
Semantic Word(,-7)
محيطى براى تاليف اسناد متنى مبتتى بر ([1/70015 1/15 فى باشد كه
هدفش کاهش بار تالیف حاشیه نویسیهای معثایی می باشد.
دامنه كاربرد 1/7010 56112213]:10 در موارد زير مناشب تر است:
" سندى كه مى خواهد تاليف شود به موضوعات كم ترى محدود
ل زا
موضوعات باشد .مناسب می باشد.
"" درجه بالاى از استفاده مجدد از محتوا هست.امكان استفاده حاشيه
نویسیها در محتوا می باشد.
wv ویو سای
صفحه 18:
بسی دستی
حاشيه نوي
اك
صفحه 19:
aa ابزارهاى حاشيه نويسى دستى aa
SemanticWord
ol eID e) م
Oa ee enon OLY el cei asl Tee a
زیادی برای تالیف توصیفات معنایی می شودندارد.
ا ا ا 0
استخراج اطلاعات الككوهاى حاشيه نويسى
۳ 99۱۱ ل الل ۱3200۱۰۳۱۱۵
01 حاشیه ا
1۳ ip een antes. pry ا 6 a =10 poy a1
0 ویو سای
صفحه 20:
aa ابزارهاى حاشيه نويسى دستى aa
) (9
هدف 16610/) ایجاد ابزاری برای ایجاد متاداده به صورت راحت و
موثرمی باشد.
1 از روشحاشیه نویسیمبتنیبسر آنتولوژیلستفاده می
Lh
يكك ويزْكَى به خصوص 2162112) ايجاد متا داده رابطه اى است كه
امكان ايجاد بيوند بين حاشيه نويسى ها را نيز فراهم مى نمايد.
00 denier 3
صفحه 21:
> ابزارهاى حاشيه نويسى دستى aa
2 ات eh eee
و رو و (۱۱۱۵۵ ®
Sol Op oly Dear em pom puree
0 ل (0) oii
را موثهد
۳ ویو سای
صفحه 22:
| با سا 5۲
ی
" ميزان آشنايى حاشيه تؤيس با دامنه
sas ا
ل 0
* حاشیه نویسی دستی یک پروسه گران می باشد
PU Cary OU tar Cone yer i Ie از منابع داده ءنبازمند
آنتولوزيهاى جندكانه»مى تواند براى يسّتيبانى كاربران متفاوت مفيد
0
۴ حاشيه نويسى دستى حجم اسناد موجود روى وب مى باشد.
ee
صفحه 23:
دا Oe keeles ات ۳5
آتزار حاشیه
دوفن استخراج
Ea 0 اطلاعات ۳
شده
00 denier
صفحه 24:
Sab gla حاشیه نویسی .. "-[
۱
تشخص اتوماتیک و کلاس بندی تمام موجودیتهای درون اسناد با دقت کامل وجود
ندارد.
eC ا ec iere rene oor
. نویسی نیاز دارند
۱
err ee en eee ese sr Eats Sie ا
برای حاشیه نویسی یکك سند می باشد.
۳
در حاشیه نویسی های نیمه اتوماتیک ما می خواهيم نقش فرد.را از حاشیه نویس به ناظر
تغییردهیم.
00
صفحه 25:
حاشیه نویسی نیمه اتوماتیک
Application
‘Upper Interfaces |
‘Document Donaaia Oatelozy &
Annotations Knowledgebase
ee etka eed oe
صفحه 26:
حاشیه نویسی نیمه اتوماتیکک
ری را
ل ار
Multistrategy
pe يي
Pattern-based Machine Learning-based
مر %“
Discovery Rules Probabilistic Induction
-Seed ~JAPE* -Hidden Linguistic
expansion Taxonomy Markov Structural
Models
label
matching -N-gram
analysis
صفحه 27:
Sab gla حاشیه نویسی .. "-[
9
CCRT ial ا ا ل ا 0
comer mentee Syd 0
D5)
ا ۱
۲-در حالی که کاربر به خاشیه نویسی دومی می پردازد اولی به سیستم "1 برای
یادگیری فرستاده می شود.
۳-تگ های اضافه شده را بر داشته وخود شروع به حاشیه : (Qf gan EN
Fe 8
ا ل م
۵-در این هنگام به کاربر گفته می شود که به حالت ناظر برود و اسناد به شکل
ede 0
۳ ویو سای
صفحه 28:
۳.1 حاشیه نویسی نیمه اتوماتیکی سح
Ara
SE Ie ene eon eed mee ae me oe ee ee
۱ لاوا
Be Cee teary ese rede Pa Ca Cpr We
۱۳ ابزار فراهم كردن محيطى براى 0 eet eel
lO IO ae caer eS)
ا ا ۳
7 ویو سای
صفحه 29:
Me Sls oop ارات 5
تال بر وب ANY EY
0 ممرور صفحه و انتخاب آنتولوژی
1 :انتخاب قسمت دلخواه و مرتبط كردن با آنتولوزى
163111 :اجراى الكوريتم يادكيرى براى آموزش استخراج قوانين
itagging , correction
" قانون 12601120 :مشخص نمودن قسمتهايى كه بايد حاشية نويسى شوئد.
* قوانین درستی: کاهش درجه خطا
۴ 1 می توان با مقایسه قوانین ایجاد شده با صفحات حاشیه نویسی
peed NOE A CS ee ree ened را تین نماید.
000۵ : قوانین برای استخراج اتوماتیک و حاشیه نویسی
صفحات وب استفاده می شود.
00
صفحه 30:
8 دای ساره تريسى نيد اتوماتيكك
۹ 110 1 2 انلكا
jpiManagement)
يت
* ذخیره و بازیابی معنایی اطلاعات
رت
"ا نكهدارى مجزاى اسناد,متاداده ها و انتوريّها
و
961006
نایب لو زار
۴ 6216
00
صفحه 31:
a
۳
PANKOW:
C-PANKOW:
لهسم
5200000
00 denier
صفحه 32:
— Ul حر
ای 6 ورهار ری روز ر 929
Wee) DANIO yy
elecrey ent csc te> eee Sea
۴ استفاده از وب به عنوان منبع داده که این مسئله مشکل پرا کند گی
داده را حل می نماید.
۴ میتنی بر الگو
purer
اتوماتیک نمودن حاشیه نویسی
حاشیه نویسی نیمه اتوماتیک نتیجه بهتری را می دهد.
صفحه 33:
حاشیه نویسی اتوماتیکک
NINDS Oeste
40h
صفحه 34:
= موضوعات بررسی شده
2. تعاريف حاشيه نويسى
3 بررسی روش های حاشیه نویسی
رس تب
روش نیمه اتوماتیک
روش اتوماتيىك
7 ا ل ا لل
5 ايده هاى ما براق حل مساله
8 فهرست منابع
00
لم
صفحه 35:
Fe اه
استفاده از استفاده
يادكيري از قوانين
ei | pul
DAML+O1L Rule AeroDAML[14]
Pattern
Discovery
‘KIMO
(RDFS) 5 , / KIM
‘RDF
DAML+O1,
L
owL Armadillo[8}
Vara Ont-O-Mat
2 Amilcare[10]
Pattern ‘Ont-O-Mat
Discovery PANKOW
Rule SemTagI6}
‘Melita
AmileCare
Semantic
word[23]
Ey 0 117 2 ل 71
صفحه 36:
= موضوعات بررسی شده
2. تعاريف حاشيه نويسى
3 بررسی روش های حاشیه نویسی
رس تب
روش نیمه اتوماتیک
روش اتوماتيىك
4. جمع بندى روش هاى موجود
oils | 5 دا دا(
8 فهرست منابع
00
لم
صفحه 37:
مي لوان اذ ee
استفاده نمو
١-محاسبه شباهت مفاهيم صفحه با
523000000
برس و جو از موتور جستجوى
ا يكت
OntoSearch
شباهت
(eel |
dere tall
(OntoEdit sit)o95
روابط جدید و غنی سازی آن وجوک»
00
صفحه 38:
م ل
6
صفحه 39:
"! معيارهاى استاندارد براى ارزيابى مدل هاى حاشيه نويسى :
۰
(0 ی
۱۳299 ب
© آله
ae accurat لت
2 6-1۱ ae ee
accifrate+inaccur
ate 2
5 تمام حاشیه نویسی هایی است که توسط فرد ایجاد می شود.
6 حاشیه نویسها درستن وسطسیستم
9
۳ ی
= معیارهای ارزیابی مدل —
صفحه 40:
۳ ieee ra
ا ا EVE كه
" ارائه مدلى براى انتخاب آنتولوى مناسب ه.اماه
* انتخاب مدلی مناسب برای استخراج اطلاعات با باد گیری ۵ ماه
* پیاده سازی مدل ۲ ماه
و ه.اماه
ب ۱ ماه
00
00 denier 7
صفحه 41:
[1]Cimiano, P., Handschuh, S., & Staab, S: (2004). Towards the Self-
Annotating Web. Thirteenth International Conference on World Wide
Web, New York, NY, USA, 462-471
[21S. Handschuh, S. Staab, and F. Ciravegna. S-CREAM — Semi-automatic
CREAtion of Metadata.In EKAW02, 13th International Conference on
Knowledge Engineering and Knowledge Management,LNCS/LNAI 2473,
pages 358-372, Sig’uenza, Spain, October 2002. Springer.
[3] S. Handschuh, $. Staab, and A. Maedche. CREAM — Creating relational
metadata with a 0 annotation framework.
In Proceedings of K-Cap 2001, pages 76-83. ACM Press,2001.
ICU eel TPR VON Cootatist Wa OM aeTTe sCoonrtnrLcr TT amcNTTs Mc OmShig ola Untstelrer EY
Open RDF Infrastructure for Shared Web Annotations. In Proceedings of
the Tenth International World Wide Web Conference, WWW10, Hong
Kong, China, May 1-5, 2001, pages 623-632. ACM Press, 2001.
[5]N. Kushmerick. Wrapper Induction: Efficiency and Expressiveness.
__ Artificial Intelligence, 118(1-2):15-68, 2000. ۰
[6] M. Vargas-Vera, E. Motta, J. Domingue, M. Lanzoni, A, Stutt, and F.
Ciravegna. MnM: Ontology Driven Semi-Automatic and Automatic
Support for Semantic Markup. In EKAW02, 13th International
Conference on Knowledge Engineering and Knowledge Management,
LNCS/LNAI 2473, pages 379-391,Sig uenza, Spain, October 2002.
Settee
[7] Dill, S., Eiron, N., Gibson, D., Gruhl, D., Guha, R., & Jhingran, A. et al.
(2003). SemTag and Seeker: Bootstrapping the Semantic Web via
Automated Semantic Annotation. Twelfth International World Wide Web
لوقه د11 رأكعم03نا8 ,معطم عجرو 176-166
صفحه 42:
mm =
[8] Siegfried Handschuh, Steffen Staab, and Raphael Volz. On deep
annotation. In Proceeding of the WWW2003 - The Twelfth
International World Wide Web Conferenceb (to appear),
Budapest, HUNGARY, May 2003.
[9] Dingli, A., Ciravegna, F., & Wilks, Y. (2003). Automatic
Semantic Annotation using Unsupervised Information Extraction
and Integration. Proceedings of the Workshop on Knowledge
Markup and Semantic Annotation at the Second International
Conference on Knowledge Capture (K-CAP 2003), Florida, USA.
[10] Erdmann, A. Maedche, H.-P. Schnurr, and S. Staab. From
Manual to Semi-automatic Semantic Annotation:About
_ Ontology-based Text Annotation Tools. In P. Buitelaar & K.
Hasida (eds). Proceedings of the COLING 2000Workshop on
Semantic Annotation and Intelligent Content, Luxembourg,
August 2000.
[11 Fabio Ciravegna and Yorick Wilks. ی Adaptive
Information Extraction for the Semantic Web in Amilcare.
Annotation for semantic web, 2003.
[12]P. Cross, L. Miller, and S. Palmer. Using RDF to Annotate the
(Semantic)Web. In K-Cap Workshop on Knowledge Markup and
Semantic Annotation, Victoria,B.C.,Canada, October 2001.
3 ویو سای
صفحه 43:
