صفحه 1:
:آرائه دهنده
زرو« ۳
دانشکده مهندسي کامپیوتر
a_mozaffari@ce.sharif.edu
آبان 1384
صفحه 2:
فبرست مطالب
كد
ای ا 9
Ree 1910112 و ۱۹۱
” نمايش سند ب[]3001 ی
صفحه 3:
معرفي :61۷11
صفحه 4:
On A
۱ .XMLyY
Bev
Pap ely eral > (1m NRO ye erent tari.) ba
ولقع به مانند زبانهايسرنامه نویسیقادر به لنجام کلرینسیست
& dg Hla لان ةا ty erry) ese. E a
قدرت بسیار بیشتر براي توصیف اطلاعات.
صفحه 5:
۱ 9 XML
۹/۱38 ۸۴
ee lS are tes ete ror
ات
ae SD SEO nia گيري در پیاده سازي دقیق
"هدف اصلي ,]11۲1۷ براي نمایش لت
أطلاعات به فرمت Tm)... ۳ هدف اصلي 250 در راستاي
توصيف داده ها و ايجاد متن هاي
ا ا ل
|
ا
صفحه 6:
Issues with Designing Large Scale Libraries Based on
NCSTRL
K Maly, M. Zubair, Hi Anan, D: Tan, and ¥. Zchang
Department of Computer Science
Old Dominion University. Norfotk, VA 23329
Abstract
NCSTRL is a unified canonical digital lubrary for scientific and technical information. ۱
is implemented based on the Dienst architecture that was developed by ARPA-funded.
CS-TR project, We encountered several problems while implementing NCSTRL based
lange-seale braries: UPS for Los Alamos and JDL for TASC. The document collection
for these libraries can range from several hunered thousands to few millions, The First
problem we found that the native Dienst architecture does act seale beyond
Approximately 30,000 records. Secondly we found thar the Dienst software architecture is
not suitable for a large number of coneurrent users. Finally, for a large number of hits the
Dienst search interface support is limited in terms of usability. To address these
problems, we replaced the Dienst repository service implementation with an Oracle~
based implementation. The Oracle database stores the index information (metadata) and
is partitioned horizontally to speed searching through different archives. Furthermore.
indexes were buill in order to speed the search by different key items such as the author
name, the title and the abstract. To improve the response time with concurrent users, We
used Servlet-based implementation. We also significantly reduced the average wait time
fora user far searches that resulted in a large number of hits. In this paper, we present the
performance cesulls of the new implementation and compare it with the existing
NCSTEL implementation,
1. Introduction
Digital ibraries (Dis) are important research topic in many scientific communities and
have already become an integral part of tho research process. Currently. there are a
number of commercial products available for individual communities 10 create theit
specialized digital library (for example. _http://www-software.ibm.com/isidig-
b/s 2factshest). Similarly, the research community has created excellent production
digital libraries systems: NCSTRL/Dienst [Davis$4], the Digital Library Initiative
صفحه 7:
HIML
sapien) ee
<head> Issues with
Designing Large Scale
Libraries Based on NCSTRL
>
<body>
<p> K. Maly, M. Zubair, H.
Anan, D. Tan, and Y. Zchang
</p>
<p> Department of
Computer Science, Old
Dominion University
</body>
<اصقغط>
۹/08
<?xml version="1.0""?>
ose) رد2
<titie= Issues with Designing
Large Scale Libraries Based
Cola GSMS
>
<authors> K. Maly, M.
Zubair, H. Anan, D. Tan, and
Y. Zchang </authors>
<abstract> NCSTRL is an
unified
Sse </abstract>
</paper>
صفحه 8:
“آسان كردن دستيابى و جستجو در اطلاعات
لاد رو Jl راتفر یوار فون فا دريف 517
ike هي ا ل طلاعات خواسته
ION 1 رد د Py
er 52 ۳
“آسان شدن تبادل اطلاعات بين سيستم هاي ناهمكون.
Pane, Co eee, ene eed
ال Cen |
را رت ل
pte ببس |
neces aren )| 2000 1
iC legen Op Ear encom
صفحه 9:
XML go ابزار نوشتن
9 ۱ eee, in
Bes 0) key wean 1 ا ا (0) <8 2-10 Ibs PTE pep
39 فخيرم
ار سر اي به بازار آمده mae اسناد 21/11 را
كام نو : ا رد تاري آن مطمئن شوند.(به عنوان
مثال می ل ل ا Rivets ES ors
chttp://www.stylusstudio.com/xml_download-html
"برنامه هايي وجود دارند که مي:تواننه استاه سایر برنامه ها (مانند بانك هاي اطلاعاتي .
ES eee ا Yi) Gop ۱
0 5)(1.501797 دستوراتي وجود دارد تا داده هاي داخل پایگاه داده را به يك
1
صفحه 10:
لت ا ا لك
XML wi.”
را ۱
و 0
XML «us sDTD ¥
<< بع ان ای ار رل
ee era Tenn ore eo peer) 1
دبس(
استفاده می کنند.
ل ی
Rude pe Rommee ney Clay Bryant year Cl, segue ا ل تك
See eS an Oslo. Co) HM Per reed
صفحه 11:
۱ We ont Bed
هر سند 200111
مي تواند براي
نمایش خود در
۱ وب از 366511
صفحه 12:
آشنايي با قواعد نوشتاري يك
۱
صفحه 13:
00
يك مثال ساده
م اطلاعات ان کتاب را ب
NAVATHE جح اع كم الل اع
صفحه 14:
XML Bee eee ee
Spr للا ieel
استفاده,را کرد براي این منظور:
<?xml
version="1.0" ?=> ۳۳۹۱ دا
اكه wpe
۱
۱ a Aes as (oer
استفاده است)
مت
صفحه 15:
ol jlo محر را که در مورد
<?xml كنيم أكه در ea
version="1.0" ?> ye 2.) elas ul ea
<Book> ۳ تا
</Book>
صفحه 16:
يس ار آن هر لا ارات در
رابه صورت زیر شاخه در داخل تگ
لا ۰۱۱۱
i 3 سا(
<title=
Foundamentals of Data Base
Systems “</title>
<Edition> forth</Edition>
ال كا
Navathe</authors>
</Book>
eee Rene peel a)
صفحه 17:
<?xml version="1.0" ?>
<Book>
<title> حك
1 Foundamentals of Data Base
sb Systems </title>
“~ “_<Edition> forth</Edition>
<authors> Elmasri &
Navathe</authors>
</Book>
صفحه 18:
جه قوانینی را در نوشتن يك فایل ,2۳۱۷۲ باید
رعغایت کرد؟
در ابتداي هر سند و قبل از هر چيزي <08-1.0۶ز۲۵۲5 2۳۲۲ >
aoe ۳
ya سن بايد 0 يك عنصر root) ab باشد.
SESS ا ل Bere
“در رعايت سلسله مراتب بازو بستة نمودن تك ها بايد دقت شود.
ee Reale اا ا ا ee
شود.
This is a comment --> --!<
صفحه 19:
استفا ده از صفت
6 اه ۱/8 سر تباب زیر ی رای تراد رت
pee aey ۱ ۲
"صفت paella rl مي کنیم و داده قبلیش را نیزبه عنوان
مقدار صفت به آن مي افزانيم.
را بایدر پير در ات 6 ا تا
eal
صفحه 20:
<?xml version="1.0"?
> <note>
۰2
12/11/2002—/date>
<to> Tove </to>=
<trom> Jani</from>
</note>
<?xml version="1.0"?>
<note
date="12/11/2002">
<to> Tove </to>
<from> Jani</from>
</note>
7 شیوه مدلسازي کرد يكي با <<
Note
To: Tove -—
۳۱۱۵+ لصو ل
Date :12/11/200
2
میتوان اين پیغام را به دو
استفاده از صفت و دب
بدون استفاده از آن
صفحه 21:
۳ در استفاده از صفت به جاي يك نک
زير شاخه وجود دارد؟
“يك pe tere را
ree كرا در و اور رس افتان کنر
ee bein nee ere Tcl ا ا د
7براي تجزیه گر هاي مستندات :261۷11 کار با صفت مشکل تر از کار با
يك زير ries) Rom ese ۱
صفحه 22:
ا ا
DTD
260111. شماي
صفحه 23:
DTD (Document Type
&.42 Definition)
"براي تعيين صحت أسناد تعریف مي شود.
“كاهي به منظور يكيارجه سازي در استفاده از تك ها با معاني مشخص و از بيش تعيين
ا ا 0 و
"به این منظور در يك سند 12110 باید عنوان تگ هاي استفاده شده و همچنین تو در
تويي آنها ار ل ۱
و[
ل ا ري لالدو لين
شناخته نمي شود و بي ارزش است.
صفحه 24:
۱۱۷۱۳2
Peery DW De
Rese y srU Es Sp) oy) DM De cases Ipeveca ا ا
۱ ۰ ايجاد كنيد.
۲7 خابجی
“جنانجه جند سري ۱
براي تمام آنها استفاده کرد ا 00
فایل خارجی شامل (11 1 موّرد نظر ساخته می شود و سپس اسناد .261۷11 مورد
نظر توسط 1141] اين فائل به آن مرتبط مي شوند.
صفحه 25:
DTD كت
براي مثالي كه قبلا سند 251111 آن را نوشته
earn eareer رد ا
eee neces
Peep. «Ie EEN nen
7 DocType note!>
"مقداری فضاي خالي براي نوشتن محتواي
لل 0
"در انتهاتایپ اي
<?xml version="1.0"?>
<!DOCTYPE note [
۳
ل
<to> Tove</to>
<from> Jani</from>
<date> 12/11/2002
<منلعه >
</note>
صفحه 26:
DTD كت
وا Fy
سند را معرفي کنیم »اپتدا نگ 1001 را
معرفي مي کنیم:
”م
30 CI eg]
عم ای اد
"سپس در تلو وان نام تگ هایی کبطا
صورت زیر شاخه در عنصر ۲00 تعریف
مي شوند را مي نويسيم.
(to,from,date)
7
در انتها مي نویسیم >
<?xml version="1.0"?>
<!DOCTYPE note [
<!ELEMENT note
(to,from,date)>
نز
حك
<to> Tove</to>
<from> Jani</from>
<date> 12/11/2002
</date>
صفحه 27:
ene DTD
پساز آن به ترقیب هر یلا وگ ها <?xml version="1.0"?>
يف 0 1 [ <!DOCTYPE note
<!ELEMENT note oo Need
(to,from,date)> Se Wee
و I es
<!ELEMENT to Pe. hes
يك دلده اي به آن اختصاص دادالبته (#PCDATA)>
م سماد <!ELEMENT from
(#PCDATA)> aa
<!ELEMENT date CDATA#
(#PCDATA)> 1۳۳], 1۳۴(#
۳ REQUIRED#
<note> WHF 0°
<to> Tove</to>
<from> Jani</from>
edAsates 19/11/9009
صفحه 28:
<?xml version="1.0"?>
۱۱/۵/9۹ ی ۳ ] عامط
<!ELEMENT note 3
(to,from,date)> 1> ED, SM an
<!ATTLIST note date نك"
0
رل 3 <!ELEMENT to
(#PCDATA)> (ome
پس از آن با توجه به مقدا رت آن را <!ELEMENT from
eran ey ۳ 0 6
“در انتها تايب مي كنيم > 12
<note date=“12/11/2002 “>
<to> Tove</to>
۳۳۳۳ Tania feams.
صفحه 29:
كك
1 ا ا ل ا
<!ELEMENT to (#PCDATA)> eat 8
<!ELEMENT from (#PCDATA)> 0
0 ا Usp er tee Pea
1211 داخلی نیز در اینجا رعایت
مي شود.
<?xml version="1.0"2>
۱
ey ne ل د ا لم
"note.dtd">
>06< رد eee
<to>Tove</to> DOCTYPE!>¥
<from>Jani</from> سس تام ره راامی وه
slice SD cod eat ee TOI ea رنه
و پس از آن آدرس جايي که فایل 10
</note> 5 1 ۱
خود را ذخيره كرده ايم مي نويسيم.
صفحه 30:
0 خارجی
<?xml version="1.0"?>
۲عبارت ]1151۷ 9۷5 که در مثال قبل
<!DOCTYPE note PUBLIC ۱ 5 ee
قایل 0:0 شخصي استفاده مي کنیم که -/fliz Castro//DTD
RCM) Pep egpee Py ۱۱۰۱۵۱
تا AB OHI AMAA Acrole) aiVolele Meret pcr
al eae ل l/examples/dtd_creating/end s
"به جاي 5157131/1 در مل قبلٍِ pecies.dtd">
esate ات۱ <مام >
fen ازآن 0 <0۷۵>/۲0< 0 >
عمومي را مي نویسیم 8
بعد از آن آدرس آن مشخصه عموميمي <from>Jani</from>
د <date> 12/11/2002 </date>
</note>
صفحه 31:
۲شمای 1 دقیقا به همان منظور eae ا 0
( 110 ئلت ف ارت
”“قدرت نمائِش و توصيف اطلاعات!ذر شما از 10112 بيشتر است.
Bye benceiplber etre ا لل ا
همان قوانين استفاده ملى کند.
"با توجه به خصوصیات ذکر شده بیشتر ترجیح داده مي شود تا براي
توصيف اعتباريك سند از شما استفاذه شود تا 111
صفحه 32:
شماي .303/11
سات كرابس براق بال ارد قر يك
شما پنويسيم به این 9 عم در
آلبتدا باید يك فایل 626-01011 با
0
02004 I yeonye te Oe rh
خط اول آنَ أعلان 2511/11 را مي نويسيم.
“يس از أن دستوراتي را اضافه مى«كنيم
(به مانند مثال روبرو) كه نشان ملي دهدا در
1
نامي استفاده مي كنيم.
الا ال
<xs:schema
xmins:xs="http://www.w3.org/20
الف
targetNamespace="http://www.w
3schools.com"
xmlns="http://www.w3schools.co
rice
elementFormDefault="qualified"
=
</xs:schema>
صفحه 33:
XML clas
۱ re sare Nee
eee eres inl
۳ reer keres
3 oe
00 oa
Sees oy pee ranl
سر
6
<?xml version="1.0"?>
<xs:schema
xmlins:xs="http://www.w3.org/20
01/XMLSchema”
targetNamespace="http://www.w
3schools.com"
xmlns="http://www.w8schools.co
ae
elementFormDefault="qualified"
=
<xs:element name="note!>
<xs:complexType>
</xs:complexType>
Spee) (sted
</xs:schema>
صفحه 34:
XML clas
<?xml version="1.0"2>
-
xmins:xs="http://www.w3.org/20
01/KMLSchema"
سا nici pei rat la
350120015 . "تمع 5 7
xmins="http://www.w3schools.co Sb p ا ا
3 ِ :
4 GD بش
esol ea cma Pe, 5 ae
<xs:element name="note">
[۳
7 ل
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:schema>
صفحه 35:
XML clas
<?xml version="1.0"?>
<xs:schema xmlins “http://www.w3.org/2001/KMLSchema"
targetNamespace="http://www.w2schools.com”
xmins="http://www.w3schools,com"
elementFormDefault="qualified">
016 احمصع[ع:ویر>
<xs:complexType>
<xs:sequence>
<xs:element name="toy type="xs:string"/>
<xs:element name="from." type="xs:string"/>
ا ا ال ا ات
بس ار آن تك تك تك اهاي ربج
ا نبا
o) ل 002 ] </xs:sequence>
</xs:complexType> ped 5 es
ايت
صفحه 36:
<?xml version="1.0"?>
<xs:schema
xmlns:xs="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www.w23schools.com”
xmins="http://www.w3schools.com"
elementFormDefault="qualified">
<xs:element name=
<xs:complexType>
<xs:sequence>
<xs:element name="to"
type="xs:string"/>
00 ا ل
type="xs:string"/>
فرض کنید در مثال قبل 18:6 به
<xs:attribute name="date" زیر شاخه به صورت یگ Seb cle
صفت تعریف شده باشد در این صورت type="xs:date"/>
۱۳ toy Tel
</xs:sequence> 5 دهیم.
</xs:complexType>
صفحه 37:
۹
"انواع گونه داده اي را که می توان توصیف کرد عبارت است از:
xs:string”
xs:decimal”
xs:integerY
xs:boolean”
xs:date”
Dern he
صفحه 38:
XML clas
ev ea ی ما
فایل الم
00,5 o> NOtE.XS pl Ll) Ls LE ale”
۷۳ در ر داخل تك ريشم عبارات زير را اضافه مي
<?xml version="1.0"?25 را معرقي کنیم و هم فضاي نامي را rel a
<note شماي ما از آن استفاده مي كند.
۹۰۰۱۱۱
xmlns:xsi="http://www.w3.0rg/2001/XMLSchema-
ا
xsi:schemaLocation="http://wwwaw3schools.com
note.xsd">
<to>Tove</to>
<from>Jani</from>
<date>12/11/2002 </date>
<مامد/>
صفحه 39:
نماريش ۰ XML كد
۰
CSS
صفحه 40:
XSLT ( EXtensible Stylesheet
Language Transformations)
Perper و oe per a سندولستکه ۹-۳
XHTML ۳ anranoey Pee ss Ieee
بولی مایشدر 0701۷561 لست
ه FN
و صفتهايمربوط به ۳ بشند 2۳1۷11 لستفادم ميشود) ML ws.
۳ ميكند ee) كك ا ل ا رد
Ce GE ا ا 000 ءا تبديلميكك.
صفحه 41:
۱ >
<i-- Edited with XML Spy ۲۴۱۲ --
~ cbreakfast_menu>
~ <food>
cname>Belgian Waffles</name>
<price>$e,4s</price>
<descripticnstwo of our famous Belgian Waffles with plenty of real maple syrup</description>
<calories> #0-</calories>
</food>
- <food>
chame>Strawberry Belgian Waffles</name>
<price>$¥s4s</price>
<descripticnslight Belgian waffles covered with strawberries and whipped
creamg/description>
<caloness'--</calories>
</food>
~ <food>
<name> Berry-Berry Belgian Waffles</name>
<price=$4'8</price>
<descripticn>light Belgian waffles covered with an assortment of fresh berries and whipped
creame/destription>
<talones>'--</calories>
</food>
- <food>
صفحه 42:
<?uml version="1.0" encoding="1S0-Akat.1" 2,
gle> Edited with XML Spy vf,’ =>
- shtml ask version=",-" xinlnsixsl="http:/ /wwew.w!.org/484/XSL/Transform’
amins="http:/ /vwwavt.org/1488/xhtml!>
~ <body style=font-family:arial helvetica, sans-serif;font-size:\"pt; background-color#EEEEEE">
~ <xsl:for-each select="breakfast_menu/food">
~ «diy style="background-color:teal;color:white;padding:*px">
nt-weight:bold;color
*margin-left:' px;margin-bottom:\em;fant-size:\-pl
<ysl:valuo-of select='description’ />
~ <span style="font-style:italic'>
exslivalue-of select="calories" />
calories per serving)
</span>
</div>
</xsi:for-each>
</body>
</html>
صفحه 43:
XSLT
eS و وی gr
0 eee ee noes ee ety ee Tee et
أضافه مي كنيم 7۵90 8
<?xml-stylesheet type="text/xsl"
href=“xslt_file_ name.xsl’“?>
Bercy secs. 6/7) Aantroeg app. 4\7 8 Rage npwag
00 ee eae AC A ee Se ا
gd
صفحه 44:
م۷ ۳
Fle Edt View Favortes Took Help
64م ۵ drome Que © B32 م۵ 8 9۵ و
‘Address | [2] D:{Drive E\cemauter\terniVtappication engireerinclaml{New Felder|simplexsl xn 2
17
وی(
مشاه
Belgian Waffles -
‘wo of cur famous Belgian Wafflas with plenty of real maple syrup (#2: calcries per serving)
0 ا
light Belgien wafles covered with strawberies and whigped ciear (#1 calones per serving)
۱2 cake ee
Tight Belgian wafles covered with an assarlment of fresh berries and whipped cream (1+ calories per sewing)
Unt ات
thick slioas made fiom aur hamamade sourdcugh bread (#1 + calories per sewing)
Pe uae
‘wo eyos, becon or sausage, toast, and our ever-popular hash browns (44: calories per senna)
oe
ههه >
نمایش سند :161۷11 با
(۹-۱۸۷ ار ار
11015 تك
— ۳۳۳۳ ۲
صفحه 45:
XSLT
(۰۹۱/۱ renege bpp. Co) Bo Mang HE awe peanoree EES) 0) 0) sci —) apes expe eal]
ندارند.61 11015 هایی که قابلیت نمایش را دارند عبارتند از:
Firefox 1.0.2”
Mozilla 1.7.8”
Netscape 8”
Opera 8”
Internet Explorer 6”
1
۳
صفحه 46:
CSS (Cascading Style
Sheets )
"یکی دتکر از ابوار تمایش سند در ۱1۵561 ها دون
”810517561 ها هنكاميكة بكسد :1111/11 را recom 1۳9
توچه ay 2 منت گهای که ا ل Te
Fr p47 0 ۱ و
[0 Ceney vg /C ny renee ne pny
ea Oe ae ۱ yee somes
لت ۳۳ كينا 6 (به عنولزدادم هاييكه بايد
نمایشدادم شود) لقیلم به تعليش إرفيكك
صفحه 47:
mse
۱156-1۸۵9- ۱" 2<
۴ <p
<! ited with
- <CATALOG>
- <CD> =
<TITLE>Empire Burlesque</TITLE> @®
<ARTIST>Bob Dylan</ARTIST>
<COUNTRY >USA</COUNTRY> ©
<COMPANY>Columbia</COMPANY>
<PRICE>\-»4-</PRICE>
<YEAR>V4A0</YEAR>
</CD>
- <CD>
<TITLE>Hide your heart</TITLE>
<ARTIST>Bonnie Tyler</ARTIST>
<COUNTRY >UK</COUNTRY>
<COMPANY>CBS Records</COMPANY>
<PRICE> 4, 4- </PRICE>
<YEAR>V4AAK/VEAR>
</CD>
- <CD>
<TITLE>Greatest Hits</TITLE>
<ARTIST>Dolly Parton</ARTIST>
<COUNTRY >USA</COUNTRY>
<COMPANY>RCA</COMPANY>
صفحه 48:
CATALOG
background-color: #ff fff;
width: vu
+
cD
display: block;
margin-bottom: y-pt;
margin-left: -;
TITLE
color: #FF----5 e
Font-size: rpt;
+
ARTIST
color: ۰۰۰۰۳۴
font-size: rpt;
+
COUNTRY, PRICE, YEAR, COMPANY
display: block;
color: #- 5
صفحه 49:
CSS
00 Pn ل Oct Cone Ss
0 eee ee noes ee ety ee Tee et
أضافه مي كنيم 7۵90 8
<?xml-stylesheet type="text/css"
! 1
۳ <1) Aku me lpp.¢\7 9 EET erens
00 ee eae AC A ee Se ا
gd
صفحه 50:
Fie Edt View Favortes Tools Help
ممه له ممم جاو دصر [ 6 ها ه] - و - مدق
Address [@)) D:\Drive E'\camputer|term¥'\application engineeringlxml\Mew Folder|\cd_catalog_with_css.xml
i
eS ۵
csv se
Empire Burlesque Bob Dylan
USA
Columbia
1۹۰
Wako
Hide your heart Bonnie Tyler
UK
CBS Records
۹۹۰
مک
Greatest Hits Dolly Parton
USA
RCA
ae
vas
صفحه 51:
CSS
البته تمامى 19100187561 ها قابليت خواندن فايل 055 ونمايش سند 200/11 را
ندارند:61 11015 هایی که قابلیت نمایش را دارند عبارتند از:
Firefox 1.0.2”
Mozilla 1.7.8”
Opera 8”
o>¢0) (Oa a ۲111:07۳۴ .لته لیرپورد نمیتولند تسمامیمستورلت
5 رالجرا كند) 1 1
صفحه 52:
ال
Participant Participant
B
a
صفحه 53:
رب
۱۶۱۱۱۱۱۰۱۰۸
۱-۱۱۸ by
۱2 , عع اماع27
Hall PTR ,1998
ا ا
ا kes ee Pr