PDA

توجه ! این یک نسخه آرشیو شده میباشد و در این حالت شما عکسی را مشاهده نمیکنید برای مشاهده کامل متن و عکسها بر روی لینک مقابل کلیک کنید : معرفی مروري بر رايجترين زبانهاي نشانه گذاري منابع وب



heidari1372
2nd November 2012, 01:22 PM
چكيده
تقريبا با پيدايش وب جهاني زبان هاي نشانه گذاري به منظور تدوين‏، نمايش و ارائه مدارك وب به وجود آمدند. در حال حاضر زبانهاي نشانه گذاري متعددي كه بر شكلهاي گوناگون مدارك وب تاكيد دارند گسترش يافته اند. متداولترين اين زبانها كه عموماَ برخاسته از زبان نشانه گذاري تعميم يافته استاندارد SGML مي باشند عبارتند از HTML، XML، XHTML، HDML و WML كه در اينجا سعي گرديده است با اشاره به ويژگي هاي هر كدام از اين زبانها، به معرفي اجمالي آنها پرداخته شود.

مقدمه
تقريباَ همزمان با ايجاد وب جهاني زبان هاي نشانه گذاري (Mark-up Language) نيز پا به عرصه وجود گذاشتند. نياز به اين زبانها از آنجايي سرچشمه گرفته است كه سازمانها نيازمند مديريت شمار زيادي از مداركي بودند كه مي بايست به شكل هاي متنوعي مبادله و ارائه گردند.
ابرداده ها نيز جهت يكدستي در شكل نمايش و ميانكنش پذيري(Interoperability) نياز به ابزاري براي تعريف مدارك داشتند كه زبان هاي نشانه گذاري بهترين راه را براي اين منظور فراهم مي ‌آورند. زبانهاي نشانه گذاري متداولترين فرم هاي رقمي هستند كه ابرداده ها در حد وسيعي، از صفحات وب گرفته تا پيشينه هاي الكترونيكي، از آنها استفاده مي كنند.
زبانهاي نشانه گذاري اساساَ برخاسته از پردازش متن( Text Processing ) مي باشند. زبانهاي نشانه گذاري بنابر تعريف عبارتند از: «نظام هاي رايانه اي كه مي توانند اجزاء ايجاد مدرك و پردازش انتشار را خودكار مي سازند». [1]
زبانهاي نشانه گذاري اوليه كه تاكيد بيشتري بر متن داشته اند، عبارت بودند از: Troff ، Rich Text Format (RTF) و LaTex . اما در حال حاضر زبانهاي نشانه گذاري ديگري در حال گسترش هستند كه به شكلهاي گوناگوني از مدارك اختصاص داشته و نقش هاي متنوعي را در كاربردهاي وب ايفا مي كنند. در اينجا سعي گرديده است به معرفي اجمالي برخي از آنها كه در محيط وب و منابع الكترونيكي رواج بيشتري دارند، پرداخته شود.

SGML
در اواخر دهه 1960 سه نفر از پژوهشگران IBM به نامهاي گلد فارب، موشر و لوري اولين بار بحث نشانه گذاري تعميم يافته را مطرح كردند. آنها معتقد بودند كه يك زبان نشانه گذاري مي بايست داراي سه خصيصه باشد:
1- ارائه داده ها بايد به گونه اي رايج باشد
2- نشانه گذاري بايد گسترش پذير باشد
3- انواع مدرك نيازمند قواعدي مي باشند. [2]
اين خصيصه ها چارچوب ارائه ابرداده را فراهم آورد و به دنبال آن نياز به برقراري يك زبان نشانه گذاري استاندارد تعميم پذير احساس گرديد.
SGML يا زبان نشانه گذاري تعميم يافته استاندارد (Standard Generalized Markup Language) را مي توان يك فرازبان(Meta language ) به شمار آورد. اين زبان به عنوان يك استاندارد بين المللي (ISO 8879) در سال 1986 تدوين گرديد. اين استاندارد بر اين اساس به وجود آمد تا به وسيله آن يك زبان مشتركي تعريف شود كه بسته هاي نرم افزاري و پردازشگرهاي مختلف از طريق بكارگيري طرحواره هاي مشابه بتوانند به مبادله اطلاعات بپردازند. به اين ترتيب اطلاعاتي كه به صورت متن ارائه مي گردد مي تواند از يك برنامه يا كاربرد به برنامه يا كاربرد ديگر بدون تغيير در شكل و ساختار، آن انتقال يابد.
در اين زبان آن طور كه انتظار مي رفت، تدوين كنندگان آن يك دسته برچسبهاي(tags) جهاني را تعريف كردند كه در آن هر برچسب معني خاص خود را دارد. به عنوان مثال براي مشخص كردن نام يك فرد از برچسب <name> استفاده مي شود كه در زمان نمايش، نامي كه با اين برچسب مشخص گرديده به صورت اريب يا درشت ظاهر مي شود. [3]
با اين وجود SGML داراي كاستي هايي در تعريف مدارك الكترونيكي بوده كه خود باعث به وجود آمدن زبان نشانه گذاري ديگري گرديده است. اما آنچه درباره SGML اهميت دارد اين است كه اين زبان با وجود كاستيهاي بسيار مبناي زبانهاي متداول و پركاربرد امروز از جمله HTML و XML مي‌باشد.

HTML
HTML يا زبان نشانه گذاري فرامتن در اويل دهه 1990 برمبناي SGML به وجود آمد. به طوري كه پژوهشگران بتوانند به سادگي اطلاعات را در شبكه ها خصوصاَ وب به اشتراك بگذارند. [4] كلمه Hyper در ابتداي سرنام اين زبان در مقابل Linier يا خطي است. بدين معني كه در برنامه نويسي خطي اگر در يك سطر از برنامه اشتباهي رخ دهد، كل برنامه با اشكال مواجه شده و اجرا نمي‌شود، اما در اين زبان هر سطر نقش مستقلي داشته و بقيه برنامه بدون اشكال جرا مي شود.
HTML نقش عمده اي در بازيابي اطلاعات دارد. HTML بدان منظور طراحي گرديد كه يك مدرك امكان ديده شدن توسط «مرورگرها»(Browsers)را با قابليتهاي مختلف داشته باشد. لذا HTML به شما اين امكان را مي دهد تا بخشهايي از متن مثل عناوين يا پاراگرافها را انتخاب و نشانه گذاري كرده و تجزيه و تحليل اين بخشهاي انتخاب شده از متن را به مرورگرها واگذار نمائيد. بنابر اين ممكن است يك مرورگر تنها ابتداي هر پاراگراف را در نظر بگيرد و ديگري تمام متن را.
ساختارهاي HTML متن را به قسمتهايي تقسيم مي كند كه عناصر(Elements) نام دارند. اين قسمتها خود به دو بخش تقسيم مي شوند: آنهايي كه چگونگي نمايش پيكره يك مدرك را توسط مرورگر تعريف مي‌كنند كه با برچسب <BODY> مشخص مي شوند و آنهايي كه اطلاعات پيرامون مدرك از قبيل عنوان يا روابط آن مدرك با ديگر مدارك را تعريف مي نمايند و با برچسبهايي مثل <HEAD> مشخص مي گردند.
تفاوت عمده اين زبان با SGML آن است كه SGML در حد قابل توجهي مشكل و پيچيده بوده و بيشتر براي مجموعه هاي انبوه مدارك طراحي مي شود. همين پيچيدگي آن باعث گرديده كه در حيطه هاي استراتژيك و از نظر امنيتي با اهميت كاربرد داشته باشد. خوشبختانه HTML از اين نظر بسيار ساده تر مي باشد.
با اين حال HTML به نوبه خود نيز داراي ضعف هايي مي باشد كه باعث گرديده تا متخصصين زبانهاي نشانه گذاري و نرم افزار، زبان ديگري را گسترش دهند كه XML نام دارد. اين زبان بسياري از جنبه‌هاي مفيد HTML و SGML را نيز در بر دارد. [5]

XML
از آنجا كه هدف از طراحي زبان نشانه گذاري گسترش پذير(eXtensible Markup Language:XML) در واقع جبران كاستيهاي زبان HTML مي باشد، لذا بهتر است ابتدا به برخي از نارسائيهاي HTML اشاره شود. اساساَ يكي از ضعفهاي HTML توجه كم آن به چگونگي ارائه اطلاعات در مرورگرها است. به عبارت ديگر عنوان،‌ سرعنوانها، اطلاعات پديدآور و امثال آن بايد در درون عناصري مثل TITLE، H1 ، EM ، ADDRESS و غيره قرار گيرد. ولي استفاده از FONT و عناصري مثل آن كه شكل ظاهري و زيبايي را تشكيل مي دهند، بدون درنظر گرفتن محيط رايانه دريافت كننده، بسيار مشكل است. اين تا حدي است كه گاه پردازش اطلاعات را با مشكل مواجه ساخته يا حتي غير ممكن مي كند. لذا مي توان گفت كه در HTML بيشتر به محتواي اطلاعات توجه گرديده تا به شكل ارائه آن و لذا مي توان گفت كه HTML بيشتر براي كاربراني مطلوب است كه نياز به ساختار رنگارنگ، خطوط زيبا و محيط گرافيكي خاصي ندارند. [6].
اين خصيصه باعث گرديده است كه بسياري از صفحات وب كه حاوي برچسبهاي خاصي از يك نسخه خاص يك مرورگر هستند، توسط ديگر مرورگرها قابل خواندن نباشند.
اما اين تنها مشكل HTML نيست. اگر شما بخواهيد اطلاعاتي را با دقت بالا نشانه گذاري نمائيد، بنابر منظورتان شما به عناصر زيادي نياز خواهيد داشت كه در HTML وجود ندارند. مثلاَ ممكن است شما نياز به عناصري براي فرمولهاي شيمي، داده هاي رياضي و غيره داشته باشيد. اين مستلزم داشتن عناصر فوق العاده بسياري است كه در اين صورت نه براي كاربر و نه براي پديدآور مطلوب نمي باشد.
مشكل ديگر اينكه HTML از ساختار دروني كمي برخوردار است. بدين معني كه اگر شما به جنبه معنايي(Semantic)توجهي نداشته باشيد مي توانيد به سادگي HTML بنويسيد. به عنوان مثال شما مايليد در پيكره متن (BODY) سرعنواني را داشته باشيد (H1) كه سرعنوان ديگري را در درون خود دارا بوده (H2) و باز به نوبه خود آن نيز حاوي سرعنوانهاي ديگري است (H3) ، مانند آنچه كه در يك كتاب مي بينيم. اما در HTML اين نياز احساس در نظر گرفته نشده است. [6]
با توجه به مشكلات قابل توجه HTML كه به برخي از آنها اشاره شد،‌ كنسرسيوم وب جهاني W3C در تابستان سال 1996 كار بر روي زبان جديدي را آغاز نمود. W3C گروهي را جهت تدوين زبان نشانه گذاري XML تشكيل داد كه گروه كاريXWG-XML (XML Work Group) نام گرفت. اين گروه كار خود را به سه فاز تقسيم كردند:
فاز 1: تعريف استانداردي براي ايجاد زبانهاي نشانه گذاري
فاز 2: گسترش يك استاندارد متداول براي برقراري پيوند ميان اين زبانهاي نشانه گذاري
فاز 3: گسترش يك استاندارد متداول مخصوص شكل ظاهري مداركي كه براي زبانها كدگذاري مي شوند.
همان طور كه گفته شد، قبلاَ استانداردي براي زبانهاي نشانه گذاري تدوين گرديده بود كه SGML نام دارد. از آنجا كه اين استاندارد به منظور اينكه رايانه ها و زبانهاي مختلف بتوانند مدارك SGML را مبادله كنند، نياز به تعريف زبان نشانه گذاري هر مدرك يعني DTD داشتند،‌ و با توجه به پيچيدگي SGML ، XWG ويرايش جديدي از SGML كه همان XML است را گسترش دادند. به همين خاطر آن را SGML سبك(SGML light) نيز مينامند.
در XML شما مي توانيد اطلاعات مداركتان را به طور دقيق تري نسبت به HTML كدگذاري كنيد كه اين امر مانعيت را در بازيابي مدارك بالا مي برد. بدين ترتيب برنامه هايي كه اين مدارك را پردازش مي كنند، آنها را بهتر مي فهمند و منظور نويسنده مدارك نيز بهتر منتقل مي شود. براي مثال يك فروشنده مواد غذايي مي تواند اطلاعات مربوط به كالري، قيمت، مدت زمان تهيه هركدام از محصولات را به گونه اي ارائه دهد كه برنامه بتواند برمبناي پيشنهادات كاربران، محصولات را بر اساس كالري، قيمت يا هريك از مشخصه ها مرتب كند،‌ زيرا اطلاعات به گونه است كه رايانه مي تواند آن را بفهمد. [8]
همچنين XML گام بزرگي به سوي نظامهاي تعاملي خبره اطلاعات به شمار مي آيد. براي مثال مي توان يك نظام پرسش و پاسخ آماده (FAQ) را به سادگي در اين زبان نشانه گذاري كرد. در زير نمونه بسيار ساده اي از آن آورده مي شود:

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<!DOCTYPE FAQ SYSTEM "FAQ.DTD">
<FAQ>
<INFO>
<SUBJECT> XML </SUBJECT>
<AUTHOR> Alireza Saadat</AUTHOR>
<EMAIL> alireza_saadat2003@yahoo.com </EMAIL>
<VERSION> 1.0 </VERSION>
<DATE> 16.aug.2005 </DATE>
</INFO>

<PART NO="1">
<Q NO="1">
<QTEXT>What is XML?</QTEXT>
<A>SGML light.</A>
</Q>

<Q NO="2">
<QTEXT>What can I use it for?</QTEXT>
<A>Anything.</A>
</Q>

</PART>
</FAQ>
در XML زبان نشانه گذاري شده بالا DTD زير را دارد:
<!ELEMENT FAQ (INFO, PART+)>

<!ELEMENT INFO (SUBJECT, AUTHOR, EMAIL?, VERSION?, DATE?)>
<!ELEMENT SUBJECT (#PCDATA)>
<!ELEMENT AUTHOR (#PCDATA)>
<!ELEMENT EMAIL (#PCDATA)>
<!ELEMENT VERSION (#PCDATA)>
<!ELEMENT DATE (#PCDATA)>

<!ELEMENT PART (Q+)>
<!ELEMENT Q (QTEXT, A)>

<!ELEMENT QTEXT (#PCDATA)>
<!ELEMENT A (#PCDATA)>

<!ATTLIST PART NO CDATA #IMPLIED
TITLE CDATA #IMPLIED>
<!ATTLIST Q NO CDATA #IMPLIED>


XHTML
انگيزه ايجاد XHTML ، ايجاد يك نوع مدرك بود كه بتواند بين وسايل ارتباطاتي مختلف مثل رايانه، تلويزيون، تلفن همراه، رايانه هاي جيبي يا PDA، پيجر، ماشينهاي كتاب خوان رقمي، ساعتهاي هوشمند و غيره مشترك بوده و به اندازه كافي براي نگارش يك محتواي ساده،‌ توانمند باشد.
با گسترش نوع مدرك XHTML شمار كاربران وب به حداكثر مي رسد. XHTML قسمتهاي بنيادين و رايج HTML را به عنوان مبناي طراحي خود قرار داده است. اين قسمتها عبارتند از:
● متن اصلي (شامل سرعنوانها، پاراگرافها و فهرستها)
● فراپيوندها و پيوندهاي مرتبط با مدارك
●جداول اصلي
●تصاوير
● ابرداده
اينها نقطه آغاز طراحي زبان XHTML به شمار مي آيند. در مجموع بايد گفت هدف از XHTML را محدود كردن زبانهاي آينده از نظر كاركرد نيست، بلكه از آنجايي كه عناصر در HTML4 (چارچوبها، جداول پيشرفته و ...) براي يك سرويس گيرنده رايانه روميزي تدوين گرديده اند،‌ براي ابزارهاي غير آن چندان مناسب نيست. XHTML با استفاده از كاركردهاي بنيادين HTML4 كه زبان بسيار حجيم و با زير مجموعه بسياري است، هم براي ميانكنش پذيري در محيط وب مناسب بوده و هم امكان سازگاري سخت افزاري و نرم افزاري با افزايش تعداد كاربران كه همان مقياس پذيري(Scalability) است، را فراهم مي آورد. [8]

HDML و WML
كاربرد اين دو زبان در تلفنهاي همراه است. HDML يا زبان نشانه گذاري ابزار دستي(Hand hold Device Markup Language) براي لايه نمايش(Presentation Layer)درشبكه بكار مي رود. شركت نوكيا و اريكسون براي پياده سازي يك مرورگر كامل WAP (قرارداد كاربرد بي سيم[Wireless Application Protocol]) براي لايه نمايش بر روي تلفنهاي همراه از زبان نشانه گذاري ديگري استفاده كردند كه WML يا زبان نشانه گذاري بي سيم(Wireless Markup Language) نام دارد. اين مسئله باعث شد تا تمام مؤسسات IT و تجارت الكترونيكي بي سيم، نظامهاي خود را براي هردوي اين نسخه ها پشتيباني كنند.
براي اينكه افراد مجبور نباشد جهت تغيير حامل شبكه ي خود گوشي خود را تغيير دهند، ابزاري به وجود آمده كه «نظام جهاني براي ارتباطات متحرك(Global System for Mobile communication)» يا GSM نام دارد. اين وسيله اجازه مي دهد كه كارت هايي حامل WAP هستند بتوانند از WML استفاده كنند. [9]
نوشته: عليرضا سعادت

استفاده از تمامی مطالب سایت تنها با ذکر منبع آن به نام سایت علمی نخبگان جوان و ذکر آدرس سایت مجاز است

استفاده از نام و برند نخبگان جوان به هر نحو توسط سایر سایت ها ممنوع بوده و پیگرد قانونی دارد