بررسی ساختار وب معنایی وتحول آن در زندگی بشر

X
اگر این مطلب را مفید میدانید، لطفا برای حمایت از ما روی این دکمه کلیک کنید.

چکیده :

در این پروژه به بحث درباره موج آینده توسعه شبکه جهانی وب، موسوم به وب معنایی می پردازد. وب معنایی شیوه ای برای ایجاد یک وب است که در آن رایانه ها می توانند از شبکه ای از داده های منبع استفاده کرده، آنها را تعبیر، تحلیل و پردازش کرده و به کاربر ارائه نماینددر پروژه  به اجمال به توصیف وب معنایی می پردازیم اینکه وب معنایی چیست وچرا نیاز به وب معنایی احساس می شود چکونه با ساختار وب معنایی آشنا شویم .در مطالعه این هدف با مسایل جدیدی مانند RDFو آنتولوژی آشنا می شویم و به بررسی آنها وراهکارهای ارائه شده برای حل مشکلات بوجود آمده می پردازیم .

به کاربردهای وب معنایی و نمونه هایی از این کاربردها اشاره می کنیم.ودر نهایت مقاله با این نتیجه پایان می یابد که وب معنایی نیز همانند خود وب از پایه واساس رشد کرده و ریشه خواهد دواند .وباعث تحولی در زندگی بشری خواهد شد.

مقدمه

می گویند" ژرف ترین فناوری ها آن هایی هستند که دیده نمی شوند" یعنی آن چنان آرام به دنیای ما نفود می کنند که ورودشان را درک نمی کنیم گوئی نامرئی هستند بی آن که در بدو پیدایش وجودشان را احساس کنیم موج می آفرینند، چیزی را منسوخ می کنند دنیا را تغییر می دهند و ناگهان زمانی درکشان می کنیم که دریافته ایم زندگی بدون آن ها تا چه اندازه دشوار است آن زمان است که تازه می نشینیم و درباره آینده آن ها و دگرگونی هایی که ایجاد خواهند کرد سخن می گوییم، رویا می بافیم و هر تحول تازه ای درباره آن را به انتظار می مانیم وب یکی از همین پدیده ها است.

اکنون ما در حال تجربه دومین موج بزرگ دنیای وب هستیم در موج دوم گسترش وصف ناشدنی وب رواج ارتباطات پر سرعت (تر) اینترنتی ظهور برنامه های تحت وب و فناوری هایی چون Ajax و ... بستری را فراهم کرده تا کاربران در تولید محتوای وب و تا حدی ساختار دهی به آن نقش جدی تری ایفا کنند و تنها مصرف کننده نباشند.

با این همه و به رغم همه تحولات صورت گرفته اکنون یک پرسش اساسی مطرح می شود با وجود پیشرفت های وب و نفوذ آن به زندگی روزمره ما نحوه عملکرد این شبکه مستلزم چه تغییراتی است؟ یا به طرو روشن تر به موازات این پیشرفت ها چه تغییرات و دگرگونی هایی برای تعامل با وب و بهره گیری هر چه بیشتر از قابلیت های آن مورد نیاز است؟ در حال حاضر توسعه دهندگان وب جهان گستر با فراهم کردن مقدمات مورد نیاز برای این تغییرات در حال پدید آوردن موج بعدی وب هستند موجی که به آن وب معنایی (semautic web) می گویند تیم برنرزلی در سال 2001 و در مقاله ای که در سایتیفیک امریکن به چاپ رسید ویژگی ها و قابلیت های آنچه را که وب معنایی می نامد ترسیم کرد بر اساس ایده برنرزلی وب جدید وبی هوشمند خواهد بود که با درک محتوای وب و نه صرفاً ارائه داده های روی آن اطلاعاتی به مراتب دقیق تر را در اختیار کاربران خواهد گذاشت در واقع کنسرسیوم وب جهان گستر با همکاری پژوهشگران و دانشگاه ها و دانشمندان در حال فراهم کردن زیر ساخت های وب نوینی است که در آن محتوای تقریباً بی نظم و ساختار وب کنونی ساختاری جدید خواهند داشت با کمک این فناوری های زیر ساختی وب به یک پایگاه داده عظیم یا به طور دقیق تر مجموعه ای از پایگاه های داده متصل به هم تبدیل می شود که در آن ماشین در زمینه جست وجو و استخراج اطلاعات به کمک انسان خواهد شتافت به سبک و سیاق امواج قبلی وب .

فصل اول وب چیست؟

1-1 تاریخچه وب

در اوايل دهه ۱۹۸۰ در موسسه سرن (مركز تحقيقات هسته اى اروپا)، دانشمندى به نام تيم برنرزلى گسترش اتصال درونى رايانه هاى دنيا را مطرح كرد و پيش بينى كرد كه در آينده بتوان به تمام اطلاعات و فايل هاى مرتب مربوط به فيزيك دسترسى يافت. در ۱۹۸۸ اولين برنامه كاربردى فرامتن منتشر شد و در مارس ۱۹۸۹ برنرزلى به همراه روبرت كايليائو براى شروع كار پروژه اى را ايجاد كرد كه از طريق شبكه رايانه اى دستيابى به فرامتن را فراهم مى كرد. پروژه اى به نام «تار عنكبوتى وب» كه شامل شبكه اى از پيوندها بود. در واقع هدف اصلى آن، اشتراك مسائل تحقيقاتى و همكارى ميان فيزيكدانان در نقاط مختلف بود. شبكه وب در ماه مه ۱۹۹۱ پس از تحقيقات گسترده با نام وب در سرن منتشر شد و در سال ۱۹۹۳ به عموم معرفى گرديد. شبكه جهانى وب يكى از جديدترين خدمات اطلاع رسانى در اينترنت است كه نسبت به ديگر ابزارها و خدمات اينترنت به سرعت در حال رشد و گسترش است و بسيارى از صاحب نظران عقيده دارند كه ظهور شبكه جهانى وب با قابليت ارائه تصاوير گرافيكى رنگى، فيلم، صوت و متن همراه با پيوندهاى فرامتنى مهمترين دليل رشد روزافزون استفاده از اينترنت است.

به كارگيرى وب به سرعت در حال افزايش است. طبق گزارش هاى آمارى در ژوئن سال ۱۹۹۳ تنها ۱۳۰ سايت وب بر روى اينترنت قابل دسترسى بود در حالى كه اين ميزان تا ماه ژوئن سال ۱۹۹۵ به بيش از ۲۳ هزار سايت وب رسيد. همچنين طبق برآورد شركت ديناكوئست تا پايان سال ۱۹۹۷ بيش از ۸۰ ميليون رايانه به اينترنت متصل شد كه رشدى معادل ۷۱ درصد را نسبت به سال ۱۹۹۶ نشان مى دهد. CERN در سال ۱۹۹۳ وب را براى استفاده به طور رايگان آزاد اعلام كرد. وب جذب كاربران در خارج از دنياى آموزشى را نيز آغاز كرده است. سازمان سرن، وب را در اختيار علاقه مندان به آن قرار داده است.

1-2 اینترنت و وب

امروزه كاربران كامپيوتر سراسر جهان به استفاده از وب و اطلاعات گرافيكى آن گرايش دارند. از اين روى، اكثر رسانه ها، اكثر كاربران كامپيوتر، و حتى بسيارى از مشاغل online  از اصطلاح «وب جهان پهنا» و «اينترنت» به يك معنى استفاده مى كنند. اما وب فقط بخشى از اينترنت بزرگ است. چون اينترنت شامل Telnet،FTPو حوزه هاى ديگر و همچنين كابل ها، كامپيوترها، و سيم هاى خود شبكه نيز مى شود. وب در بالاى اينترنت قرار دارد و در واقع رابط اينترنت است. يك قرارداد مخصوص اينترنت قرارداد يا پروتكل HTTP، است و اين پروتكل است كه استفاده از وب را در اينترنت ممكن مى ند. مهمترين هدف اينترنت آن است كه كاربران بتوانند از اطلاعات ذخيره شده در كامپيوتر كاربر ديگر بهره بگيرند. وب يك روش جذاب براى بهره گيرى از اطلاعات ذخيره شده در كامپيوترهاى خدمات دهنده (Server) پراكنده شده در اينترنت است. خدمات دهنده هاى FTP، Telnet و ساير خدمات دهنده ها هستند. در واقع، بعضى از شركت ها از يك كامپيوتر براى چند پروتكل مبادله داده هاى مختلف بهره مى گيرند. تنها اختلاف بين خدمات دهنده FTP و خدمات دهنده وب در نرم افزار سازگار با HTTP است كه مى تواند اطلاعات را با برنامه مرورگر مبادله كند. بسيارى از خدمات دهنده هاى وب رده پايين از انواع پى سى هاى مبتنى بر پردازنده هاى اينتل هستند، در حالى كه خدمات دهنده هاى رده متوسط اغلب كامپيوترهاى قدرتمند هستند. خدمات دهنده هاى وب رده بالا معمولاً كامپيوترهاى يونيكس هستند و مى توانند مقدار انبوهى از ترافيك مرتبط با وب را اداره كنند. خدمات دهنده هاى وب و مرورگرهاى وب با استفاده از HTTP با يكديگر ارتباط برقرار مى كنند تا بتوانند داده هاى وب را كه خود به زبان HTML نوشته شده اند مبادله كنند. برنامه مرورگر مى تواند قطعات نوشته شده به اين زبان را تفسير كند و بعد صفحه مرتبط با آن را به نمايش درآورد. رمز وب، در فراپيوندهاى موجود در دل كدهاى HTML است. بنيان وب بر فلسفه فراپيوندها استوار است. هر كلمه يا تصويرى در هر صفحه وب مى تواند يك رابط به يك سند ديگر باشد. دسترسى به اطلاعات در FTP يا Telnetيا هر دو پروتكل مبادله اطلاعات ديگر اينترنت به اين سادگى نيست. وب يك برنامه در حال تغيير و تكامل است و از نقش اوليه خود در ارتباطات دانشگاهى پا فراتر نهاده و براى نشر انواع اطلاعات به شكل جالب توجه براى مخاطبان اينترنت، در نظر گرفته شده است. براى كاربران جديد اينترنت، وب يك رابط چندمنظوره برنامه هاى كاربردى شبكه است كه مرز ميان آنها را پنهان ساخته است. رشد و گسترش كاربرد وب به دليل قابل استفاده بودن در محيط چند رسانه اى همچنان ادامه دارد. HTML زبان جهانى وب است و نيز زبانى است براى تنظيم صفحاتى كه مى توانند انواع اطلاعات متنوع وب را نمايش دهند و همچنين براى ايجاد اسناد و رابطه ميان آنها مورد استفاده قرار مى گيرد. تصاوير رنگى كه بر روى وب ديده مى شود فرم هايى كه پر مى كنيد و نوارهايى كه در حال عبور بر روى صفحه اى ديده مى شود محصولاتى از زبان وب جهانى يا HTML است. شركت هاى نرم افزارى مختلف برنامه هاى خواندن و نوشتن HTML خاص خود را دارند و به فروش مى رسانند، اما هيچ يك مالكيت HTML را ندارند. HTML استاندارد بين المللى است كه توسط فرآيند سياسى پيچيده اى نگهدارى و روزآمد مى شود و تا به حال به شكل بسيار خوبى عمل كرده است. مرورگر وب برنامه اى است براى تبادل اطلاعات با خدمت دهنده هاى وب موجود در اينترنت. با برنامه مذكور مى توان اسناد مورد نظر را نمايش داد. هر مرورگر بايد حداقل قادر به درك HTML و نمايش متن باشد. اما توقع كاربران اينترنت در طى سال هاى اخير افزايش يافته است. يك مرورگر وب بسيار ايده آل، تجربه چند رسانه اى كاملى را با تصاوير، صدا، ويديو، و حتى تصاوير سه بعدى در اختيار مى گذارد. عموماً firfox , opera و   Internet Explorer شركت ميكروسافت مشهورترين مرورگرها هستند اولين مرورگر وب موزائيك ناميده مى شد و هم اكنون نيز ويرايش هاى جديدى از آن در دسترس است. در ژانويه ۱۹۹۲ از طريق FTP در اختيار عموم قرار گرفت

1-3  وب 1

از سال ۱۹۸۹ که وب توسط آقای «برنرزلی ابداع شد جنبشی به وجود آمد که بیایید همه چیز را از روی کاغذ به اطلاعات الکترونیکی تبدیل کنیم. افراد و شرکت‌ها تلاش می‌کردند محتوای کاغذی خود را به محتوای دیجیتالی تبدیل کنند. جنبش پر سرعت دیجیتالی شدن اطلاعات سبب شد که کاربران امکان دسترسی به انبوهی از اطلاعات را داشته باشند در ابتدا سایتهایی بوجود آمدند که حاصل ارائه یک سری اطلاعات توسط اشخاص خاص بود این اطلاعات از طرف آنها بر روی  سایت قرار می گرفت و بازدید کنندگان وب سایت هیچ هیچ نقشی در ایجاد تغییر و یا تعیین میزان تطابق با واقعیت را نداشتند .

به تدریج کاربران با انبوهی از اطلاعات رو به رو شدند که خود یک مشکل محسوب می‌شد. باید راه حلی پیدا می‌کردند. از این جا بود که کم کم نرم افزارهای مبتنی بر وب به کمک کاربران آمدند. هر روز انبوهی از مطالب و اخبار در وب سایت‌ها و وبلاگ‌های مختلف به زبان فارسی منتشر می‌شود. تصورش را بکنید که شما به عنوان یک کاربر چگونه می‌توانید از تمام اخبار مهم و مطالب جالب مطلع شوید؟و به این صورت موج جدیدی از وب در حال شروع بود.که همه ی این مسائل را حل می کرد.

1-4  چهره های گوناگون وب:

چهره‌هاي گوناگون وب را نخستين‌بار بیل جوی [8]در سال 2001در شركت سان مطرح كرده است و در ادامه اين چهره‌ها را اين چنين تقسيم‌بندي نموده است:

1)وب سنتي يا وب نزديك: همان وبي كه مي‌شناسيم و با آن به طور روزمره سروكار داريم. به‌طور معمول نيز براي كار با اين وب نيازي به نصب نرم‌افزارهاي اضافي نيست.

2) وب سرگرم‌كننده يا وب راه‌دور: با اين وب مي‌توان به محتواي ديداري و شنيداري دسترسي داشت كه به زودي آن‌ها روي ساعت‌هاي مچي، PDA ها و تلفن‌هاي همراه نيز خواهند آمد.
3) وب فراگير يا وب ابزاري: در اين وب ماشين‌ها با زبان مشترك جاوا با يكديگر صحبت مي‌كنند و كليه ادوات در يك محيط ارتباطي با يكديگر تعامل مي‌نمايند. هوشمندي زيادي در ادوات متصل به اين وب ديده مي‌شود و اغلب دستگاه‌ها خود تنظيم هستند.  

4) وب براي تجارت الكترونيكي: وبي كه داراي ترافيك داده‌اي زيادي است و مبادلا‌ت مالي و سفارش‌ها را انجام مي‌دهد.

5) وب پيراموني: ارتباط‌ دهنده شما با ايميل و وب‌سايت‌هايي كه با آن‌ها به طور روزمره كار داريد.
6) وب صوتي: اين وب توانايي آميختن و يكپارچه شدن با سرويس‌هاي درخواستي را دارد.
چهره های گوناگون وب زمانی مطرح شدند که بحثی از وب2 نبود،اما در واقع چهره‌هاي ششگانه وب بذر ايجاد تفكري جديد در استفاده از فناوري و خدمات بودند که این تفکر چیزی نبود جز وب2

1-5  وب 2

تركيدن حباب دات كام در پاييز 2001 نقطه عطفي براي وب بود. استنباط بسياري از افراد ‌اين بود كه وب بيش از حد در كانون توجه قرار گرفته است و‌اين حقيقت را گوشزد مي‌كردند كه ظاهرا ً رشد انفجاري و پس از آن ركود و نزول، ويژگي مشترك تمام انقلاب‌هاي تكنولوژيك است.

وب2، مثل بسياري از مفاهيم مهم ديگر، محدوده قطعي و كاملا مشخصي ندارد. ولي در مقابل، حول هسته‌اي محكم و متمركز شكل‌گرفته‌است. وب2 را مي‌توان به‌صورت مجموعه‌اي از اصول و شيوه‌ها در نظر گرفت كه منظومه‌اي كامل از سايت‌ها، كه همه يا بعضي از‌اين اصول را دنبال مي‌كنند، در حول هسته آن با فواصل كم وزياد قرار گرفته‌اند.  

1-6  وب 3

نسخه سوم وب تازه در حال متولد شدن است. با این که هنوز نمی توانیم در مورد این کودک زیاد حرف بزنیم اما می‌توان گفت که قرار است که فرزند جدید وب بچه باهوشی باشد. در وب ۳.۰ بحث اصلی در مورد هوشمند شدن وب است. پیش بینی می‌شود که در آینده نزدیک کامپیوتر ها، محتوای وب را می‌فهمند و آن را درک می کنند.  اگر در متنی کلمه «تبیان» آمده باشد نرم افزاری که در حال خواندن این متن است می‌داند که سایت تبیان چیست و چه مطالبی در آن نوشته می‌شود. اگر در متنی نوشته شد «اول فروردین» نرم افزار متن را به نوروز ربط می‌دهد.

این درک اطلاعات توسط نرم افزارهای مبتنی بر وب سبب می‌شود که جستجو و حرکت در اطلاعات بسیار سریع تر و بهینه تر از قبل بشود. نرم افزار ها قادر به شناسایی افراد، مکان ها، رویداد ها و ارتباط آن ها با یکدیگر خواهند بود. ارتباط متقابل اطلاعات با یکدیگر و قابلیت دسترسی به اطلاعات با هر نوع دستگاه ارتباطی از دیگر مشخصه‌های وب نسخه سوم خواهد بود.

1-7  مقایسه وب 1 , وب2 ,  وب3

سیر تکاملی وب رو میشه از دیدگاه های مختلف مورد بررسی قرار داد.

1-7-1  دیدگاه اول: تولید محتوا

وب 1: متشکل از سایتهایی است که محتوای آن توسط افرادی خاص و یا از منابعی خاص ارائه میشود. و کاربران وب فقط مصرف کننده هستند.

وب 2: متشکل از سایتهایی است که محتوای آن توسط کاربران آن تولید میشود. و هر کاربر میتواند هم مصرف کننده و هم تولید کننده محتوا باشد. (وبلاگها، ویکی ها، اجتماعات اینترنتی و …)
وب 3: کاربران علاوه بر محتوا میتوانند سایتها را هم بنا به نیاز خود تغییر دهند و خصوصی سازی(customize) کنند. (Facebook, iGoogle  …)

1-7-2  دیدگاه دوم: ماهیت محتوا

وب 1: سایتها حاوی اطلاعاتی هستند که فقط توسط انسان قابل خواندن است.

وب 2: سایتها حاوی اطلاعاتی هستند که محتوا از ظاهر جدا شده و ساختار محتوا نیز مشخص شده

است. (ساختار محتوا با div و چیدمان باcss  )

وب 3: ماهیت محتوا از «اطلاعات» قابل خواندن توسط انسان به «دیتا» در قالب xml تغییر می یابد و امکان استفاده سایر application ها از داده ها و نمایش با استفاده از xslt فراهم میشود. به عبارت دیگر وب3 یک پایگاه داده عظیم خواهد بود. به همین دلیل آنرا «Data Web» نیز می نامند. (rss , opml  …)

1-7-3  دیدگاه سوم: از لحاظ ارتباطی

وب 1: متشکل از سایتهایی است با ماهیت نسبتا مستقل نسبت به یکدیگر.

وب 2: متشکل از سایتهایی که به وسیله شبکه های اشتراکی به صورت یکپارچه به یکدیگر پیوند

خورده اند. (del.icio.us ، digg ، technorati و … )

وب 3: متشکل از سایتهایی که از طریق داده های xml و webservice ها با سایتهای دیگر در ارتباط هستند و محتوا و کارایی سایر سایت ها را در خود جای داده اند facebook و    googlereaderو …

1-7-4  دیدگاه چهارم: رابط کاربری

وب 1: تعامل کاربر با سایت بسیار محدود است. تمام پردازش ها سمت سرور انجام میگیرد. فقط

اطلاعات به مرورگر ارسال میشود.

وب 2: به کمک جاوااسکریپت و dhtml و ajax بخشی از پردازش اطلاعات در سمت کاربر صورت میگرید، مرورگر با کاربر تعامل دارد و به event های کاربر پاسخ میدهد. در واقع سایت های وب تبدیل به application های تحت وب میشوند.

وب 3: برای استفاده از وب دیگر نیازی به مرورگر نیست. وب فقط شامل داده ها و webservice هاست و در واقع application ها فقط thin client هایی هستند بر روی کامپیوتر کاربران که با وب در تعامل هستند. از آنها میتوان حتی در حالت آفلاین نیز استفاده کرد. (AdobeAIRGoogle Gears)

1-7-5  دیدگاه پنجم: تکنولوژیهای غالب

وب 1:HTML

وب 2:HTML و CSS و جاوااسکریپت و Ajax و DHTML و JSON

وب 3: XML و WSDL و SOAP و XSLT و XQuery و …

فصل دوم وب معنایی چیست؟

وب پدیده ایست که درتمام حوزه های زندگی بشری تاثیر گذاشته واین تاثیر هر روز بیشتر هم می شود .بطوریکه اکنون بحثی بنام  science   پیش آمده که دانشگاه  mit و دانشگاه  southamp  به صورت مشترک در حال انجام فعالیتهای تحقیقاتی روی آن هستند وحتی در این زمینه دوره های آموزشی نیز به راه انداخته اند به همین دلیل وب را از جنبه های مختلف بررسی می کنند یکی جنبه های فنی این پدیده و دیگری جنبه های غیر فنی ان همچون بررسی وب از منظر جامعه شناختی و موضوع تبدیل شدن وب به رسانه ای ((mediaاست که روزانه میلیون ها و شاید میلیاردها نفر برای نیازهای مختلف از ان استفاده می کنند مثلا کودکی که به دنبال بازی در وب می گردد یا محققی که مقالات روز با مطالب جدید را جستجو می کند.

بنابر این ما امروز با یک پدیده جدید مواجه هستیم که از تولد ان زمان زیادی نگذشته و هنوز مدت عمومیت یافتن ان به بیست سال هم نرسیده است.یکی از دلایلی که وب به این صورت رشد کرد (به طوری که میگویند در حال حاضر بیش از یازده میلیارد صفحه وب قابل ایندکس شدن داریم)این است که وب در ابتدا به شکلی بسیار ساده به راه افتاد.یعنی اقای برنر زلی که از او به عنوان مخترع وب یاد می کنند با ابعاد HTML مکانیزم ساده ای را طراحی کرد تا هر فرد به کمک ان بتواند یک صفحه وب یا وب سایت ایجاد و ان را منتشر کند.او این مکانیزم را به ساده ترین شکل ممکن طراحی کرد به طوری به هیچ ابزار یا سیستم خاصی وابسته نباشد.همین امر باعث شد تا شاهد رشدنمایی وب باشیم اما این رشد مشکلاتی را به دنبال داشته که یکی از انها بحث جستجو یاSerch است. امروزه موتور های جستجو برای ارائه نتایج با کیفیت از تکنیک های مختلفی استفاده می کنند.اما ما همچنان شاهد این قضیه هستیم که نتایج جست و جو هر روز بدتر می شود . دلیل این امر حجم وسیع اطلاعاتی است که هر روز در حال اضافه شدن به وب است.با این اوصاف یکی از مشکلات اساسی ما بحث  جست و جو است و هر چه بیشتر پیش می رویم وضعیت بدتر خواهد شد. زیرا به هر حال تکنیک های بازیابی اطلاعات تا حد مشخصی می توانند دقت جست و جو را بالا تر ببرند که از ان حد بیشتر امکان پذیر نیست و این مسئله ای جدی است. یکی از راه حل های جایگزین برای حل این مسئله این است که ما نحوه ی تولید اطلاعات در وب را عوض کنیم یعنی ما از اصطلاح information web یا وبی مشتمل بر اطلاعاتی که فقط انسان ان را می فهمد به سمت data web  حرکت کنیم.data web در واقع اصطلاح دیگری است که به جای semantic web  به کار می رود

2-1 تعریف وب معنایی

وب معنایی‎ را می‌شود فضایی جهانی از جنس محاسبات هوشمند ماشینی تصوّر کرد که در آن تمامی کتاب‌ها، کتاب‌خانه‌ها دانشها، دانش‌نامه‌ها و دانشگان‌ها پایگاه‌های دانش‌ ( Knowledge bases) به صورتی معنی‌گرا و با توانایی درک مفهومی همدیگر در کنار هم قرار خواهند گرفت. آقای Tim Berners-Leeآینده وب را بصورتی بیان کرده که بر خلاف وب کنونی فقط توسط انسانها قابل فهم نباشد بلکه توسط ماشین ها نیز قابل درک و پردازش است در زیر سه تعریف مختلف از وب معنایی ارائه شده است:

  • پروژه‌ای با هدف ایجاد رسانه‌ای جهانی برای رد و بدل کردن اطلاعات بصورتی که برای کامپیوتر قابل فهم و پردازش باشد.
  • وب معنایی، شبکه‌ای از اطلاعات در مقیاس جهانی است به نحوی است که پردازش آنها توسط ماشین ها به سادگی امکان پذیر است.
  • وب معنایی شامل داده‌های هوشمند وب است که توسط ماشین ها قابل پردازش است.

هر چند نزدیکی به تحقّقّ ایجاد چنان فضایی محتاج پیشرفت‌هایی جدید و کلّی‌نگرانه در بسیاری از زمینه‌های مهندسی، ریاضی، هوش مصنوعی، و به ویژه در زبان‌شناسی، فلسفه، و بسیاری از معارف دیگر انسانی خواهد بود، گام‌های اوّلیّه در این سمت برداشته شده است.

2-2  شناخت وب معنایی

برای شناختن وب معنایی باید چندین موضوع را مورد بررسی قرار دهیم:

1-شرایط فعلی دنیای IT

2- نیاز کنونی دنیای IT

3- راه حل های موجود برای رفع مشکل کنونی دنیای It

4- آشنایی با تک تک فناوری های به کار رفته در مبحث وب معنایی

5- چگونگی برقراری تعامل فناوری های به کار رفته در وب معنایی با هم و تأثیرات آن ها بر یکدیگر

برای این که بتوانیم بحث را کمی بازتر کنیم باید ابتدا شرایط کنونی دنیای IT را مشخص می کنیم در دنیای امروزه به رغم پیشرفت های بسیار زیادی که انجام شده است همچنان انتقال اطلاعات از طریق بستری به نام انسان انجام می شود و کامپیوترها شبکه ها و به بیان جامع تر و دقیق تر ماشین ها فقط به انتقال داده ها می پردازند ( توجه کنید که اطلاعات از پردازش داده ها به دست می آیند). از سوی دیگر در دنیای امروز ما با حجم انبوی از داده ها روبه رو هستیم اگر بخواهم دقیق تر بیان کنم به نقل از روزنامه نیویورک تایمز در سپتامبر سال 2005 یعنی دقیقاً در همان سالی که وب معنایی چهره عملیاتی به خود گرفت گوگل تعداد 336/684/168/8 صفحه وب را مورد پیمایش قرار می داد. ( پیدا کردن این که در سال 2009 این عدد چه قدر است را به عهده خودتان می گذارم داده بیشتر به معنی اطلاعات بیشتر است و بدیهی است که به دست آوردن همه اطلاعات از داده ها در توانایی یک انسان نیست از طرف دیگر سیستمی وجود ندارد که بتواند خروجی این حجم داده را برای انسان تعبیر کند و به بیان دیگر شما می توانید با یک موتور جست وجوی امروزی مانند گوگل داده های بیشتر از هشت میلیارد صفحه وب را جست وجو کنید به عنوان مثال شما در سایت  گوگل عبارت مجله شبکه را جست و جو می کنید و گوگل به شما 000/670/1 خروجی می دهد در اینجا کدام یک از جواب ها مورد نیاز شما است؟ آیا شما می توانید تمام این صفحات را بررسی کنید؟ مشکل اصلی هم همین است موتوری وجود ندارد که داده های به دست آمده از موتور جست و جو را برای شما تعبیر کند )این تعبیر از هر جنبه ای می تواند باشد مثلاً کیفیت) این وظیفه خود شما است که داده های به دست آمده را تعبیر کنید یعنی به دست آوردن اطلاعات از داده ها به عهده خود شما است: توزيع کننده بار مي تواند از سياست هاي تطبيقي که از اطلاعات زمان اجرا مانند مقدار زمان استفاده از CPU در سرويس دهنده ها بهره مي برند، براي انتخاب تکرار، استفاده کند

2-3  نیاز کنونی دنیای IT

در حقیقت نیاز کنونی دنیای IT را با دو مثال می توانیم مشخص کنیم مثال اول شما می توانید در سایت گوگل لغت شبکه را جست و جو کنید جوابی که گوگل به شما می دهد به ترتیب شامل مواردی مثل شبکه هتل های ایران شرکت خدمات میزبانی سایت، شبکه کارمندان ایرانی کانادایی شبکه مدرسه سازمان بورس اوراق بهادار و ... است که در این جست و جو از 5280000 پاسخ گوگل بیشتر آن ها به درد شما نمی خورد از سوی دیگر مواردی که ذکر کردم همگی از جمله مواردی هستند که در صفحه اول پاسخ جست و جو دیده می شود.  مثال دوم من به دنبال شرکتی می گردم که خدمات میزبانی سایت ارائه کند پس در گوگل جست و جو می کنم خدمات میزبانی سایت و 3660000 پاسخ دریافت می کنم که به طور قطع زمان ندارم همه آن ها را چک کنم از سوی دیگر می دانم که می خواهم سرور دارای SQL server باشم نیازمند پشتیبانی 24 ساعته هستم پس این بار جست وجو می کنم خدمات میزبانی سایت سرور کانادا ارزان پشتیبانی 24 ساعته SQL server و گوگل جوابی ندارد حال اگر من بخواهم علاوه بر موارد فوق میزبان سایت امکان پشتیبانی از پنج زیر دامنه حجم انتقال اطلاعات بیشتر از بیست گیگابایت ارائه تعداد نامحدود آدرس ایمیل و ... را داشته باشد چگونه می توانم جواب خود را پیدا کنم؟ در حقیقت نیاز دنیای IT اول دسته بندی درست اطلاعات و دوم همگن کردن اطلاعات مربوط به هم و ارائه درست این اطلاعات به کاربر بر اساس نیاز او است.

2-4   اهدف وب معنایی

هدف از توسعه وب معنایی ساختارمند کردن داده ها اضافه کردن معانی آن ها و در نهایت بازنمایی دانش به کمک ماشین با استفاده از فناوری ها و استانداردهایی است که به وسیله کنسرسیوم وب جهان گستر در حال تدوین و تکمیل هستند.

به عبارت دیگر در وب معنایی ماشین ها با درک داده ها در فرایند تحلیل و استخراج اطلاعات مورد نظر کاربر مشارکت کرده و در این زمینه هوشمندانه تر عمل می کنند در وب معنایی موتورهای جست و جو و Agent  های نرم افزاری بیش از پیش بر مفهوم داده ها و جدا سازی آن ها مسلط هستند در حقیقت وب معنایی بر فناوری ها و استانداردهایی استوار است که این شبکه جهانی را به یک پایگاه داده عظیم تبدیل خواهد کرد.

در وب معنايی قرار است ماشين ها (روبات ها، سرور ها و كامپيوتر ها) توانايی فهم محتويات اينترنت را داشته باشند. در اين ساختار ماشين ها بايد بتوانند با هم ارتباط برقرار كنند نه فقط با انسان.

واضح تر اينكه وقتی يك ربات وبكاو جمله ای را بخواند بايد بتواند از نظر دستور زبان آن جمله را بفهمد يعنی اينكه بتواند فاعل ، مفعول و گذاره ای كه در آن جمله آمده را درك كند و اگر يك پاراگراف را بخواند، بايد بتواند نوع وابستگی جمله ها را با يكديگر را تشخيص دهد. وب معنايی در حقيقت وبی است كه در بخش طبقه بندی و بازيابی محتوای اينترنت به تكامل رسيده باشد (در اين باره بعد ها باز خواهم نوشت

در ساختار معنايی وب وقتی كاربر يك جمله محاوره ای را جستجو می كند، موتور جستجو  بايد بتواند مفهوم جمله را تشخيص دهد، اينكه سوالی است يا خبری، طنز است يا جدی، علمی است يا از نوع سرگرمی. بنابراين وب جديد بايد چنان در زبان شناسی و فلسفه تجهيز شود كه تمام محتويات وب را بتواند آنلاليز كرده و ميزان وابستگی بخش ها را از طريق رسم گراف ها تعريف كند.

در بحث دیتا وب موضوع این است که همان طور که در پایگاه های داده رابطه ای (relational)می توانیم به داده های نظام یافته Queryبزنیم و از این پرس و جوها نتایج صد در صد دقیقی به دست اوریم همین کار را در وب نیز انجام دهیم.البته وب قابل با یک پایگاه داده نیست و برای رسیدن به این هدف به ابزارهای بسیار گسترده  و تحقیقات مفصلی نیاز است.هدف پزوهشگران فعال در زمینه ی وب معنایی تحقق این امر است به بیان دیگر اکنون تلاش ها بر این موضوع متمرکز شده تا تا فضایی اطلاعاتی ایجاد کنیم که برای انسان و ماشین نیز قابل فهم و پردازش باشد طبیعتا اگر چنین فضایی ایجاد شود ما می توانیم بسیاری از کار ها را به ماشین بسباریم .

یعنی مشابه مثال خیالی مطرح شده توسط آقای برنزلی در مقاله خود در نشریه ساینتیفیک امریکن:

“سیستم در حال پخش موسیقی بود که تلفن به صدا در آمد به محض این که پیت گوشی را برداشت دستگاه تلفن او به طور خودکار صداهای اطراف را با فرستادن پیامی به تمام وسایل پیرامونی که دارای کنترل درجه صدا بودند گم کرد آن سوی خط خواهرش لوسی صحبت می کرد که در مطب دکتر به انتظار نشسته بود باید یک پزشک متخصص مادر را معاینه کند و بعد هم به چند جلسه فیزیوتراپی احتیاج دارد، احتمالاً هر دو هفته یک بار من دارم Agent خودم را برای تنظیم وقت ملاقات ها برنامه ریزی می کنم پیت بلافاصله موافقت کرد رساندن مادر به درمانگاه را به عهده بگیرد.

در مطب دکتر لوسی Agent وب معنایی خود را از طریق مرورگر وب دستی اش تنظیم کرد Agent فوراً اطلاعات معالجه تجویز شده برای مادرش را از طریق Agent دکتر دریافت و جست و جو برای یافتن داروهای مورد نظر را در میان فهرست ارائه کنندگان خدمات  پرشکی آغاز کرد Agent ارائه کنندگانی را کنترل می کرد که با شرکت بیمه مادر لوسی طرف قرارداد هستند تا شعاع بیست مایلی از خانه او قرار دارند و در سرویس رتبه بندی از نظر اطمینان رتبه عالی یا بسیار خوب را کسب کرده اند Agent سپس تلاش کرد تا با توجه به وقت ملاقات های موجود  تعیین شده به وسیله Agent های ارائه کنندگان مستقل خدمات از طریق وب سایت آن ها و برنامه کاری پیت و لوسی زمانی را تنظیم کند ظرف چند دقیقه Agent برنامه مورد نظر را ارائه کرد.

با وجود هماهنگ بودن Agent پیت و لوسی پیت از آن راضی نبود زیرا بیمارستان دانشگاه نسبت به خانه مادر شدر محل بسیار دوری قرار داشت و او مجبور بود در ساعات اوج شلوغی رانندگی کند بنابراین او Agent خود را طوری تنظیم کرد که جست و جو را با اولویت های مکانی و زمانی دقیق تر تکرار کند Agent لوسی با داشتن اطمینان کامل به Agent پیت درباره وظیفه کنونی به طور خودکار با اعطای مجوزهای دسترس و میان برهای مربوط به داده هایی که از قبل طبقه بندی کرده بود به آن کمک کرد.

برنامه جدید تقریباً به صورت بی درنگ نمایش داده شد کلینیکی بسیار نزدیک تر وقت ملاقاتی زودتر از وقت قبلی در عین حال دو پیام هشدار نیز به نمای شدر آمد نخست این که پیت باید تعدادی از قرار ملافات های کم اهمیت خود را تغییر می داد او آن ها را بررسی کرد و دریافت که این موضوع چندان مهم نیست پیام دوم درباره ثبت نبودن نام تأمین کننده مذکور تحت عنوان فیزیوتراپ در فهرست شرکت بیمه طرف قرارداد آن ها بود با این حال Agent به او اطمینان داد نوع سرویس و وضعیت بیمه با اطمینان تحت عنوان موارد دیگر شناسایی شد ارائه جزئیات درست زمانی که پیت داشت زیر لب می گفت جزئیات را نمایش نده لوسی با انتخاب کلید تأیید موافقت خود را با برنامه جدیدی اعلام کرد....”

البته شاید این مثال در حال حاضر تا حدی دور از دسترس به نظر آید.اما در صورتی که چنین بستری فراهم شود چندان هم غیر عملی نیست .بعدها برنزلی اذعان کرده بود که سناریوی تخیلی او بیش از حد غیر واقعی  و تحقق آن مستلزم پیشرفت های فنی دیگری است اما به هر حال از زمان طرح آن موضوع تاکنون تلاش های زیادی صورت گرفته و دستاوردهای مهمی در این زمینه حاصل شده است.

فصل سوم ساختار وب معنایی

3-1  لایه های وب معنایی

می دانید که داده یا دیتا چیزی است که ماشین می تواند آنرا پردازش کند در مقابل اطلاعات یا  information  تا حدی پردازش شده و چیزی است که انسان ان را درک می کند بنابراین ما به دنبال بازنمایی اطلاعات هستیم و می خواهیم وبی داشته باشیم که در آن ماشین با سرزدن به یک وب سایت بداند که معنای هر یک از آیتمهای موجود در آن چیست مثلا در وبسایت یک شرکت مشخصات محصولات شامل نام  ویژگیها و ... نوشته شده که با توجه به بصری بودن آن برای من کاربر قابل فهم است اما ماشین آنرا نمی فهمد .زیرا محتوای وب سایت شرکتهای مختلف ممکن است به اشکال و قالب های متفاوتی ارائه شده باشد .زیرا  HTML  اساسا یک زبان  VISUAL است و برای انسان هم طراحی شده است  TAG  هایی که در  HTML  وجود دارند محتوا را نشان نمی دهند بلکه نمایانگر نحوه نمایش آنها ست مثلا می گوید رنگ این بخش چگونه باشد یا فلان جدول کجا قرار گیرد .و... . یعنی نمی تواند محتوا را برای ماشین متمایز کند به همین دلیل است که موتورهای جستجو نمی توانند بفهمند که یک صفحه وب درباره چه موضوعی صحبت می کند. در واقع آنها فقط تعدادی کلید واژه و عبارت را ایندکس می کنند و پس از آنکه کاربر پرس و جو هایی را ارسال کرد .بر اساس آنها نتایجی را ارائه می کند. یکی از اهداف وب اینست که ما بتوانیم بعضی از کارها را به ماشین محول کنیم مثلا هنگامی کهقصد مسافرت دارید .و می خواهید بلیط طاریا محل خود را رزرو کنید برای اینکا باید به وب سایت ارائه کنندگان این موارد مراجعه کنید .بگردید و بالاخره با توجه به زمانهای منطبق با وضعیت خود مواردی را انتخاب کنید .بر اساس اهداف وب معنایی در صورتی که داده های ما به گونه ای بازنمایی شوند که ماشین آنها را بفهمد .تمام این فرآیند خود ماشین انجام خواهد داد .یعنی ما تنها به ماشین می گوییم که تاریخ رفت و برگشت ما چه زمانی خواهد بود.و ماشین بقیه کارهارا مانند یک  AGENT  انجام می دهد .برای رسیدن به این هدف معماری خاصی تدوین شده است و اساسا همین معماری و لایه بندی گویای بسیاری از چیزها است .چیزی که از ابتدا در مورد پیاده سازی وب معنایی در ذهن اعضای  W3C  وجود داشت این بود که چنین امری با توجه به حجم زیاد اطلعات موجود در وب یک شبه محقق نخواهد شد .بنابراین بر اساس یک فلسفه پیشرفت گام به گام چارچوبی لایه ای و از پایین به بالا طراحی شد .

3-2  لایه   XML

XML 1-2-3  چیست؟

در ابتدا لازم است با کلمات تشکيل دهنده XML يعنی Extensible ، Markup و Language آشنا شويم  .Markup ، واژه ئی برای متاديتا است . متاديتا ، اطلاعاتی در رابطه با اطلاعات است . قدمت استفاده از Markup به قبل از کامپيوتر بر می گردد . مثلا" در دنيای نشر از علائم خاصی  در متن های ويرايش شده استفاده تا به پردازنده متن ( انسان و يا ماشين ) اعلام شود ، چه نوع عملياتی را در رابطه با اطلاعات می بايست انجام دهد. HTML يکی از زبان های کلاسيک نشانه گذاری است . مثلا" با افزودن تگ <Bold> به مرورگر اعلام می شود که به چه صورت می بايست اطلاعات نمايش داده شوند .   

زبان (Language) ، به مجموعه ای از کلمات معنی دار و با مفهوم  که عده ای از آنها برای بيان خواسته ها ی خود استفاده می نمايند ،اطلاق می گردد . ( مثلا" زبان فارسی و يا انگليسی )
با کنار هم قرار دادن دو واژه اشاره شده ، با  زبان نشانه گذاری مواجه خواهيم شد  . زبان نشانه گذاری ، به مجموعه ای از کلمات معنی دار و با مفهوم که توسط عده ای (با آگاهی لازم انتخاب ) استفاده می گردد ، اطلاق می گردد. HTML ، نمونه ای مناسب در اين زمينه است . تمام افرادی که از تگ های HTML استفاده می نمايند ، بدرستی نسبت به مفهوم و جايگاه هر يک از تگ ها آشنائی داشته و با آگاهی کامل آنها را برای بيان خواسته های خود استفاده می نمايند. مثلا" مشخص است که استفاده از تگ <H1> چه نوع پيامدهائی را بدنبال خواهد داشت . تگ فوق ، توسط مولفين صفحات وب آگاهانه انتخاب می گردد و مرورگرها نيز متناسب با تعاريف  از قبل  مشخص شده ، واکنش مناسب خود را در رابطه با  نحوه نمايش انجام خواهند داد.  يک زبان بسط پذير(Extensible)  ، زبانی است که دارای  مکانيزم لازم  برای افزودن کلمات بگونه ای  است  که توسط ساير استفاده کنندگان نيز قابل فهم باشد . در دنيای واقعی و در ارتباط با زبان های طبيعی ما هرگز شاهد چنين وضعيتی نخواهيم بود . ( افزودن يک واژه با معنی مورد نظر خود و استفاده از واژه با همان معنی توسط ساير استفاده کنندگان )  با توجه به تعاريف ارائه شده ، يک زبان نشانه گذاری بسط پذير ، می بايست يک زبان نشانه گذاری با قابليت افزودن کلماتی بيشتر  باشد . در عمل زبان نشانه گذاری بسط پذير ، به سيستمی برای تعريف تمام زبا ن های نشانه گذاری با قابليت توسعه وضعيت موجود ، اطلاق می گردد .

  2-2-3  کاربردهای XML

از XML در موارد زير می توان استفاده کرد :

  • مبادله اطلاعات بين برنامه های نامتجانس ، بنگاه های تجاری و بانک های اطلاعاتی
  • امکان فعال نمودن مدلی برای  نمايش اطلاعات يکسان بر روی دستگاههای متفاوت با  اهداف و خوانندگان گوناگون 
  • يک قالب ذخيره سازی مناسب برای داده ها 

با استفاده از XML ، می توان تگ های نشانه گذاری را تعريف که توسط مجموعه ای از مستندات که خصايص مشابهی را به اشتراک می گذارند ،استفاده گردد . مثلا" مجموعه ای از پيام های تجارت الکترونيکی. مورد فوق اصطلاحا" document type ناميده می گردد . ( مشابه يک کلاس در طراحی شی گراء ) . يک Document instance ، نوع خاصی از يک سند است . مثلا" يک ليست فروش خاص . در پروژه های XML ، در ابتدا Document types با توجه به اطلاعاتی که می بايست بر روی آنها عملياتی صورت پذيرد ،  طراحی و در ادامه با ايجاد نرم افزارهای لازم ، اقدام به ايجاد و پردازش نمونه هائی از سند می گردد .  XML مجموعه ای قدرتمند از بلاک های ساختمانی  سطح پايين بمنظور طراحی Document types را ارائه می نمايد.  نمونه سند زير، شامل مجموعه ای  اطلاعات از يک بانک اطلاعاتی شخصی است.

Html  3-2-3 ومشکل آن در ساخت مفاهیم وب معنایی

Html بعنوان اسنانداردی جهت نمايش اطلاعات در عرصه وب ، سالها است که مطرح و استفاده می گردد. تگ های Html مسئوليت تبين نحوه نمايش اطلاعات را بر عهده خواهند گرفت . تکنولوژی فوق برای انجام وظايف محوله از پيش فرض های تعريف شده و ثابت (ايستا ) استفاده می نمايد . مثلا" با مشاهده تگ <B> دقيقا" مشخص شده است که می بايست چه نوع واکنشی صورت پذيرد. ( پر رنگ نمودن متن مورد نظر ) . نبايد انتظار داشته باشيم که با درج تگ <B> عملياتی غير از آنچه از قبل تعريف شده است صورت پذيرد. مفسر تگ های Html پس از انجام تفسير مربوطه ، واکنش از قبل تعريف  شده ای را از خود نشان خواهد داد. مرورگرها بکمک مفسر های مربوطه همواره شرايط يکسانی را برای نمايش فراهم و شرايط خود را بر همه چيز منجمله سليقه و نقطه نظرات طراح و ... ترجيج می دهند. خودخواهی در نمايش و تحميل شرايط مربوطه از نکات قابل تامل در تکنولوژی فوق است . Html محدوده و مرزی را برای تفکيک داده ها از نمايش قائل نگرديده و با تلفيق دو مقوله فوق همواره از يک روش ثابت برای نمايش داده ها استفاده می نمايد. فرض کنيد که يک فايل html داشته و بخواهيم زمانيکه برای کاربر ارسال می گردد در مرورگر مربوطه ، به دو صورت کاملا" متمايز نمايش داده شود . برای نيل به خواسته فوق چاره ای نيست مگر اينکه دو فايل مجزای html را ايجاد که هر يک دارای خروجی اختصاصی خود باشند. در مثال فوق قصد ما نمايش داده های يکسان با فرمت های متفاوت از بعد نمايش است . ما بدنبال روش و يا روش هائی هستيم که قادر به تفکيک بين داده و نمايش باشد. قطعا" Html در اين راستا گزينه ای مناسب نخواهد بود. سندهای Html از تگ هائی نظير <H1> و <P>  بمنظور ايجاد ساختار و از تگ هائی نظير <I> و <Font> بمنظور ايجاد فرمت نمايش اطلاعات استفاده می نمايند . در اين راستا عملا" هيچگونه تگی که نشاندهنده نوع اطلاعات و محتويات سند باشد ، وجود ندارد .بدين ترتيب مفسر  قادر به تفسير تگ های فوق صرفا" در حد نمايش اطلاعات بوده و امکان انجام هيچگونه پردازشی  وجود نخواهد داشت .

  4-2-3حل مشکل با  xml

 Xml بين دو مقوله داده و نمايش تفکيک قائل شده است. در تکنولوژی فوق بدليل عدم وجود تگ های از پيش تعريف شده برای نمايش اطلاعات می توان سناريوی مربوط به نحوه نمايش اطلاعات را بکمک يک تکنولوژی ديگر تعريف و تبين نمود. اطلاعات ذخيره شده بصورت Xml را می توان با حالات متفاوت و اعمال سناريو های متفاوت نمايش داد. برخلاف Html تکتولوژی Xml دارای اطلاعات از قبل تعريف شده و مشخصی برای نحوه نمايش اطلاعات نيست. تگ های تعريف شده در يک سند XML  ، بصراحت ساختار و محتويات را ارائه خواهند داد . در اين حالت می توان نرم افزارهائی را طراحی نمود که قادر به انجام عمليات دلخواه بر روی اطلاعات موجود در سند XML باشند . هنوز يک مسئله وجود دارد : در تگ های تعريف شده در سند XML ، آيتمی  وجود ندارد که به کامپيوتر اعلام نمايد به چه صورت می بايست اطلاعات مربوط به هر يک از المان ها  فرمت ، تا خوانندگان قادر به خواندن آنان باشند . ما به چيزی بيشتر بمنظور تدوين استراتژی نمايش اطلاعات نياز داريم .

گفتیم که در پایین ترین لایه  XML  وجود دارد . XML  اساسا برای این بوجود آمده تا بتوانیم به کمک آن اطلاعات را به اشتراک بگذاریم. یعنی مزیتی که   XML نسبت به   HTML  دارد  اینست که شما میتوانید به کمک آن تگهای معنایی روی داده بگذارید .که درواقع مفهوم داده ها را میرساند .مثلا شما  SPEECH  را به عنوان یک تگ مشخص می کنید .اکنون زیر تگهای آن می توانند شامل  TITLE , SUBJECT  و....باشند که یک سریاز مفاهیم را نشان می دهند .در مقابل تگهایی که در HTML  داشتیم مانند  FONT , BREAK و ... هیچ مفهومی را در بر نداشت .همانطور که اشاره شد XML  به این دلیل بوجود آمد که ما بتوانیم اطلاعات را میان سیستم ها به اشتراک بگذاریم .بنابراین  XML  برای رسیدن به دیتا وب نخستین گام بود .

در واقع ما با  XML  می توانیم تگ و ساختار را تعریف کنیم وسپس بر اساس این ساختار دو AGENT  که می توانند معنای این تگها و ساختارها را بفهمند .با یکدیگر ارتباط داشته باشند .و کاری را به طور مشترک انجام دهند .تبدیل HTML  به XML  کار چندان مشکلی نیست زیرا بسیاری از اطلاعاتی که ما اکنون در وب منتشر می کنیم اساسا و ذاتا  HTML  نبوده اند می دانید که بسیاری از این داده ها که از پایگاههای داده مربوط به شرکت ها بیرون می آیند به XML  تبدیل می شوند و سپس در وب منتشر می یابند .XML  این مزیت را دارد که می تواند در میان ایندو قرار گیرد یعنی ما می توانیم داده های یک پایگاه داد ه را مستقیم به  XML  تبدیل کنیم .حال اگر کسی که قرار است این داده را بخواند انسان است ما آن را از  XML  به  HTML  تبدیل می کنیم اما اگر در سوی دیگر  AGENT  ما یک کامپیوتر است همان ML Xرا برای آن می فرستیم  تا تفسیر راحت تری از آن داشته باشد .

در عین حال مشکل  XML  این است که واژگانی که ما به کار می بریم حالت استانداردی ندارند و هنگامی که دو ماشین می خواهند با یکدیگر ارتباط برقرار کنند .هر دو باید این ساختار را بشناسند .و مفهوم تگهای بکار رفته در آن را بفهمند .به همین اگر چه  XML  توانست برخی از مشکلاتت ما را حل کند . اما آن فراگیری و جامعیتی را که مورد نیاز ما بود نداشت.بنابراین گام بعدی ایجاد زبانی برای حل این مشکل بود 

  3-3لایه RDF

 1-3-3فراداده یا متادیتا

فراداده یا متادینا داده ای درباره خود داده است به عنوان مثال یک کتابخانه را در نظر بگیرید داده هایی که در کارتابل محل قرار گرفتن کتاب را مشخص می کنند به خودی خود معنی ندارند اما اطلاعاتی را در رابطه با داده ها می دهند ( به راحتی می توان کتاب را معادل با داده ها دانست) که محل آن ها در بستر کتابخانه مشخص می شود.

در سال 1995 در دوبلین ایالت اوهایوی امریکا نشستی برگزار شد در آن نشست برای نخستین بار برای متادیتای استفاده شده در بستر وب استانداردی تعریف شد از این استاندارد به عنوان استاندارد Dublin core یاد می کنند لغت Dublin اشاره به محل و لغت Core اشاره به محوریت نقش متادیتا است در این کنفرانس به هر داده موجود در وب به عنوان یک منبع اطلاعاتی نگاه شده و برای آن مجموعه ای شامل 15 عنصر (source ,coverage , rights, date , type, format, identifier ,languge, relation, subject, description,publisher, contributor title, creator )

تعریف شده است در سال های اخیر با اضافه کردن سه عنصر جدید این استاندارد کامل تر شد

در عمل Dublin core  نخستین حرکت رسمی در جهت توسعه فراداده بود اما به زودی نیازهای جدید دیگری مطرح شد که نشان داد وجود مجموعه ای از عناصر برای همه داده ها نه تنها کافی نیست بلکه جوابگوی بسیاری از سوال ها نیز نخواهد بود به این ترتیب با استفاده از مبحث Dublin core معماری warwick framework متولد شد که عملاً از Dublin core به عنوان یکی از لایه های اصلی این معماری استفاده شده بود

پیشرفت در راستای فرداده به سرعت دنبال می شد تا در نهایت RDF سرنام Resource description framework متولد شد RDF زبانی است که برای بیان فرا داده استفاده می کنیم با کمی اغماض می توانیم RDF را حاصل بسط جامع earwick framework بدانیم اگر بخواهیم در رابطه با RDF یک توضیح کلی بدهیم می توانیم این طور بیان کنیم که در RDF تمام اشیاء موجود در بستر وب مانند صفحات وب تصاویر فایل ها و ... به عنوان منابعی در نظر گرفته می شوند که در رابطه با آن ها می توان جملاتی را بیان کردو RDF با توجه به ساختار کلی این جملات شروع به ساختن فراداده برای صفات مشخصی می کند( می توانید استاندارد Dublin core را در RDF به وضوح می بینید.) .

RDF طراحي شد تا يك روش عمومي براي تعريف اطلاعات ارائه دهد بنا براين مي تواند بوسيله برنامه ها ي كامپيوتر ي خوانده شده و فهميده شود. توصيفات RDF طراحي نمي شود تا روي وب نمايش داده شود.

  2-3-3موارد استفاده ي RDF

  • توصيف ويژگيها براي اقلام خريد مثل قيمت و در دسترس بودن(موجود بودن)
  • توصيف زمانبنديهاي زماني براي وقايع وب(web events)
  • توصيف اطلاعاتي درباره ي صفحات وب همچون : مضمون , مؤلف وتاريخ بوجود آمدن و تغيير
  • يافتن يك صفحه ي وب
  • تعريف محتوا و نرخ براي تصاوير وب
  • تعريف محتوا براي موتورهاي جستجو
  • تعريف كتابخانه هاي الكترونيكي

 

مستندات RDF در XML نوشته مي شوند. زبان XMLي كه بوسيله ي RDF استفاده شده RDF/XML ناميده مي شود.

با استفاده از XML اطلاعات RDF مي تواند به سادگي بين انواع مختلفي از كامپيوترها با انواع مختلفي از سيستمهاي عامل وزبانهاي كاربردي مختلف مبادله شوند.

  3-3-3قواعد   RDF

  RDF همه چيز را با استفاده از شناسه هاي وب (URI) ها تشخيص مي دهد و منابع را با خصوصيات و مقادير خصوصيات تعريف مي كند.

تشريح منبع ,خصوصيت و مقدار خصوصيت:

  • يك منبع هر چيزي است كه مي تواند يك URI داشته باشد همچون "http://www.w3schools.com/RDF"
  • يك خصوصيت يك منبع است كه يك نام دارد همچون "author" يا "homepage"
  • يك مقدار خصوصيت مقداري براي خصوصيت است همچون "Jan Egil Refsnes"يا "http://www.w3schools.com" دقت كنيد كه مقدار خصوصيت مي تواند منبع ديگري باشد.

مستند RDF زير مي تواند منبع "http://www.w3schools.com/RDF" توصيف كند:

<?xml version="1.0"?>
<RDF>
  <Description about="http://www.w3schools.com/RDF">
    <author>Jan Egil Refsnes</author>
    <homepage>http://www.w3schools.com</homepage>
  </Description>
</RDF>

 

  4-3-3دستورات RDF

تركيب يك منبع , يك خصوصيت و يك مقدار خصوصيت يك دستور را مي سازد(به ترتيب با عناوين موضوع , گزاره و شي يك دستور شناخته مي شود(

دستورات ديگري ببينيد تا فهم بهتري بدست آوريد:

دستور: "The author of http://www.w3schools.com/RDF is Jan Egil Refsnes"

موضوع دستور بالا: http://www.w3schools.com/RDF مي باشد.

گزاره ي آن author مي باشد.

شي آن Jan Egil Refsnes مي باشد.

دستور: "The homepage of http://www.w3schools.com/RDF is http://www.w3schools.com"

  • موضوع دستور بالا : http://www.w3schools.com/RDF مي باشد.
  • گزاره ي آن homepage مي باشد.
  • شي آن http://www.w3schools.com مي باشد.
  • اين چند خط از مستند RDF است :

    <?xml version="1.0"?>
    <rdf:RDF
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns:cd="http://www.recshop.fake/cd#">
    <rdf:Description
     rdf:about="http://www.recshop.fake/cd/Empire Burlesque">
      <cd:artist>Bob Dylan</cd:artist>
      <cd:country>USA</cd:country>
      <cd:company>Columbia</cd:company>
      <cd:price>10.90</cd:price>
      <cd:year>1985</cd:year>
    </rdf:Description>
    <rdf:Description
     rdf:about="http://www.recshop.fake/cd/Hide your heart">
      <cd:artist>Bonnie Tyler</cd:artist>
      <cd:country>UK</cd:country>
      <cd:company>CBS Records</cd:company>
      <cd:price>9.90</cd:price>
      <cd:year>1988</cd:year>
    </rdf:Description>
    .
    .
    .
    </rdf:RDF>  

     

    اولين خط از مستند RDF اعلان XML است . اعلا ن XML بوسيله ي عنصر ريشه اي RDF يعني<rdf: RDF > دنبا ل مي شود.

    Xmlns:rdf يك Namespace است كه نشان مي دهد كه عناصري كه داراي پيشوند rdf هستند مقدار Namespace آنها "http://www.w3.org/1999/02/22-rdf-syntax-ns#" مي باشد.

    Xmlns:cd يك Namespace است كه مشخص مي كند عناصري كه داراي پيشوند cd هستند مقدار Namespace آنها "http://www.recshop.fake/cd# "مي باشد.

    عنصر <rdf:Description> تعريف منبع مشخص شده بوسيله ي صفتrdf:about را شامل مي شود.

    عناصر <cd:artist>, <cd:country>, <cd:company> وغيره خصوصيات منبع هستند.

    RDF به عنوان یک لایه ی جدید کاربردهای زیادی داشته و در صنعت نیز مورد استفاده قرار گرفته است .

    به عنوان نمونه شما با  RSS  آ شنا هستید  RSS  انواع مختلفی دارد که یکی از آنها مبتنی بر  RDF  است .یکی دیگر از کاربردهای آن FOAF  است . FOAF  یک فضای اطلاعاتی است که شما در آن خود و دوستانتان را معرفی می کنید .به این ترتیب شبکه ای از دوستانتان بوجود می آید که ویژگیهای متنوعی را در اختیار کاربر قرار می دهد. یکی دیگر از کاربرد هایی که می توان برای  RDF  متصور شد تولید فراداده برای محتوای غنی مانند تصویر صوت و ... است .

    با ارائه RDF بحث فراداده به بلوغ مطلوبی رسید اما این تازه ابتدای راه بود چرا که فرا داده نه تنها کافی نبود بلکه جوابگوی بسیاری از مشکلات هم نبود. .   

    اما مشکل اصلی RDF عدم پشتیبانی از ارتباط است به بیان دقیق تر صرف داشتن فرا داده به این معنی نیست که انسان و کامپیوتر زبان یکدیگر را بفهمند و بتوانند با یکدیگر ارتباط برقرار کنند اگر به یاد داشته باشید در تعریف اصلی وب معنایی هدف امکان کار کردن انسان و ماشین به صورت مشترک بیان شد.

    بدیهی است اگر من نتوانم با کامپیوتر به مراوده و مکالمه(به معنی فهمیدن زبان یکدیگر) بپردازم قطعاً نمی توان به صورت مشترک کاری را انجام دهم حال سوال اصلی این است است که اگر من بتوانم هر داده خود را با فراداده مجهز کنم تا کامپیوتر آن را درک کند در چه شرایطی ممکن است فرا داده دوباره با مشکل مواجه شود؟

      6-3-3مشکلات  RDF

    به طور مشخص RDF با چهار مشکل صریح روبه روست.

    مشکل اول تعدد معانی یا Polysemy است یعنی لغتی که چندین معنی مختلف دارد. این پدیده در همه زبان های دنیا وجود دارد در زبان فارسی لغاتی مانند شیر یا گور جزء این دسته از لغات هستند.

    مشکل دوم ایهام یا Ambiguity است در همه زبان های دنیا از این اصطلاحات به وفور استفاده می شود و البته همان طور که می دانیم این اصطلاحات ممکن است دارای معنایی باشند که با معنی لغوی آن هیچ سنخیتی ندارد به این جمله ها دقت کنید  بفرستش دنبال نخود سیاه» از این خرس یه مو هم بکنی غنیمته، یه چایی بزن تو رگ، معنی همه این جملات را حتی بچه های دبستانی نیز می دانند اما اگر قرار باشد در طی انجام کاری کامپیوتر با یکی از این جملات برخورد کند به یقین رفتار متفاوتی از خود بروز می دهد مثلاً تقاضای خرید نخود سیاه می کند یا ممکن است فرمان ترزیق چایی را در رگ صادر کند همان طور که می بینیم گاهی ساده ترین رفتارها برای ما انسان ها می تواند بغرنج ترین مسائل را برای کامپیوترها به وجود آورد.

    مشکل سوم هم معنی ها یا synonyms هستند با توجه به این که موتورهای جست و جو مبتنی بر کلمات کار می کنند در بسیاری از مواقع نتیجه به دست آمده اصلاً دلخواه نیست و از سوی دیگر به طور ذاتی موتورهای جست و جو فقط نتایجی را بر می گردانند که حاوی لغت مورد نظر باشد در حالی که نمایش اطلاعاتی که حاوی لغاتی مترادف با واژه مورد نظر هستند نیز می تواند برای ما مفید باشد مثلاً اگر جواب های جست و جو با لغت وحشتناک یا دهشت انگیز بشود می تواند برای ما مفیدتر باشد.

    مشکل چهارم دانش بیان نشده tacit knowlekge است در بسیاری از ارتباطات روزانه ما حد مشخصی از دانش را برای فرد مقابل خود قائل هستیم ( می دانیم که بعضی از چیزها را همه می دانند) و مبتنی بر این سطح با فرد مقابل خود ارتباط برقرار می کنیم امادر رابطه با کامپیوتر چنین نیست . اما راه حل این مشکل ها چیزی نیست جز بیان صریح موضوعات موجود در دامنه مورد بحث عناصر موضوع مورد بحث ویژگی های این عناصر و ارتباط هایی که با یکدیگر دارند از طرف دیگر باید حد و حدود دامنه مورد بحث نیز دقیقاً مشخص شود نکته دیگر امکان به اشتراک گذاشتن ساختار ادراکی که برای ماشین و انسان از یک موضوع وجود دارد میان آن است برای این کار باید نرم افزاری وجود داشته باشد بسیاری از  Software Agent ها همین کار را انجام می دهند و عمل آخر در نهایت جداسازی دامنه دانش اطلاعاتی با دامنه دانش عملیاتی از یکدیگر است در اینجا یک نکته بسیار مهم وجود دارد دانش اطلاعاتی دانشی است که می تواند شما را در جهت تصمیم گیری کمک کند اما دانش عملیاتی دانشی است که به کمک آن شما تصمیمی را که گرفته اید اجرا می کنید تفکیک این دو دانش از یکدیگر بسیار مهم وحیاتی است چون دسترسی به دانش اطلاعاتی این امکان را به وجود می آورد که بتوانیم از دانش های اطلاعاتی که در حوزه های مختلف وجود دارد در حوزه های دیگری که از نظر شرایط نزدیک هم هستند استفاده کنیم. مثلاً قرار ملاقات گذاشتن با رئیس شرکت یا قرار ملاقات گذاشتن با استاد دانشگاه به رغم آن که دو حوزه مختلف هستند اما بسیار به یکدیگر شبیه هستندو این امکان را فراهم می کنند که بتوان از دانش یک حوزه در حوزه دیگر استفاده کرد.

    جمیع این مسائل و راه حل ها ما را به سمت مفهومی به نام هستی شناسی یا آنتولوژی Ontology راهنمایی می کند.

      4-3لایه آنتولوژی یا هستی شناسی

     1-4-3تعریف آنتولوژی

    هستی شناسی یا آنتولوژی علم شناخت و دسته بندی مفاهیمی است که موجود هستند یا ممکن است در زمینه های مختلف وجود داشته باشند به عبارت دیگر علم آنتولوژی کاتالوگی حاوی دسته بندی مفاهیم موجود یا احتمالاً موجود در یک حوزه مشخص است به طور کلی علم آنتولوژی ریشه در فلسفه دارد این علم آنتولوژی سعی در شناخت مفاهیم دارد و در ادامه نگاه ارسطویی در طبقه بندی و دسته بندی مفاهیم موجود تلاش می کند در نهایت در فلسفه مدرن امروزی علم آنتولوژی حاصل شناخت مفاهیم دسته بندی و طبقه بندی مفاهیم است

    اما بین آنتولوژی در فلسفه و آنتولوژی در علم کامپیوت یک تفاوت اساسی وجود دارد در فلسفه ما از نظم و ترتیب میان مفاهیم به آنتولوژی می رسیم اما در علم کامپیوتر ما دارای چنین ترتیبی نیستیم و آنتولوزی را از روی ترتیبی که خود برای مفاهیم در نظر می گیریم استخراج می کنیم اما میان آنتولوژی در فلسفه و آنتولوژی در علوم کامپیوتر تفاوت بزرگی وجود دارد نگاه آنتولوژی در فسلفه نگاهی جامع و جهان شمول است و سعی می شود که همه مفاهیم مورد بررسی قرار بگیرند در حالی که آنتولوژی در علم کامپیوتر دارای دامنه بسیار کوچک تری است و اصولاً نیازی نیست که مواردی که در حیطه بحث ما نیستند وارد آنتولوژی بحث ما شوند به این ترتیب در هنگام اجرا آنتولوژی در علم کامپیوتر نسبت به آنتولوژی در فسلفه از سبکبالی بیشتری برخوردار است نکته جالب تر طرز نگاه به بحث آنتولوژی در علم کامپیوتر است متخصصین هوش مصنوعی به آنتولوژی نگاهی بسیار جامع تر دارند معمولاً آن ها سعی می کنند که از آنتولوژی در حوزه مدل کردن دانش و تطابق دانش استفاده کنند کاری که ذاتاً نیازمند نوعی جامع نگری است در مقابل آنتولوژی در وب معنایی به مفاهیم نگاهی باریک بیناه نه تر دارد همان طور که بیان شد برای غلبه بر مشکلات موجود در RDF باید تا آن جا که می توانیم صریح باشیم پس در آنتولوژی در وی معنایی تلاش می کنیم که به جای نگاه کلی و سعی در پوشش دادن وسیع همه مفاهیم 0مفاهیم معادل) Object, individual, concept مفاهیم مربوط بپردازیم.

    درآنتولوژی سعی می شود مفاهیم دسته بندی ها و کلاس های مفاهیم ارتباطات بین مفاهیم صفات مفاهیم توابع مفاهیم رویدادهایی که برای یک مفهوم می تواند رخ دهد قوانین جاری بر هر مفهوم محدودیت های هر مفهوم و شرایط قیاس بین مفهوم ها مشخص شود به این ترتیب با نگاه به مفاهیم مورد نیاز امکان پیاده سازی و رسیدن به جواب برای وب معنایی بسیار آسان تر و قابل دسترس تر از مسائل هوش مصنوعی است تیم برنرزلی آنتولوژی را برای وب معنایی این گونه معرفی می کند « متن یا فایلی که ارتباط بین عناصر را تعریف می کند.» میچ یکی دیگر از دانشمندان بزرگ حوزه وب معنایی آنتولوژی را مجموعه پنج عنصر تعریف می کند o={C,R,H,c,rel,AO} که در آن c مجموعه مفاهیم R مجموعه ارتباطات Hc مجموعه ارتباط سلسله مراتبی مفاهیم است که به آن taxonomy می گویند Hc(C1,C2) به این معنی است که C1 زیر مفهومی از C2 است rel تابعی است که ارتباط بین دو مفهوم را که دارای taxonomy نیستند مشخص می کند Ao مجموعه قوانین و محدودیت هایی است که تحت یک زبان خاص منطق بیان می شود به این ترتیب آنتولوژی دارای جایگاهی منطقی و تعریفی مدون می شود.

      2-4-3زبان نوشتن آنتولوژی

    Web ontology language از خانواده زبان هایی است که برای مدل کردن دانش استفاده می شود معمولاً با این گونه زبان ها آنتولوژی هایی را برای مسائل هوش مصنوعی طراحی می کنند ساختار زبان OWL تا حدود زیادی بر گرفته از دو زبان OWL-DL و OWL-lite است که البته هر دو این زبان ها مبتنی بر منطق توصیفی هستند در OWL همخ از زبان RDF و هم از زبان XML پشتیبانی شده است به این ترتیب میان آنتولوژی و فراداده پیوندی قوی برقرار شده است.

    با استفاده از XML اطلاعات OWLمي تواند به سادگي بين انواع مختلفي از كامپيوترها با انواع مختلفي از سيستمهاي عامل وزبانهاي كاربردي مبادله شوند.

    در طی مراحل پیشرفت وب معنایی و علم انواع مختلفی از آنتولوژی معرفی شده است و طیف وسیعی از آنتولوزی ها وجود دارد این طیف از بیان و معرفی ضمنی مفاهیم تا بیان صریح مفاهیم و موضوعات وابسته به آن ها را شامل می شود نکته جالب این که با توجه به نیاز می توان از قسمت های مختلف این طیف وسیع استفاده کرد و الزاماً نیاز نیست که همیشه از پیچیده ترین سیستم موجود استفاده کرد که این مطلب نیز به راحتی پیاده سازی وب معنایی کمک می کند

    اما سوال اصلی همچنان باقی است چگونه می توان یک آنتولوژی ساخت؟

      3-4-3ساختن آنتولوژی

    برای ساختن آنتولوژی راه حل های بسیار زیاد و پیچیده ای وجود دارد اما در اینجا یکی از ساده ترین راه حل ها را معرفی می کنیم.

    برای ساختن آنتولوژی از یک فرهنگ لغت بسط داده شده (Extended lexicon) استفاده می کنیم. این فرهنگ لغت نه تنها حاوی معنی لغات است بلکه لغاتی را که به نوعی با لغت مورد نظر ما ارتباط منطقی دارد مشخص کرده است به این ترتیب همه مفاهیم مورد نظر در بحث خاص خود اعم از اشیاء یا اشخاص Object صفات subjevt افعال Verb و وضعیت های ممکن State همراه با وابستگانشان را از فرهنگ لغت استخراج می کنیم و آنتولوژی خود را می سازیم. در نهایت ما با قرار دادن فرا داده و در کنار آنتولوژی این امکان را به وجود می آوریم که مفاهیم به طور دقیق و کامل تعریف شوند اما مشکل همچنان باقی است به یاد داشته باشید که هدف مشارکت میان انسان و کامپیوتر است ( باید زبان یکدیگر را بفهمند) با آنتولوژی و فرا داده احتمالاً این امکان وجود دارد که کامیپوتر و ماشین زبان یکدیگر را بفهمند اما ذاتاً این ترکیب امکان مکالمه را ندارد بنابراین ما باید روشی را پیدا کنیم که به کمک آن بتوانیم امکان این مکالمه را فراهم کنیم در اینجا داست که شما ناخود آگاه عامل ها یا ایجنت ها Agent یا همان برنامه های کوچکی که در بستر اینترنت به مراوده اطلاعات می پردازند را به یاد می آورید بله در حقیقت این ایجنت ها هستند که در بستر وب ارتباط شما را با کامپیوتر برقرار می کنند از طرف دیگر چون شما به طور معمول با ایجنت خود در ارتباط هستید پس شما توانسته اید با کامپیوتر برقرار می کنند پس اگر ایجنت شما آنتولوژی مورد نظر را داشته باشد می تواند با کامپیوتر مربوط ارتباط برقرار کند از طرف دیگر چون شما به طور معمول با ایجنت خود در ارتباط هستید پس شما توانسته اید با کامپیوتر به تبادل اطلاعات بپردازید و قضیه حل شده است

    یک مثال:

    شما می خواهید بلیتی تهیه کنید و شرایط را به ایجنت خود می گویید و ایجنت با داشتن آنتولوژی مناسب از بهترین خط هواپیمایی برای شما بلیط می خرد. مناسبت ترین در دل خود مفهوم عظیمی از پیچیدگی دارد. اما در اینجات یک مسئله وجود دارد و آن هم این است که ایجنت من آنتولوژی خود را دارد و ازآنتولوژی به کار رفته در ایجنت شرکت هواپیمایی دیگر مثل آلیتالیا خبر ندارد ( نه مفاهیم، نه ساختار، نه محدودیت ها، ... هیچ چیز) پس چگونه این دو می توانند با یکدیگر به مکالمه بپردازند در حقیقت پاشنه آشیل بحث وب معنایی همین جا است ما با داشتن بیش از هشت میلیارد صفحه در بستر وب پس از مدتی با مجموعه کثیری از آنتولوژی های مختلف روبه رو می شویم که حتی با وجودی که ممکن است به یک موضوع مربوط باشند، اما با هم بر هم منطبق نباشند این موضوع درست همانند بحث خرید بلیت است مثلاً اگر آنتولوژی ایجنت شرکت همابا آنتولوژی ایجنت شرکت آلیتالیا فرق کند، مراوده اطلاعات میسر نیست با وجود این که هر دو در یک حوزه کاری فعالیت می کنند

    این مشکل هنوز هم به عنوان یکی از مسائل اساسی در بحث وب معنایی مطرح است اما با این حال برای حل این مشکل چهار روش مختلف پیشنهاد شده است .

    روش اول افزودن آنتولوژی ها به یکدیگر و ساختن یک آنتولوژی واحد استبه اینروش که  merg  می گویند دو ایجنت آنتولوژی های خود را با یکدیگر ترکیب می کنند و می توانند با یکدیگر به تبادل اطلاعات بپردازند و نتایج به دست آمده نیز برای کاربر قابل فهم است البته در این روش ممکن است دامنه های مشابه روی هم بیافتند و به اصطلاح پدیده Domain overlapping رخ دهد که موجب نتایج غیر دلخواه و غیر شفاف می شود.

    روش دوم مطابقت دادن دو آنتولوژی با یکدیگر است به این ترتیب که همه عناصر موجود میان دو آنتولوژی با هم مطابقت ایجنت ها با یکدیگر به مراوده اطلاعات می پردازند با توجه به این که ایجنت هایی که به یک حوزه مربوط هستند  معمولاً با یکدیگر با تبادل اطلاعات می پردازند این احتمال وجود دارد که دو آنتولوژی قابل انطباق باشند اما این موضوع همیشه صادق نیست از سویی به غیر از هزینه محاسباتی که این انطباق دارد تا لحظه آخر نمی توان مطمئن بود که آیا ارتباط برقرار می شود یا خیر؟

    روش سوم نگاشت Alignment میان آنتولوژی ها است در این روش میان دو آنتولوژی مختلف قسمت هایی به هم نگاشت می شود تشخیص این که کدام قسمت هایی به هم نگاشت شوند خود بحث بسیار پیچیده ای است اما از مزیت های این روش این است که قسمت های تکمیلی و اضافی دامنه مورد نظر به وسیله دو آنتولوژی پوشش داده می شود.

    روش چهارم برآیند integration آنتولوژی ها است به این صورت که با استفاده از روش هایی مانند نگاشت تحلیل، اضافه کردن و منطبق کردن و.... مفاهیم به یک آنتولوژی واحد برسیم که برای همه ایجنت ها یکسان باشد و بسته به دامنه مورد نیاز هر بار به یک قسمت آن مراجعه شود.

    در حقیقت رسیدن به چنین استانداردی در سطح جهانی امری بسیار سخت و مشکل است وجود چنین چیزی با ماهیت پویا و داینامیک دینای فناوری امروز اصلاً همگن نیست و الزاماً اگر هم قرار به بحث وجودی آن باشد باید به نوعی برای آن ماهیتی داینامیک در نظر گرفت.

    بحث مهم دیگر در این زمینه موضوع هزینه بر بودن ساخت آنتولوژی است . فرض کنید هر موسسه ای بخواهد برای خود یک آنتولوژی بسازد برای این کار زمان زیادی لازم است .بنابراین در اینجا مفهومی به نام  ONTOLOGY LEARNING  مطرح می شود. یعنی بتوانیم آنتولوژی ها را بر اساس اطلاعات متنی موجود به صورت خودکار و نمه  خودکار بسازیم .بریا این کار تکنیک هایی نیز بوجود آمده که بر اساس آنها مفاهیم و روابط را به یک آنتولوژی اضافه می کنند .بر اساس تمام این موارد می توانیم آنتولوژی های بهتری داشته باشیم . و از آن در وب معنایی به عنوان بستری مناسب استفاده کنیم .

      5-3لایه منطق و اثبات

    اگر به بحث هدف وب معنایی یا همان کارکردن مشترک انسان و کامپیوتر روی یک موضوع بازگردیم یک نکته قابل تامل است : اگر بخواهیم ماشین روی موضوع خاصی فعالیت کند باید به منظور تصمیم گیری برای انجام آن کار خاص منطق لازم را داشته باشد.به عبارت دیگر بوجود آمدن امکان مکالمه میان انسان و کامپیوتر به معنی رسیدن به وب معنایی نیست .برای اینکه یک ایجنت بتواند یک عمل منطقی انجام دهد باید بتواند برای تصمیم گیریهای منطقی آنتولوژی خود را به یکی از منطق های ارائه شده تبدیل کند .خوشبختانه همه زبانهایی که برای توصیف آنتولوژی استفاده می شوند امکان تبدیل شدن به سطح مناسبی از منطق را دارند .به طور مشخص بهشت برین این عرصه "منطق مرتبه اول" است که امکان رسیدن به آن تا به امروز برای آنتولوژی ممکن نشده است اما با این حال آنتولوژی امکان تبدیل شدن به منطق نسبتا ضعیف تری به نام منطق توصیفی را دارد .که در بسیاری از شرایط جوابگوی نیاز فعلی ما است .منطق مرتبه اول که متخصصین هوش مصنوعی در بحث مدل سازی دانش به وفور از آن استفاده می کنند منطقی گران و پر هزینه است . اما در منطق توصیفی  ما با نسخه ضعیف شده منطق مرتبه اول رو به رو هستیم .به بیان دیگر منطق توصیفی زیر مجموعه ای از منطق مرتبه اول است .که در شرایط فعلی جوابگوی نیاز ماست . تنها نکته مهم این است که پس از آنکه مسئله حل ونتیجه گیری انجام شد آنتولوژی ما باید به روز  شود چون اصولا منطق می تواند برای حل مسائل بعدی پویایی لازم را به آنتولوژی بدهد.

    زبان هایی که مبتنی بر منطق توصیفی عمل می کنند ودر وب معنایی استفاده می شوند .عبارتند از :  

    OWL ,RACER, KL-ONE

      6-3لایه  TRUST

     در نهایت لایه آخری که برای وب معنایی در نظر گرفته شده لایه اطمینان یا  TRUST  است .در حال حاضر ما نمی توانیم کیفیت اطلاعات وب را بسنجیم این موضوع در کارهای روزمره نیز کاملامشهود است .مثلا هنگامی که می خواهید پولی را از طریق وب مبادله کنید .آیا می توانید به شخص یا سایتی که برای این کار از شما می خواهد رمز عبور کارت اعتباری خود را وارد کنید .اطمینان می کنید .؟

    به همین دلیل بحث  TRUST  به یکی از معضلات فعلی وب تبدیل شده است .طبیعتا اگر این امکان وجود داشت که مثلا هنگام دریافت ایمیل اعتبار فرستندگان را بسنجیم امکان فیلتر کردن موارد ناخواسته با سهولت بیشتری انجام می شد .یا اگر می شد هنگام انجام یک تراکنش مالی وضعیت اعتباری طرف مقابل را پیش از این کار بسنجیم .بسیار مغید بود .

     در بحث وب معنایی اعتماد جهت برقراري تعاملات امن و با كيفيت بالا بسيار ضروري است. در صورت پياده‌سازي اعتماد، وب معنايي مي‌تواند در شرايط عدم اطمينان به نحو مطلوبي عمل نمايد. با توجه به ماهيت وب معنايي، مي‌توان آن را به صورت مجموعه‌اي از عامل‌هاي هوشمند در نظر گرفت. و‌يژگي‌هاي زير را مي‌توان براي وب معنايي ذكر نمود

    الف) مفاهيم به صورت معنايي و خودكار توسط مسند‌ها (صفات، اعمال، افعال) به يكديگر پيوند خورده‌اند

    ب( آنتولوژي به طور معين و صريح مفاهيم و ارتباط‌هايي را كه مي‌تواند براي يك عامل يا مجموعه‌اي از عامل‌ها وجود داشته ‌باشد نشان مي‌دهد

    .ج) توسطRDF   كه براي حاشيه‌نويسي منابع استفاده‌ مي‌شود. مي‌توان به آساني اجزاء اعتماد را به وب‌معنايي اضافه كرد. فرا داده‌هاي وب توزيع‌شده، قابل فهم‌ توسط ماشين هستند لذا باعث مي‌شود كه اطلاعات اعتماد با كمترين تاثير انساني به صورت كارا مورد پردازش قرار گيرند

    .د) وب معنايي، توسط توسعه زبان‌هايي مانندOWL ، BPEL4WS و DMAL-S سعي در برآورده ساختن قابليت پيشرفته استنتاج دارد. اجزاء اعتماد مي‌توانند از توابع استتنتاج براي يافتن فراهم‌آورندگان سرويس مناسب، بهره ببرند.

      1-6-3اعتماد در علوم کامپیوتری

    اعتماد يكي از اجزاء وابسته بسياري از تعاملات انساني است كه به افراد اجازه مي‌دهد در شرايط ترديد و با ريسك وجود پيامد‌هاي منفي فعاليت كنند.تحقيقات در زمينه امنيت، پايه‌گذار بسياري از مدل‌ها و توصيف‌هاي اوليه اعتماد در زمينه علوم كامپيوتر است. امنيت و اعتماد، مفاهيمي وابسته به يكديگر اما با اهداف متفاوت هستند. تعاریف متنوعی از اعتماد ارائه شده است که در زیر به برخی از آن ها اشاره می کنیم:

    1.انتظار ذهني که يک عامل در مورد رفتار آينده يکي ديگر، بر مبناي سابقه مواجهات او دارد.(Mui et al., 2002)

    2.اعتقاد به صلاحيت يک موجوديت جهت عمل به صورت مستقل، امن، و با قابليت اطمينان در يک زمينه مشخص(Grandison and Sloman, 2000)

    3. اعتماد طرف A به طرف B براي سرويسي مانند Xعبارت است از اعتقاد قابل اندازه گيري A به B به طوريکه B به طور مستقل براي يک بازه زماني معين در يک زمينه مشخص در ارتباط با سرويس X عمل نمايد. (Olmedilla et al., 2005)

    شاید این سوال به نظر آید که چه نیازی به بررسی اعتماد در مسائل کامپیوتری می باشد. در واقع لزوم بررسی آن چیست، دلایل زیادی وجود دارد از قبیل: نقش اعتماد در تعاملات روزانه انسان، کمک به تصميم‌گيري در شرايط عدم اطمينان، لزوم استفاده با گسترش وِب ، مطرح گشتن به عنوان يکي از اهداف بنياد W3C، مطرح گشتن به عنوان بالاترين لايه وِب معنايي و غیره

      2-6-3روشهای تعیین اعتماد

    روش های متفاوتی برای تعیین اعتماد ارائه شده است اما به طور کلی دو تا از متداول ترین متد ها عبارتند از:

    1. روش مبتنی بر استفاده ازPolicies: این گونه متد ها برمبناي استفاده از مدرک مستدل می باشد. policyها اغلب شامل معاوضه يا تصديق اعتبارنامه ها است (اعتبارنامه اطلاعاتي است که از يک موجوديت حاصل شده و ممکن است کيفيت يا ويژگيهاي موجوديت ديگر را تشريح نمايند مانند يک مدرک دانشگاهي). مسئله‌اي كه در استفاده از اعتبارنامه‌ها وجود دارد اين است كه خود اعتبارنامه‌ها نيز نياز به بررسي اعتماد دارد ( كه آيا خود اعتبارنامه داده شده درست است يا خير؟) لذا نياز است كه يك شخص ثالث مورد اعتمادي (مانند CAها) اعتبارنامه‌ها را تائيد كند

    2.روش مبتنی بر شهرت (اعتبار): بر پايه تخمين اعتماد، به طوريکه کارايي و تعاملات گذشته يک موجوديت ترکيب شده تا رفتار آينده آن تعيين و ارزيابي شود.در واقع بر مبناي تخمين روي تاريخچه تعاملات يا مشاهدات يک موجوديت، چه به صورت مستقيم توسط ارزياب (تجربيات شخصي) وچه توسط گزارش ديگران (توصيه نامه) در مورد اعتماد تصمیم گیری می شود.

    تحقيقات زيادي روي تعريف و مدل سازي اعتماد، ملزومات آن، شرايط، اجزا و پيامد هاي آن انجام شده است.

    مدل هاي اعتماد براي تجزيه تحليل تصميم هاي انساني و مبتني بر عامل، و همچنين براي عملياتي کردن مدل هاي محاسباتي اعتماد مفيد مي باشند.

    اعتماد يکي از موضوعات مشترک و مهم در زمينه تحقيقات مرتبط با وب، راجع به قابليت اعتماد منابع وب و سايت هاي وب است اعتماد در وب داراي کاربردها و معاني متنوع مي باشد: شامل دريافت rate از کاربران درباره کيفيت اطلاعات و سرويس هايي که استفاده کرده اند، چه طور طراحي وب سايت اعتماد روي محتوا و فراهم کننده هاي محتوا را متاثر مي کند،انتشار اعتماد روي لينک هاو غيره يكي دیگر از كاربرد‌هاي اصلي اعتماد مبتني بر شهرت، مسئله كيفيت داده‌ها در شبكه‌هاي P2P است زيرا در اين شبكه‌ها هيچ مانعي براي انتشار يك فايل وجود نداردو هركسي مي‌تواند هرچيزي را با هر اسمي و با هر كيفيتي ارسال كند همچنين قابليت اطمينان و دسترسي نودها در شبكه‌هاي P2P تضمين شده نيست.

    عامل ها در وب معنايي باید تصميم اعتماد را به صورت خودکار انجام دهند. عامل‌ها به صورت فعال با دريافت اطلاعات شهرت(reputation) از ديگر عامل‌ها، اعتماد را تعيين نمايند. به جاي يك سيستم مديريت اعتماد مركزي، يك سيستم مديريت اعتماد توزيع شده داشته باشيم كه در آن به عامل‌ها اجازه داده ‌شود در مورد اعتماد  تصمیم گیری نمایند.

    نمونه مثال:

    در دنیای واقعی و برای روشن تر شدن موضوع مثالی می زنیم : فرض کنید من آقای الف را نمیشناسم اما بانکی را می شناسم که به آن اطمینان دارم در صورتی که بانک مذکور اعلام کند که به آقای الف مثلا 80 درصد اطمینان دارم من با توجه به اینکه به اندازه 90 درصد به بانک اطمینان دارم می توانم به اندازه 72 درصد (90% * 80 %)  به آقای الف اطمینان می کنم .

فصل چهارم نمونه کاربردهای وب معنایی

TAP  1-4  زیرساختی برای وب معنایی

پروژه TAP که در دانشگاه استانفورد انجام گرفته است، زير ساختي را در اختيار عامل‫ها مي‫گذارد که داده‫هاي خود را در وب معنايي به نحوي منتشر کنند که عامل‫هاي مختلف بتوانند با سهولت از آنها استفاده کنند. اين پروژه سه قسمت اصلي دارد که به اختصار در ادامه شرح داده شده‫اند

  1-1-4رابط پرس و جو

عامل‫ها مي‫توانند با استفاده از يک APIبه نام GetData در وب معنايي پرس و جو انجام دهند. دستور GetData يک پيام SOAP است و به عامل‫ها اين امکان را مي‫دهد که به مشخصات منابع در يک گراف دسترسي داشته باشند. حاصل اجراي GetData خود يک گراف است  که منابع بازيابي شده و ارتباط بين آنها را نمايش مي‫دهد. شکل کلي اين دستور به صورت زير است

GetData (<resource> , <property> )  =  <Value>        

به عنوان نمونه

 GetData (Yo-Yo Ma, BirthPlace) => <Paris, France>.

TAPهمچنين دو رابط ديگر را جهت کاوش گراف‫ها در اختيار مي‫گذارد

رابط جستجو: اين رابط يک رشته را گرفته و منابعي که رشته مورد نظر در عنوان آنها (يعني در rdf:label ) وجود دارد را برمي‫گرداند.

رابط تعمق: به کمک اين رابط مي‫توان به ليستي از لبه‫هايي که از يک نود خارج مي‫شوند يا به آن نود وارد مي‫شوند را به‫دست آورد. اين رابط جهت کاوش گراف‫هاي همسايه يک نود کاربرد دارد.

 

  2-1-4جمع آوری داده ها

ابه دليل اينکه در وب معنايي داده‫هاي مربوط به يک مفهوم در سايت‫هاي مختلفي واقع شده‫اند، اين بخش از TAP جهت جمع‫آوري اسناد مورد نياز مانند اسناد RDF بوجود آمده است. يکي از وظايف اصلي اين بخش تبديل اسناد HTML از وب کنوني به محيط وب معنايي است، به صورتي که بتوان آنها را توسط رابط GetData در اختيار عامل‫ها قرار گيرد

  3-1-4انتشار دادهها

در پروژه TAP يک سرويس‫دهنده HTTP طراحي شده است که TAPache نام دارد و هدف از آن تسهيل در انتشار صفحات وب معنايي است. رابط GetData که در بخش قبل تشريح شد نيز توسط اين بخش در اختيار عامل‫ها قرار مي‫گيرد. در اين سرور يک شاخه مخصوص اسناد وب معنايي مانند RDF وجود دارد که TAPache ساختار گرافي اسناد موجود در آن را تفسير، ترجمه و در حافظه اصلي نگه‫داري مي‫کند تا بتواند دستورات GetData رسيده را به سرعت پاسخ دهد. همچنين جهت بهبود کارايي سيستم، پاسخ درخواست‫هاي GetData را کش مي‫کند که در مراجعات بعدي به GetData مشابه از آن‫ها استفاده کرد.

 

  2-4چند نمونه پياده سازي شده از جستجوي معنايي

R.Guha و همکارانش، دو سيستم که از TAP استفاده مي‫کنند را پياده‫سازي کرده‫اند که يکي ABS نام دارد و هدف از آن جستجوي معنايي در مورد افراد مانند خوانندگان، ورزش‫کاران و سياست‫مداران در سايت ODP است. سيستم دوم جستجوي معنايي W3C نام دارد که امکان جستجوي مفهومي در سايت W3C را فراهم مي‫کند. داده‫هاي سيستم ABS از منابع مختلفي تامين مي‫شود.سايت‫هاي مختلفي اطلاعات در مورد خوانندگان، ورزشکاران، مکان‫ها و محصولات را در اختيار مي‫گذارند، اما اين اطلاعات به‫صورت قابل فهم براي ماشين نيستند. در بخش TAP Scraper يک  HTML Scraper قرار دارد که اطلاعات اين سايت‫ها را گرفته و به فرم قابل فهم براي ماشين که در وب معنايي استفاده مي‫شود، تبديل مي‫کند. Scraper مذکور در سيستم ABS از سايت‫هايي مانند eBay،AllMusic ، PeopleMagazine،AOL،Amazon و ... اطلاعات خود را دريافت مي‫کنند. يک منبع مهم ديگر براي ABS پايگاه دانش TAP است که در آن اطلاعاتي در مورد افراد (مانند خوانندگان، ورزشکاران و بازيگران)، سازمان‫ها (مانند شرکت‫ها، گروه‫هاي موزيک و تيم‫هاي ورزشي)، مکان‫ها (مانند شهرها، کشور و ايالات) و محصولات مختلف وجود دارد. مجموعاً 65000 مفهوم مختلف در اين پايگاه داده قرار دارد که 17 درصد از جستجوهاي انجام شده در سايت ODP را تشکيل مي‫دهد.منابعي که سيستم جستجوي معنايي W3C از آنها استفاده مي‫کنند مانند پروژه ABS پراکنده نيستند و شامل پنج منبع از سايت W3C است:

افراد: شامل کارمندان و نويسندگان اسناد W3C است. اين بخش شامل اطلاعاتي مانند آدرس، عنوان و عکس افراد مي‫باشد.

فعاليت‫هاي W3C: هر فرد در W3C در فعاليتي مشارکت دارد.

گروه‫هاي کاري و کميته‫ها که هر کدام به فعاليت خاصي اختصاص دارد.

اسناد: شامل Draft، Recommendation و ديگر اسناد منتشر شده در W3C است که به گروه‫هاي کاري و فعاليت‫هاي ايجاد کننده آنها ارتباط دارند.·

اخبار: شامل رخ دادهاي W3C است.

لازم به ذکر است که هر دو سيستم هاي ABS و جستجوي معناييW3C  از يک آنتولوژي مشترک در مورد افراد، مکان‫ها، رخ‫دادها و سازمان‫ها استفاده مي‫کنند. هر دو اين سيستم‫ها از TAP براي جستجوي مفهومي استفاده مي‫کنند. هر دو اين سيستم‫ها از TAP براي جستجوي مفهومي استفاده مي‫کنند و نتايج خود را در کنار موتورهاي جستجو متعارف مانند گوگل به کاربر نمايش مي‫دهند. جستجوي مفهومي در اين سيستم‫ها طي سه مرحله انجام مي‫گيرد که در ادامه آمده است.

ايجاد ارتباط بين واژههاي جستجو و نودهاي گراف در وب معنايي

اين کار با استفاده از رابط پرس و جو TAP انجام مي‫شود. واژه‫هاي پرس و جو ممکن است به هيچ، يک يا چند نود در وب معنايي ارتباط داده شود. در صورتي که به هيچ نودي ارتباط داده نشود، جستجوي معنايي امکان پذير نيست. اما ممکن است واژه مورد نظر به بيش از يک نود ارتباط داده شود که ابهام بوجود مي‫آيد. به عبارت ديگر در صورتي که واژه مورد جستجو در rdfs:label مربوط به بيش از يک نود وجود داشته باشد، ابهام بوجود مي‫آيد. براي مثال ممکن است واژه پرس و جو Paris به شهر Paris  در فرانسه يا گروه موزيک Paris  ربط داده شود. در اين حالت مي‫بايست:

از محبوبيت واژه مورد نظر استفاده کرد. مثلاً واژه Paris بيشتر به عنوان يک شهر شناخته مي‫شود.·   

با توجه به پروفايل کاربر عمل کنيم. براي مثال اگر کاربر به گروه‫هاي موسيقي علاقه ‫مند است با احتمال بيشتر منظور او گروه موزيک Paris است.  

اما در صورتي که واژه پرس و جو به هيچ نودي ارتباط پيدا نکند، نمي‫توانيم جستجو را بهبود دهيم. بنابراين در جستجوي معنايي بسيار مهم است که در محدوده‫اي وسيع، اطلاعات در اختيار داشته باشيم.

مشخص کردن اطلاعاتي که بايد به کاربر نمايش داده شود

بعد از مشخص شدن يک يا چند نود که با و اژه‫هاي پرس و جوي کاربر ارتباط دارند، مي‫بايست قسمتي از وب معنايي را که بايد به عنوان پاسخ پرس و جوي کاربر نمايش دهيم را مشخص کنيم. به عبارت ديگر، پرس و جو کاربر نود يا نودهايي را در گراف وب معنايي به عنوان نود شروع به ما مي‫دهد. به اين نود، نود لنگر مي‫گويند. ما مي‫بايست يک زير گراف از همسايگي نود يا نودهاي لنگر را انتخاب کنيم سپس مشخص کنيم به چه ترتيبي زير گراف‫هاي به‫دست آمده را به کاربر نمايش دهيم.يک روش ساده اين است که همه زير گراف‫هاي اطراف نود مورد نظر را يکسان در نظر بگيريم و به روش اول پهناگراف را پيمايش کنيم و N تا سه‫تايي RDF اول را انتخاب کنيم (N عددي از قبل مشخص شده است). البته اين روش با دخيل کردن روش‫هاي مکاشفه‫اي مانند زير بهتر عمل خواهد کرد:

Nتا سه‫تايي را انتخاب کنيم که منبعي مشترک دارند و بر چسب لبه آنها يکي است و N بر اساس ميانگين فاکتور انشعاب گراف اطراف نود لنگر محاسبه مي‫شود.

 Mتا سه‫تايي را انتخاب کنيم که منبع مشترکي دارند که M بر اساس ميزان بوته‫اي بودن گراف اطراف نود لنگر محاسبه مي‫شود. همچنين M مي‫تواند تابعي از فاصله نود از نود لنگر باشد. اين روش مکاشفه‫اي باعث مي‫شود به نودهاي نزديک‫تر به نود لنگر اولويت داده شود.

در صورتي که دو يا چند نود لنگر داشته باشيم مي‫بايست علاوه بر سه‫تايي‫هايي که در همسايگي نودهاي لنگر قرار دارند، يک يا چند مسير که نودهاي لنگر را به هم ارتباط مي‫دهند نيز پيدا کنيم و سه‫تايي‫هايي از اين مسيرها را نيز به خروجي اضافه کنيم. بعد از اين مرحله سه‫تايي‫هاي به‫دست آمده را ابتدا بر اساس منبع و مجاورت با نود لنگر و سپس بر اساس بر چسب لبه‫ها مرتب کنيم.

 نمايش خروجي

مرحله نهايي نمايش خروجي جستجوي معنايي به کاربر است. جهت نمايش سه‫تايي‫هاي به‫دست آمده مرحله قبل از مجموعه‫اي از قالب‫ها استفاده مي‫شود. به هر کلاس از اشياء مجموعه‫اي از قالب‫ها استفاده مي‫شود. هر قالب علاوه بر کلاس‫هايي که به آنها قابل اعمال است، مشخصه‫هايي از آن کلاس‫ها را که براي استفاده از آن قالب ضروري است را نيز مشخص مي‫کند. به اين ترتيب خروجي جستجوي معنايي که به صورت گراف است به HTML که براي نمايش به کاربر مناسب است، تبديل مي‫شود.

  3-4 اخیرا شرکت ‏AdaptiveBlue‏ ، افزونه‌ای برای مرورگر فایرفاکس به نامBlueOrganiz‏ ‏ساخته است. این افزونه قادر است محتوای یک صفحه وب را تشخیص بدهدو متناسب ‏با ان اطلاعاتی از وب‌سایت‌های مشابه در مورد همان موضوع به کاربر نشاندهد. مثلا ‏وقتی شخصی در یک سایت سینمایی مشغول خواندن اطلاعات مربوط به یک فیلم سینمایی است ، این افزونه نشان می‌دهد که فیلم را از کجا می‌توان خرید و یا زمان اکران و سینماهای نمایش‌دهنده دهنده آن کدام‌ها هستند.‏

  4-4موتورهای جستجوی امروزی قادر به فهم زبان ‏سطح بالای کاربران نیستند و برای مثال آنها نمی‌توانند تمایزی بین «پاریس هیلتون» و ‏‏«هیلتون در پاریس» قائل شوند، اما در وب ۳ با قابل فهم شدن
صفحات وب برای ماشین و همچنین به یاری هوش ‏مصنوعی ، با پدیده‌ای سرو کار خواهیم داشت که نیاز کاربر را درک می‌کند ، خود ، ‏اینترنت را می‌کاود ، تحلیل می‌کند و دست آخر جواب مختصر و مفید را در اختیار کاربر ‏می‌گذارد.‏ در حال حاضر میلیون‌ها دلار برای بهینه‌سازی موتورهای جستجو هزینه می‌شود و ‏پروژه‌های دانشگاهی مانند WordNet‏ روی فناوری همین موضوع کار می‌کنند

  5-4 امروزه وقتی می‌خواهیم عکس ، ویدئو یا تصویری را جستجو کنیم ، متکی به جستجوی آنها به یاری کلمات و «متادیتا»ها هستیم. برای پیدا کردن یک عکس ‏،کلیدواژه مرتبط را در سرویس جستجوی عکس گوگل جستجو می‌کنیم و این سرویس ‏در زیرنویس‌های عکس‌ها –ونه خود عکس‌ها- جستجو می کند و عکس‌هایی را به شما ‏پیشنهاد می کند. بی‌گمان این نحوه جستجو کارایی لازم را ندارد و دارای نقایصی خواهد ‏بود. وقتی در هنگام جستجوی یک عکس ، عکس‌های نامربوط را می‌بینید ، این مشکل ‏نمود پیدامی‌کند.‏ ولی در وب ۳ جستجو متکی به کلمات نخواهد بود ، در وب ۳ می‌توان به یاری صوت ، دنبال صدای مشابه گشت و یا به یاری یک عکس ، عکس‌های مشابه و دارای محتوای انتزاعی مشابه را پیدا کرد.‏ هم‌اکنون هم نسخه‌های بسیار ابتدایی چنین جستجویی را شاهد هستیم. ‏ سایت ‏like.com‏ ، که یک موتور جستجوی تجاری است به کاربران خود امکان می‌دهد ‏بعد از پسندیدن ظاهر یک جنس ، اجناسی با ظاهر مشابه را پیدا کنند

 مثلا فرض کنید که قصد خرید یک پیراهن را دارید ، بعد از انتخاب فرم یک پیراهن می‌توانید ‏، متغیرهایی مانند اندازه ، رنگ ، قیمت و حتی مارک ، نوع دکمه‌ها و جنس پارچه را ‏انتخاب کنید ، تا پیراهن دلخواه شما جستجو شود.‏

  6-4 در سایت موسیقی پاندورا ‏Pandora‏ ، بعد از اینکه یک موسیقی را گوش کردید ،هنرمندانی با سبک کاری مشابه و قطعات موسیقی مشابه به شما پیشنهاد می‌شود. ‏در طی پروژه پاندورا ۳۰ موسیقی‌دان توسط این سایت استخدام شدند ، آنها در طی ‏چندین سال حدود ۴۰۰ ویژگی ترانه‌ها را مورد بررسی قرار دادند ، خصوصیاتی مثل ‏ملودی و ریتم ترانه‌ها. آنها تا به امروز حدود ۱۰ هزار خواننده و ۳۰۰ هزار ترانه را آنالیز کرده‌اند. کاربران با استفاده از این سایت می‌توانند بطور آنلاین به ترانه‌های خواننده‌های ‏مورد علاقه‌شان گوش کنند و مهمتر از آن می‌توانند به آسانی خوانندگانی را که سبک ‏خوانندگی مشابه هنرمند مورد علاقه‌شان را دارند ، پیدا کنند. سایت پاندورا یک موتور جستجو نیست ، برنامه‌هایش هم هوشمند نیستند ، ولی کاری ‏که انجام می‌دهد ، نمونه ابتدایی تحلیل و جستجوی اصوات در اینترنت است

چهره وب ۳ در همه جا : وب این روزها ، قلمروی در پشت دسکتاپ‌های رایانه‌ها ،صفحات موبایل‌ها و برخی وسایل الکترونیک دیگر دارد. در وب ۳ همه وسایل خانگی و دور و بر ما به صورت تعاملی و دو جانبه با وب در ارتباط منطقی قرار می‌گیرند. پرده‌ها می‌توانند اخبار هواشناسی را دریافت کنند و متناسب با وضعیت آب و هوا و روشنایی باز ‏یا بسته شوند. شما می‌توانید در همان حالی که جلوی آینه مسواک می‌زنید ، آخرین اخبار روز را دریافت کنید ،می‌توانید با موبایلتان با یخچال خانه تماس بگیرید  تا وقتی در ‏سوپرمارکت هستید ، چک کنید چه چیزی تمام شده. در همان زمان می‌توانید تماس دیگری با مایکروفر آشپزخانه برقرار کنید

نتیجه گیری

وب معنایی چیزی متفاوت از وب جهان گستر نیست بلکه گونه ای تکامل یافته از آن است که به شدت باعث سودمندتر شدنش خواهد شد.وب معنایی زمانی خود را نشان می دهد که متخصصان عرصه های مختلف و صاحبان مشاغل از پژوهش های ژنتیک گرفته تا موسیقی برای بازنمایی اطلاعات خود بر سر الگویی مشترک به توافق برسند ابزارهای وب معنایی به آنها اجازه می دهد که الگوهای خود را به یکدیگر متصل کرده و واژگان خود را ترجمه کنند وبه این ترتیب بر تعداد افراد و جوامعی که نرم افزار های تحت وب آنها قادر به درک خودکار زبان یکدیگر هستند افزوده می شود.وب معنایی آینده ای را ترسیم می کند که در آن agent های نرم افزاری هوشمند در وب جهان گستر به طور خودکار پروازها و هتل های مربوط به سفر ما را رزرو می کنند سوابق پزشکی ما را بروز می کنند و به یک پرسش مشخص پاسخی منفرد و مختص آن می دهند .بی آنکه مجبور شویم به جستجوی اطلاعات بپردازیم ویا در دریای نتایج ارایه شده غوطه ور شویم..و وب معنایی فناوری نوپایی است که این رویا را محقق می سازد

مراجع

  • ایزد پناه  پرهام ،”وب معنایی “   ،  مجله شبکه ، سال یازدهم ، شماره 88، اردیبهشت 1387 ، صفحه 222-226 .
  • صفایی امین ،”نگاهی به فناوری RDF “   ،  مجله شبکه ، سال یازدهم ، شماره  89 ، خرداد 1387 ، صفحه 238-240.
  • حسین زاده وحید ،”وب معنایی " ، قابل دسترسی در :  
  • http://iranweb3.com/weblog/?u=0ta100  ,خرداد 1387.
  • ویکی پدیا ، "وب معنایی" ، قابل دسترسی در :
  • http://en.wikipedia.org/wiki/Semantic_Web
  •  
  • Berners-Lee Tim ,  Hendler James and Ora Lassila ," the semantic web ", available :
  • http://www.scientificamerican.com/article.cfm?id=the-semantic-web , may 2001.
  • Tracy V. Wilson  , “how semantic web works” , available: http://computer.howstuffworks.com/semantic-web.htm.
  • 1pezeshk  , “web 3.0 “ ,available:
  • http://1pezeshk.com/archives/2007/07/_3_1.html.
  • K.H. Veltman, Challenges for a Semantic Web, Proceedings of the International
  • Workshop on the Semantic Web 2002, pp. 16-22, (2002)
  • V. Richard, J. Contreras, Six Challenges for the Semantic Web, White paper:
  • www.cs.man.ac.uk/~ocorcho/documents/KRR2002WS_BenjaminsEtAl.pdf, (2002)
  • Z. Liu, W. K. Ng, E.-P. Lim, and F. Li. Towards Building Logical Views of Websites.
  • Data & Knowledge Engineering, (2004)
  • H. Yu, T. Mine, M. Amamiya, An Architecture for Personal Semantic Web
  • Information Retrieval System. WWW 2005, (2005)
  • IsaViz: A Visual Authoring Tool for RDF, http://www.w3.org/2001/11/IsaViz/, last
  • visited: 2007 Feb 3.
  •  A. Léger, J.B. Nixon, P. Shvaiko, J. Charlet, Semantic Web Applications: Fields and
  • Business Cases, The Industry Challenges, The Proceedings of the 1st International
  • IFIP/WG12.5 Working Conference on Industrial Applications of Semantic Web (IASW),
  • vol.188, pp 27-46, (2005)
  • U. Shah, T. Finin, A. Joshi, R.S. Cost, and J. Mayfield. Information Retrieval on the
  • Semantic Web. In 10th International Conference on Information and Knowledge
  • Management., (2003)
  •  
  • N. Fridman Noy, D.L. McGuinness. Ontology Development 101: A Guide to Creating
  • Your First Ontology. Stanford Knowledge Systems Laboratory Technical Report KSL-
  • 01-05, (2001)
  • John Davies , Rudi Studer , Paul Warren, Semantic Web Technologies: Trends and
  • Research in Ontology-based Systems. John Wiley & Sons, 2006
  • A. Maedche, S. Staab. Ontology learning. Handbook on Ontologies, pp. 173-189,
  • Springer, (2004)
  • S. Esmaili, H. Abolhassani, A Categorization Scheme for Semantic Web Search
  • Engines, In IEEE Computer Systems and Applications 2006, pp. 171-178, (2006)
  • C. Rocha, D. Schwabe, M.P. Aragao, A Hybrid Approach for Searching in the
  • Semantic Web, In Proc. of WWW 2004, (2004)

دیدگاه‌ها