رفتن به مطلب

پایان نامه ارشد کامپیوتر با موضوع استخراج اتوماتیک اطلاعات بر اساس آنتالورژی


ارسال های توصیه شده

پایان نامه استخراج اتوماتيك اطلاعات بر اساس آنتالوژي توسط مهدي طالبيان كوچكسرايي و به راهنمایی دكتر فريدون شمس و مشاوره دكتر مهرنوش شمس فرد برای دریافت درجه کارشناسی ارشد مهندسی کامپیوتر گرایش نرم افزار از دانشگاه آزاد اسلامی واحد علوم تحقیقات تهران در سال 1386 تهیه شده است.

 

چکیده

لازمه توسعه و گسترش وب معنايي ، ازدياد هر چه بيشتر آنتالوژي ها مي باشد . آنتالوژي ها با ايجاد فهم مشترك از مفاه يم موجود در دامنه دانش ، امكان همكاري و تبادل اطلاعات بين ماشين ها را بوجود مي آورند . اما ايجاد دستي آنتالوژي ها سخت و طاقت فرسا بوده و احتمال بروز خطاي انساني نيز بسيار زياد مي باشد . از اين رو ، استخراج اطلاعات از منابع وب بصورت نيمه اتوماتيك و يا تمام اتوماتيك مورد توجه بسياري از محققان قرار گرفته است. اولين ايده در استخراج اطلاعات، تهيه برنامه اي بنام Wrapper است كه اطلاعات موجود در صفحات وب را در يك قالب ساخت يافته، استخراج مي كند . ابزار هاي متنوعي جهت توليد Wrapper ها بصورت دستي، نيمه اتوماتيك و اتوماتيك مورد پژوهش قرار گرفته اند. برخي از اين ابزار ها ابتدا قواعد استخراج را آماده كرده و در هنگام استخراج اطلاعات با آگاهي از محل داده ها، به سرعت اطلاعات مورد نياز را استخراج مي نمايند . برخي ديگر نيز با استفاده از آنتالوژي استخراج، داده هاي موجود در صفحه وب را پردازش كرده و مفهوم مرتبط با هر مقدار متني را از آنتالوژي دامنه يافته و در نهايت با توجه به الگوهاي موجود، اطلاعات را استخراج مي نمايند.

در اين تحقيق، روش پيشنهادي ما كه منجر به توليد يك سيستم نرم افزاري نيز خواهد شد، توصيف Wrapper با استفاده از زبان نشان گذاري WDML مي باشد . اين زبان با تركيب مكانيزم هاي استخراج مبتني بر مكان و مبتني بر آنتالوژي، از مزاياي هر دو روش بهره مي برد . قواعد استخراج توصيف شده در فايل هاي WDML بصورت درختي تعريف شده و به آن الگوي استخراج گفته مي شود از اين رو نسبت به ساير روش ها د اراي انعطاف پذيري بسيار بالايي مي باشد . همچنين در اين تحقيق روشي را جهت توليد اتوماتيك فايل هاي WDML با استفاده از يك آنتالوژي استخراج ارائه خواهيم كرد.

 

کلمات کلیدی: وب معنايي، آنتالوژي، استخراج اتوماتيك اطلاعات، Wrapper ،WDML

 

فهرست مطالب

۱- مقدمه

۲- مفاهيم و كليات

۳- بررسي سوابق مرتبط با تحقيق

۴- معرفي سيستم ONTOBYONTO

۵- توليد اتوماتيك فايل هاي WDML

۶- ارزيابي و جمع بندي مطالب

۷- منابع

۸- ضمائم

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

  • Like 3
لینک به دیدگاه
×
×
  • اضافه کردن...