پایان نامه ارشد کامپیوتر با موضوع استخراج اتوماتیک اطلاعات بر اساس آنتالورژی

بازدید: 3595 بازدید
استخراج اتوماتیک اطلاعات

پایان نامه استخراج استخراج اتوماتیک بر اساس آنتالوژی توسط مهدی طالبیان کوچکسرایی و به راهنمایی دکتر فریدون شمس و مشاوره دکتر مهرنوش شمس فرد برای دریافت درجه کارشناسی ارشد مهندسی کامپیوتر گرایش نرم افزار از دانشگاه آزاد اسلامی واحد علوم تحقیقات تهران در سال ۱۳۸۶ تهیه شده است.

چکیده
لازمه توسعه و گسترش وب معنایی ، ازدیاد هر چه بیشتر آنتالوژی ها می باشد . آنتالوژی ها با ایجاد فهم مشترک از مفاهیم موجود در دامنه دانش ، امکان همکاری و تبادل اطلاعات بین ماشین ها را بوجود می آورند . اما ایجاد دستی آنتالوژی ها سخت و طاقت فرسا بوده و احتمال بروز خطای انسانی نیز بسیار زیاد می باشد . از این رو ، استخراج اطلاعات از منابع وب بصورت نیمه اتوماتیک و یا تمام اتوماتیک مورد توجه بسیاری از محققان قرار گرفته است. اولین ایده در استخراج اطلاعات، تهیه برنامه ای بنام Wrapper است که اطلاعات موجود در صفحات وب را در یک قالب ساخت یافته، استخراج می کند . ابزار های متنوعی جهت تولید Wrapper ها بصورت دستی، نیمه اتوماتیک و اتوماتیک مورد پژوهش قرار گرفته اند. برخی از این ابزار ها ابتدا قواعد استخراج را آماده کرده و در هنگام استخراج اطلاعات با آگاهی از محل داده ها، به سرعت اطلاعات مورد نیاز را استخراج می نمایند . برخی دیگر نیز با استفاده از آنتالوژی استخراج، داده های موجود در صفحه وب را پردازش کرده و مفهوم مرتبط با هر مقدار متنی را از آنتالوژی دامنه یافته و در نهایت با توجه به الگوهای موجود، اطلاعات را استخراج می نمایند.
در این تحقیق، روش پیشنهادی ما که منجر به تولید یک سیستم نرم افزاری نیز خواهد شد، توصیف Wrapper با استفاده از زبان نشان گذاری WDML می باشد . این زبان با ترکیب مکانیزم های استخراج مبتنی بر مکان و مبتنی بر آنتالوژی، از مزایای هر دو روش بهره می برد . قواعد استخراج توصیف شده در فایل های WDML بصورت درختی تعریف شده و به آن الگوی استخراج گفته می شود از این رو نسبت به سایر روش ها دارای انعطاف پذیری بسیار بالایی می باشد . همچنین در این تحقیق روشی را جهت تولید اتوماتیک فایل های WDML با استفاده از یک آنتالوژی استخراج ارائه خواهیم کرد.

کلمات کلیدی: وب معنایی، آنتالوژی، استخراج اتوماتیک اطلاعات، Wrapper ،WDML

فهرست مطالب پایان نامه استخراج اتوماتیک اطلاعات بر اساس آنتالورژی

۱- مقدمه
۲- مفاهیم و کلیات
۳- بررسی سوابق مرتبط با تحقیق
۴- معرفی سیستم ONTOBYONTO
۵- تولید اتوماتیک فایل های WDML
۶- ارزیابی و جمع بندی مطالب
۷- منابع
۸- ضمائم

نام فایل: پایان نامه ارشد کامپیوتر با موضوع استخراج اتوماتیک اطلاعات بر اساس آنتالورژی

دانلود فایل: لینک مستقیم

پسورد: www.noandishaan.com

منبع: نواندیشان
مقالات، مطالب، طرح ها و پروژه های خود را برای قرارگیری در سایت علمی آموزشی نواندیشان از اینجا بفرستید.

ادامه مطلب