رفتن به مطلب

تبدیل اسناد اسكن شده به متون نوشتاری‌


ارسال های توصیه شده

اشاره :

اگر تاكنون دقت كرده باشید، همراه با نرم‌افزارهای مجموعه آفیس، قسمتی با عنوان Microsoft Office Tools نیز نصب می‌‌شود كه شامل ابزار كاربردی و كمكی برای كاربران آفیس است.

1003403_b.jpg

 

اگر تاكنون دقت كرده باشید، همراه با نرم‌افزارهای مجموعه آفیس، قسمتی با عنوان Microsoft Office Tools نیز نصب می‌‌شود كه شامل ابزار كاربردی و كمكی برای كاربران آفیس است.

 

یكی از این ابزارها، قابلیت OCR یا Optical Character Recognition نام دارد كه در قالب دو نرم‌افزار Microsoft Office Document Scanning و Microsoft Office Document Imaging در قسمت Office Tools قرار گرفته است. قابلیت OCR صفحه اسكن شده را تحلیل و سپس متون موجود در آن را استخراج می‌كند.

 

a57_office01_s.jpg

همان‌طور كه می‌بینید روش كار واضح است. ابتدا باید اسناد مورد نظر خود را به فرمت TIFF یا Tagged Image File Format اسكن كنید و سپس به كمك قابلیت OCR، آن‌‌‌ها را به صورت Text درآورید. بدین ترتیب می‌توانید متون یك كتاب یا هر نوشته دیگری را در نرم‌افزار Word یا سایر نرم‌افزارهای آفیس وارد و آن‌ها را ویرایش كنید (این قابلیت تنها برای متون انگلیسی، فرانسه و اسپانیایی كاربرد دارد).

 

بدین منظور باید مراحل زیر را دنبال كنید:

 

íروی دكمه استارت كلیك كنید.

íعبارت All Programs را انتخاب كنید.

íعبارت Microsoft Office را انتخاب كنید.

íعبارت Microsoft Office Tools را انتخاب كنید.

 

a57_office02_s.jpg

 

íدر فهرست باز شده به دنبال عبارت Microsoft Office Document Scanning بگردید و روی آن كلیك كنید. اگر این عبارت وجود نداشت، باید آن را نصب كنید. بدین منظور سی‌دی نصب آفیس را در درایو سی‌دی قرار دهید. پس از نمایش صفحه Autorun، تیك عبارت Add or Remove Features را بزنید و روی دكمه Continue كلیك كنید. اكنون شما به صفحه سفارشی كردن نصب آفیس هدایت شده‌اید. روی علامت (+) كنار عبارت Office Tools كلیك كنید تا شاخه مربوطه باز شود.

 

در این قسمت، روی آیكون عبارت Microsoft Office Document Imaging كلیك كنید و از فهرست باز شده، عبارت Run all from my computer را انتخاب كنید. با فشردن دكمه Continue، فرآیند نصب آغاز می‌شود. پس از پایان مراحل نصب، مراحل یك تا پنج را بار دیگر تكرار كنید تا كادر محاوره‌ای با عنوان Scan New Document نمایش داده شود.

 

íدر این پنجره می‌‌توانید یكی از تنظیمات پیش‌فرض را برای اسكن سند خود در نظر بگیرید. با این حال برای ویرایش تنظیمات پیش‌فرض و یا ایجاد تنظیمات پیش‌فرض جدید، می‌توانید روی دكمه Preset Options كلیك كنید و عملیات مورد نظر خود را (ساخت، ویرایش یا حذف تنظیمات پیش‌فرض) انتخاب كنید.

 

a57_office03_s.jpg

پیشنهاد می‌كنیم برای دستیابی به یك نتیجه مطلوب، تنظیمات پیش‌فرض اسكن را روی عبارت Black & White (سیاه و سفید) دست نخورده باقی بگذارید. در عین حال اگر از چند اسكنر استفاده می‌كنید، می‌‌توانید با كلیك روی دكمه Scanner...، اسكنر مورد نظر خود را انتخاب كنید.

 

íپس از پایان تنظیمات اسكن، روی دكمه Scan كلیك كنید تا صفحه مورد نظر اسكن شود. اگر هنگام عملیات اسكن با پیغام خطایی مواجه شدید، به كادر Scan New Document بازگردید و در قسمت انتخاب اسكنر، تیك عبارت‌های Use Automatic Document Feeder و Show Scanner Driver Dialog Before Scanning را بزنید و برای تأیید تنظیمات روی دكمه Ok كلیك كنید.

 

íپس از پایان عملیات اسكن، روی دكمه Close كلیك كنید. اكنون صفحه اسكن شده در قالب فرمت تصویری TIFF و در نرم‌‌افزار Office Document Imaging Window نمایش داده شده است.

 

íاگر مایلید كه تنها قسمت خاصی از این فایل را استخراج كنید، باید دكمه چپ ماوس را نگه دارید و آن را روی قسمت مورد نظر بكشید.

 

íدر بالای صفحه، منوی Tools را انتخاب كنید.

íزیرمنوی Send Text to Word را كلیك كنید تا پنجره مربوطه نمایش داده شود.

a57_office04_s.jpg

íبرای استخراج تمام متون فایل TIFF، تیك عبارت All Pages را بزنید. اما اگر می‌‌خواهید تنها متون انتخاب شده استخراج شوند، تیك عبارت Current Selection را بزنید.

اگر می‌خواهید خروجی عملیات تبدیل فایل TIFF به Text، فاقد تصاویر سند اسكن شده باشد، تیك عبارت Maintain Pictures in Output را بردارید.

 

íپس از اتمام تنظیمات مربوطه، روی دكمه Ok كلیك كنید. با این كار، نرم‌افزار Word باز شده و فایل TIFF در قالب سند نوشتاری (Text) نمایش داده می‌‌شود. در صورت نیاز می‌توانید آن‌ها را ویرایش كنید.

 

علاوه بر روشی كه در بالا به آن پرداختیم، در نرم‌افزار Document Imaging می‌توانید فایل‌های TIFF را به Text تبدیل كنید. بدین منظور از منوی File عبارت ... Import را انتخاب كنید. در پنجره باز شده، به دنبال فایل TIFF مورد نظر بگردید و پس از انتخاب آن روی دكمه Import كلیك كنید. اكنون می‌توانید با طی كردن مراحل نه تا چهارده، متون فایل TIFF را استخراج نمایید.

 

باید به این نكته توجه داشته باشید كه هنگام تحلیل یك صفحه توسط قابلیت OCR، احتمالاً با این پیغام خطا مواجه خواهید شد.

 

Unable to perform OCR in Farsi: این پیغام زمانی نمایش داده می‌شود كه زبان انتخابی پیش‌فرض سیستم شما، فارسی باشد. برای رفع این مشكل از منوی Tools نرم‌افزار Document Imaging، عبارت Options را انتخاب نمایید. سپس در زبانه OCR و از منوی كركره‌ای OCR Language، زبان English را انتخاب كنید.

  • Like 4
لینک به دیدگاه
سلام...نرم افزار خاصی رو سراغ نداری که بتونه اسناد فارسی رو به ورد تبدیل کنه؟؟

سلام ... نه دوست عزیزم ، ولی براتون پرس و جو میکنم . :ws37:

لینک به دیدگاه
×
×
  • اضافه کردن...