رفتن به مطلب

راهنمایی در رابطه با بازشناسی حروف فارسیocr


Mahsa.AI

ارسال های توصیه شده

آقا ایمان من تصویر متن که میدم اصولا سیاه سفید هستش ولی برای اینکه خیالمون راحت شه میخوام عکس رو سیاه سفید کنم خب بعد الان مخوام ستون به ستون این عکس رو پیش بره بخاطر همین دو تا حلقه گذاشتم که در هر ستون ردیف به ردیف چک کنه اگر اون خونه سیاه بود تو یک ماتریس کمکی که معادل ماتریس عکسمونه یک بزاره در غیر اینصورت یعنی متن نیست صفر بزاره

 

 

یه تصویر باینری می خوای داشته باشی که جاهایی که صفره، یعنی متن هست رو توش یک نشون بده؟

خب واسه این که نیاز به حلقه نداری:

 

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

 

اینجا چون می خواستم متوجه بشین چیکار می کنه، 50 گذاشتم، شما به جاش عددی که می خواین رو بذارین. استفاده از im2bw که خانوم hhamidy گفتن هم پیشنهاد خوبیه.

لینک به دیدگاه
مرسی هانیه جان راهنماییت خوب بود. و سوال چه فرقی بین rgb2gray و im2bw هست وچه مزیت هایی نسبت به هم دیگه دارند؟

 

خواهش می کنم مهسا جان: :icon_gol:

 

rgb2gray تصویر رنگی رو به خاکستری تبدیل می کنه.

اینکه می گیم تصویرمون سیاه و سفید میشه اصطلاحی هست.حالا بین این مقدار سیاه و سفید خودش میتونه 0 تا 255 مقدار باشه.(اینا سطوح مختلف خاکستری بودن هستن که اصطلاحا بهشون شدت زوشنایی هم می گیم).البته این مقدار 255 هم میتونه با مقدار سطح آستانه ای که بهش میدیم تغییر کنه و مقدارش کمتر بشه.(این توابع یه سطح آستانه هم دارن که اگر مقداری یراش تعیین نکنیم همون مقدار پیش فرضشون رو خواهند داشت مثل مثال بالا که براش مقداری نذاشتیم و فقط تبدیلش کردیم به خاکستری).

اما im2bw تصویر رو واقعا به دو سطح سیاه و یا سفید یعنی 0 یا 1 تبدیل می کنه و دیگه ماتریس تصویرمون غیر از 0 و 1 مقدر دیگه ای نداره.(اینجا هم سطح آستانه به این معنا هست که مقادیر پایین تر از سطح آستانه ای که تعییین می کنیم مقدار 0 و مقادیر بیشتر از اون مقدار 1 بهشون اختصاص داده می شه).

تو مثال بالا مقداری براش در نظر نگرفتیم پس به صورت پیش فرض فکر می کنم مقدار 0.5 رو در نظر می گیره.

طبیعتا کار با یه همچین ماتریسی بسیار راحتتر خواهد بود البته زمانی که امکان پذیره که از این تبدیل استفاده کنیم و در مواقع لازم

:a030:

لینک به دیدگاه

سلام دوستان من تصویر جدید قرار دادم و فونت و عوض کردم برا ی ادامه کار بهتر به نظرم ولی موارد اسکن شده ممکن نویز و ... داشته باشه که این تصویر گیفیتش بهتر هستش.5.jpg

لینک به دیدگاه

سلام دوستان من یک عکس از یک متن یک خطی گذاشتمکه کارمساده تر بشه بعد برم سراغ متن کامل لطفا دوستانی که خواستن دانلود کنند کیفیتش پایین بود مجددا تایپ کنند و بعد عکس بگیرند.

:icon_redface:

9.png

لینک به دیدگاه
سلام دوستان من یک عکس از یک متن یک خطی گذاشتمکه کارمساده تر بشه بعد برم سراغ متن کامل لطفا دوستانی که خواستن دانلود کنند کیفیتش پایین بود مجددا تایپ کنند و بعد عکس بگیرند.

:icon_redface:

حالا خوب شد:w16:.

 

البته جسارتا :

به کسم مکن حوالت که بجز تو کس ندارم:a030:.

لینک به دیدگاه

دوستان عزیز من الان از روی پروفایل بالایی شکل فقط حرف نون فارسی رو در اوردم البته تو شکلها که تو پیوست قرار میدم زیر کلمه نظر که حرف ظ را تا ابتداش رفتم حالا میشه تو شرط جدایی حروف باهام هم فکری کنید؟ ممنون:4564::4564:

IMG_۲۰۱۴۰۷۲۳_۲۲۰۵۲۴.jpg

لینک به دیدگاه
دوستان عزیز من الان از روی پروفایل بالایی شکل فقط حرف نون فارسی رو در اوردم البته تو شکلها که تو پیوست قرار میدم زیر کلمه نظر که حرف ظ را تا ابتداش رفتم حالا میشه تو شرط جدایی حروف باهام هم فکری کنید؟ ممنون:4564::4564:

 

عزیز امکانش هست یه کم بیشتر توضیح بدی؟:ws52:

لینک به دیدگاه

هانیه جان من خودم موندم باید شرط های شکستن و پیدا کنم که مونده حالا ی موضوع دیگه بگم

بچه ها الان حرف ن 8تا پیکسل افقی هستش، من میخوام برای استخراج ویژگیش از مکان مشخصه استفاده کنم، میخوام یک کادر دور اون تعریف کنم یعنی یک کادر 21*10 در متلب که دور حرفم باشه کسی این موضوع رو کدشو بلد و بگه در چند نقطه از به ترتیب سمت راست و بالا و چپ و پایین قطع شده یعنی یک نقطه مرکزی در کادر در نظر میگیریم حالا میگیم از سمت چپ و راست و بالا و پایین چند تا پیکسل سیاه داریم مرحله بعدش و میگم.

لینک به دیدگاه
دوستان عزیز من الان از روی پروفایل بالایی شکل فقط حرف نون فارسی رو در اوردم البته تو شکلها که تو پیوست قرار میدم زیر کلمه نظر که حرف ظ را تا ابتداش رفتم حالا میشه تو شرط جدایی حروف باهام هم فکری کنید؟ ممنون:4564::4564:

 

هانیه جان من خودم موندم باید شرط های شکستن و پیدا کنم که مونده حالا ی موضوع دیگه بگم

بچه ها الان حرف ن 8تا پیکسل افقی هستش، من میخوام برای استخراج ویژگیش از مکان مشخصه استفاده کنم، میخوام یک کادر دور اون تعریف کنم یعنی یک کادر 21*10 در متلب که دور حرفم باشه کسی این موضوع رو کدشو بلد و بگه در چند نقطه از به ترتیب سمت راست و بالا و چپ و پایین قطع شده یعنی یک نقطه مرکزی در کادر در نظر میگیریم حالا میگیم از سمت چپ و راست و بالا و پایین چند تا پیکسل سیاه داریم مرحله بعدش و میگم.

 

سلام

توی حروف انگلیسی این مشکل وجود نداره، بهم پیوسته نیستن (تو فونت های حالت معمول). اما اینجا هر حرفی می تونه چند حالت مختلف داشته باشه، بسته به اینکه کجای کلمه قرار بگیره و به چه حرفی متصل بشه.

 

نمی دونم دقیقا می خوای چیکار کنی، ولی اینجا اومدم کادر مورد نظر رو با imrect میگیرم (بعد از انتخاب کادر دابل کلیک)، بعد دورش خط می کشم و داخل یه figure دیگه همون قسمت رو نشون میدم، میشه فقط یه حرف رو انتخاب کرد یا چند تا:

 

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

 

o68gipyw170l27u3io.png

لینک به دیدگاه

بچهه ها اینم کد که میزارم ولی وقت ندارم اصلا توضیح بدم بعد تحویل پروژم توضیح میدم اجرا کنید متوجه میشید ولی

img = imread('b.png');

BW = im2bw(img);

BW=imcomplement(BW);

[r,t] = find(BW==1);

Con_BW = BW(min®:max®,min(t):max(t));

[m,n] = size(Con_BW);

imshow(Con_BW)

:banel_smiley_4::banel_smiley_4::banel_smiley_4:

لینک به دیدگاه
  • 4 هفته بعد...

سلام دوستان یک جمع بندی از کارم میکنم که بقیه خواستند ادامه بدند راحت باشند

اول از همه از آقا ایمان و خانم حمیدی که خیلی کمک کردند ممنون هستم و براشون آرزوی موفقیت میکنم.

 

خب بازشناسی متون فارسی رو ما به بازشناسی حروف شکوندیم تا کار راحت تر پیش بره به علت اینکه ساختار متون فارسی دارای پیچیدگی هایی می باشد که سگمنتیشن زمان زیادی از ما میگیره و روش دقیقی برای سگمنتیشن زیر حروف ارائه نشده که جواب دقیقی به ما دهد.

ابتدا ما بادستور imread یک عکس را از ورودی میخونیم و بعد استخراج ویژگی میکنیم.(روش های بسیار زیادی برای استخراج ویژگی وجود داره از جمله گشتاورها، هیستوگرام، مکان مشخصه و.. که من از هیستوگرام و مکان مشخصه استفاده کردم و هرکس نیاز داشت بپرسه توضیح کامل میدم.)

بعد از استخراج ویژگی به ما یک بردار یا یک ماتریس میدهد که این را به شبکه عصبی میدهیم تا الگوی ما را بازشناسی کنه بهترین شبکه های عصبی در این مورد فازی و ام ال پی و RBF می باشد که RBF جدیدا بیشتر مورد استفاده قرار گرفته .

 

نکته ای که باید توجه کنید این هست که به استخراج ویژگی تون دقت کنید و بهترین روش را انتخاب نمایید تا دقت برنامه اتان بالا شود در غیر اینصورت هرچقدر هم مراحل پیش پردازش را دقیق انجام دهید برنامه جواب مناسبی نمی دهد و خطای زیادی در بازشناسی خواهید داشت.

و اینکه دوستانی که نمیخواند از شبکه عصبی استفاده کنند میتونند از تکنیک PCA استفاده کنند که برای تطبیق الگو هست و در زمینه شناسایی چهره بیشتر استفاده شده است.

 

امیدوارم همه در همه مقاطع موفق باشند:a030::icon_gol::icon_gol::a030:

لینک به دیدگاه
سلام دوستان یک جمع بندی از کارم میکنم که بقیه خواستند ادامه بدند راحت باشند

اول از همه از آقا ایمان و خانم حمیدی که خیلی کمک کردند ممنون هستم و براشون آرزوی موفقیت میکنم.

 

خب بازشناسی متون فارسی رو ما به بازشناسی حروف شکوندیم تا کار راحت تر پیش بره به علت اینکه ساختار متون فارسی دارای پیچیدگی هایی می باشد که سگمنتیشن زمان زیادی از ما میگیره و روش دقیقی برای سگمنتیشن زیر حروف ارائه نشده که جواب دقیقی به ما دهد.

ابتدا ما بادستور imread یک عکس را از ورودی میخونیم و بعد استخراج ویژگی میکنیم.(روش های بسیار زیادی برای استخراج ویژگی وجود داره از جمله گشتاورها، هیستوگرام، مکان مشخصه و.. که من از هیستوگرام و مکان مشخصه استفاده کردم و هرکس نیاز داشت بپرسه توضیح کامل میدم.)

بعد از استخراج ویژگی به ما یک بردار یا یک ماتریس میدهد که این را به شبکه عصبی میدهیم تا الگوی ما را بازشناسی کنه بهترین شبکه های عصبی در این مورد فازی و ام ال پی و RBF می باشد که RBF جدیدا بیشتر مورد استفاده قرار گرفته .

 

نکته ای که باید توجه کنید این هست که به استخراج ویژگی تون دقت کنید و بهترین روش را انتخاب نمایید تا دقت برنامه اتان بالا شود در غیر اینصورت هرچقدر هم مراحل پیش پردازش را دقیق انجام دهید برنامه جواب مناسبی نمی دهد و خطای زیادی در بازشناسی خواهید داشت.

و اینکه دوستانی که نمیخواند از شبکه عصبی استفاده کنند میتونند از تکنیک PCA استفاده کنند که برای تطبیق الگو هست و در زمینه شناسایی چهره بیشتر استفاده شده است.

 

امیدوارم همه در همه مقاطع موفق باشند:a030::icon_gol::icon_gol::a030:

 

سلام.

 

خواهش میکنم مهسا جان.

لطف داری خانوم :icon_gol:.

من که کاری نکردم.

 

همونطور که دوستان میدونن OCR موضوع خیلی مهمیه و یکی از مباحث اصلی در عرصه ی هوش مصنوعی به حساب میاد.

توضیحاتت بسیار گویا بود، ممنون :icon_gol:

 

موفق باشی عزیزم.

 

از آقا ایمان هم بخاطر راهنمایی و همکاری همیشگیشون تشکر می کنم.

لینک به دیدگاه

به گفتگو بپیوندید

هم اکنون می توانید مطلب خود را ارسال نمایید و بعداً ثبت نام کنید. اگر حساب کاربری دارید، برای ارسال با حساب کاربری خود اکنون وارد شوید .

مهمان
ارسال پاسخ به این موضوع ...

×   شما در حال چسباندن محتوایی با قالب بندی هستید.   حذف قالب بندی

  تنها استفاده از 75 اموجی مجاز می باشد.

×   لینک شما به صورت اتوماتیک جای گذاری شد.   نمایش به صورت لینک

×   محتوای قبلی شما بازگردانی شد.   پاک کردن محتوای ویرایشگر

×   شما مستقیما نمی توانید تصویر خود را قرار دهید. یا آن را اینجا بارگذاری کنید یا از یک URL قرار دهید.

×
×
  • اضافه کردن...