سرپرست تیم ترجمه: مهندس محمد علایی
ایمیل: Translate@Tnt3.ir
تلفن همراه: 09192164907
پردازش تصاویر امروزه بیشتر به موضوع پردازش تصویر دیجیتال گفته میشود که شاخهای از دانش رایانه است که با پردازش سیگنال دیجیتال که نماینده تصاویر برداشته شده با دوربین دیجیتال یا پویش شده توسط پویشگر هستند سر و کار دارد.
پردازش تصاویر دارای دو شاخه عمدهٔ بهبود تصاویر و بینایی ماشین است. بهبود تصاویر دربرگیرندهٔ روشهایی چون استفاده از فیلتر محوکننده و افزایش تضاد برای بهتر کردن کیفیت دیداری تصاویر و اطمینان از نمایش درست آنها در محیط مقصد (مانند چاپگر یا نمایشگر رایانه)است، در حالی که بینایی ماشین به روشهایی میپردازد که به کمک آنها میتوان معنی و محتوای تصاویر را درک کرد تا از آنها در کارهایی چون رباتیک و محور تصاویر استفاده شود.
در معنای خاص آن پردازش تصویر عبارتست از هر نوع پردازش سیگنال که ورودی یک تصویر است مثل عکس یا صحنهای از یک فیلم. خروجی پردازشگر تصویر میتواند یک تصویر یا یک مجموعه از نشانهای ویژه یا متغیرهای مربوط به تصویر باشد. اغلب تکنیکهای پردازش تصویر شامل برخورد با تصویر به عنوان یک سیگنال دو بعدی و بکاربستن تکنیکهای استاندارد پردازش سیگنال روی آنها میشود. پردازش تصویر اغلب به پردازش دیجیتالی تصویر اشاره میکند ولی پردازش نوری و آنالوگ تصویر هم وجود دارند. این مقاله در مورد تکنیکهای کلی است که برای همه آنها به کار میرود.
تصاویر سنجش شده که از تعداد زیادی مربعات کوچک (پیکسل) تشکیل شدهاند. هر پیکسل دارای یک شماره رقمی(Digital Number) میباشد که بیانگر مقدار روشنایی آن پیکسل است. به این نوع تصاویر، تصاویر رستری هم میگویند. تصاویر رستری دارای سطر و ستون میاشند.
برای مشخص کردن یک پیکسل روشهای مختلفی استفاده میشود. آنچه که متداول تر است RGB است، که ۳ کانال مختلف برای ۳ رنگ قرمز، سبز و آبی در نظر میگیرد. اما در پردازش تصویر از فضاهای رنگی دیگری استفادهٔ بیش تری میشود. برای مثال فضای رنگ HSV. در صورتی که از ۳ کانال قرمز و سبز و آبی استفاده شود و برای هر کانال ۱ بایت در نظر گرفته شود، هر کانال دارای ۲۵۶ حالت (۲ به توان ۸) خواهد بود. در نتیجه هر پیکسل ۱۶۷۷۷۲۱۶ (۲۵۶ به توان ۳) رنگ مختلف را میتواند نشان دهد.
تفکیکپذیری تصویر به تعداد پیکسلها در طول و عرض تصویر بستگی دارد.
با یک تصویر ۴ بیتی، حداکثر دامنه روشنایی ۱۶ (۲ به توان ۴) میباشد که دامنه آن از ۰ تا ۱۵ نشان داده میشود. در این حالت تصویر کیفیت پایینی را به نسبت تصاویری با نرخ بیت بالاتر ارائه میکند. تصویر ۸ بیتی حداکثر دامنه ۲۵۶ دارد و تغییرات آن بین ۰ تا ۲۵۵ است؛ که دقت بالاتری دارد.
مقالهٔ اصلی: فشردهسازی تصاویر
برای ذخیرهسازی تصاویر مطلوب است حجم اطلاعات تا جایی که ممکن است کاهش یابد و اساس بسیاری از روشهای فشردهسازی کنار گذاردن بخشهایی از اطلاعات و دادهها است.
میتوان با ضریب یا نسبت فشردهسازی است میزان کنار گذاشتن اطلاعات را مشخص کرد. فشرده سازی تصاویر، ذخیرهسازی و انتقال اطلاعات را آسانتر میکند و میتواند سبب کاهش پهنایباند و فرکانس مورد نیاز شود.
امروزه روشهای متعدد و پیشرفتهای برای فشردهسازی وجود دارد. فشردهسازی تصویر با توجه به این گزارهٔ مهم صورت میگیرد که چشم انسان حد فاصل دو عنصر تصویری نزدیک به هم را یکسان دیده و به خوبی تمایز آنها را نمیتواند تشخیص دهد. همچنین اثر نور و تصویر برای مدت زمان معینی در چشم باقی میماند که این پدیده در ساخت تصاویر متحرک مورد توجه میباشد.
نام این فرمت در واقع مخفف کلمات JOINT PHOTOGRAPHIC EXPERT GROUP است. از این روش در فشردهسازی عکس و تصاویر گرافیکی ساکن استفاده میشود JPEG اولین و سادهترین روش در فشردهسازی تصویر است به همین دلیل در ابتدا سعی شد برای فشردهسازی تصاویر متحرک مورد استفاده قرار گیرد. برای این منظور تصاویر به صورت فریم به فریم مانند عکس فشرده میشدند وبا ابداع روش MOTION JPEG برای ارتباط دادن این عکسها به هم تلاش شد که با مشکلاتی همراه بود.
نام این فرمت مخفف عبارت MOVING PICTURE EXPERT GROUP است. این روش در ابتدای سال ۹۰ ابداع شد و در آن اطلاعات تصویر با سرعت حدود ۵/۱ مگابیت بر ثانیه انتقال پیدا میکرد که در تهیه تصاویر ویدئویی استفاده میشد. با این روش امکان ذخیره حدود ۶۵۰ مگابایت اطلاعات معادل حدود ۷۰ دقیقه تصویر متحرک در یک دیسک به وجود آمد. در MPEG بیتهای اطلاعات به صورت سریال ارسال میشوند و به همراه آنها بیتهای کنترل و هماهنگکننده نیز ارسال میشوند که موقعیت و نحوه قرارگیری بیتهای اطلاعاتی را برای انتقال و ثبت اطلاعات صدا و تصویر تعیین میکند.
در روش MPEG۲ از ضریب فشردهسازی بالاتری استفاده میشود و امکان دسترسی به اطلاعات ۳ تا ۱۵ مگابیت بر ثانیهاست از این روش در دیویدیهای امروزی استفاده میشود در اینجا نیز هر فریم تصویری شامل چندین سطر از اطلاعات دیجیتالی است.
از این روش برای تجهیزاتی که با انتقال سریع یا کند اطلاعات سرو کار دارند استفاده میشود. این روش توانایی جبران خطا و ارائه تصویر با کیفیت بالا را دارد. مسئله خطا و جبران آن در مورد تلفنهای همراه و کامپیوترهای خانگی و لپتاپها و شبکهها از اهمیت زیادی برخوردار است. در شبکههای کامپیوتری باید تصویر برای کاربرانی که از مودمهای سریع یا کند استفاده میکنند به خوبی نمایش داده شود، در چنین حالتی روش MPEG ۴ مناسب است. از این روش در دوربینهای تلویزیونی نیز استفاده میشود. ایده اصلی این روش تقسیم یک فریم ویدئویی به یک یا چند موضوع است که مطابق قاعده خاصی کنار هم قرار میگیرند مانند درختی که از روی برگهای آن بتوان به شاخه تنه یا ریشه آن دست یافت. هر برگ میتواند شامل یک موضوع صوتی یا تصویری باشد. هر کدام از این اجزاء به صورت مجزا و جداگانه قابل کپی و یا انتقال هستند. این تکنیک را با آموزش زبان میتوان مقایسه کرد.
همانطوریکه در آموزش زبان کلمات به صورت مجزا و جداگانه قرار داده میشوند و ما با مرتب کردن آن جملات خاصی میسازیم و میتوانیم در چند جمله، کلمات مشترک را فقط یکبار بنویسیم و هنگام مرتب کردن آنها به کلمات مشترک رجوع کنیم، در اینجا هم هر یک از این اجزاء یک موضوع خاص را مشخص میکند و ما میتوانیم اجزاء مشترک را فقط یکبار به کار ببریم و هنگام ساختن موضوع به آنها رجوع کنیم. هر یک از موضوعات هم میتوانند با موضوعات دیگر ترکیب و مجموعه جدیدی را بوجود آورند. این مسئله باعث انعطافپذیری و کاربرد فرمهندس علایین روش MPEG۴ میشود. برای مثال به صحنه بازی تنیس توجه کنید. در یک بازی تنیس میتوان صحنه را به دو موضوع بازیکن و زمین بازی تقسیم کرد زمین بازی همواره ثابت است بنا بر این بعنوان یک موضوع ثابت همواره تکرار میشود ولی بازیکن همواره در حال حرکت است و چندین موضوع مختلف خواهد بود. این مسئله سبب کاهش پهنای باند اشغالی توسط تصاویر دیجیتالی میشود. توجه داشته باشید که علاوه بر سیگنالهای مربوط به این موضوعات سیگنالهای هماهنگ کنندهای هم وجود دارند که نحوه ترکیب و قرارگیری صحیح موضوعات را مشخص میکند.
امروزه با پیشرفت تجهیزات تصویر برداری و الگوریتمهای پردازش تصویر شاخهٔ جدیدی در کنترل کیفیت و ابزار دقیق به وجود آمدهاست؛ و هر روز شاهد عرضه سیستمهای تصویری پیشرفته برای سنجش اندازه، کالیبراسیون، کنترل اتصالات مکانیکی، افزایش کیفیت تولید و ... هستیم.
با استفاده از تکنیکهای پردازش تصویر میتوان دگرگونی اساسی در خطوط تولید ایجاد کرد. بسیاری از پروسههای صنعتی که تا چند دهه پیش پیادهسازی شان دور از انتظار بود، هم اکنون با بهرهگیری از پردازش هوشمند تصاویر به مرحله عمل رسیدهاند. از جمله منافع کاربرد پردازش تصویر به شرح زیر است.
کنترل ماشین آلات و تجهیزات صنعتی یکی از وظایف مهم در فرایندهای تولیدی است. به کارگیری کنترل خودکار و اتوماسیون روزبه روز گستردهتر شده و رویکردهای جدید با بهرهگیری از تکنولوژیهای نو امکان رقابت در تولید را فراهم میسازد. لازمه افزایش کیفیت و کمیت یک محصول، استفاده از ماشین آلات پیشرفته و اتوماتیک میباشد. ماشین آلاتی که بیشتر مراحل کاری آنها به طور خودکار صورت گرفته و اتکای آن به عوامل انسانی کمتر باشد. امروزه استفاده از تکنولوژی ماشین بینایی و تکنیکهای پردازش تصویر کاربرد گستردهای در صنعت پیدا کردهاست و کاربرد آن بویژه در کنترل کیفیت محصولات تولیدی، هدایت روبات و مکانیزمهای خود هدایت شونده روز به روز گستردهتر میشود.
عدم اطلاع کافی بعضی مهندسان در بعضی کشورها از تکنولوژی ماشین بینایی و عدم آشنایی با توجیه اقتصادی به کارگیری آن موجب شدهاست که در استفاده از این تکنولوژی تردید و در بعضی مواقع واکنش منفی وجود داشته باشد. علیرغم این موضوع، ماشین بینایی روز به روز کاربرد بیشتری پیدا کرده و روند رشد آن چشمگیر بودهاست. عملیات پردازش تصویر در حقیقت مقایسهٔ دو مجموعه عدد است که اگر تفاوت این دو مجموعه از یک محدوده خاص فراتر رود، از پذیرفتن محصول امتناع شده و در غیر اینصورت محصول پذیرفته میشود. در زیر پروژههایی که در زمینهٔ پردازش تصاویر پیادهسازی شده است، توضیح داده میشود. این پروژهها با استفاده از پردازش تصویر، شمارش و اندازهگیری اشیاء، دستهبندی اشیاء، تشخیص عیوب مثل تشخیص ترک، و بسیاری عملیات دیگر را انجام میدهند:
رشد استفاده از سیستمهای کنترل هوشمند سرعت و ثبت تخلف در سالهای اخیر مشهود بوده است. این سیستمها برای تشخیص سرعت خودروهای عبوری، از روشهای متفاوتی استفاده میکنند. در این زمینه میتوان از الگوریتمهای پردازش تصویر استفاده کرد. با استفاده از دو دوربین و کالیبره کردن آنها و پردازش تفاوت دید موجود در تصاویر بدست آمده از دو دوربین امکان تشخیص عمق خودروی عبوری فراهم میشود؛ و با توجه به مکان خودرو در لحظههای مختلف، سرعت خودرو قابل محاسبه است. از مزایای استفاده از روش سرعت سنجی خودروها به کمک پردازش تصویر نسبت به دیگر روشها مانند رادار و یا لیزر، پسیو بودن این روش است. بدین ترتیب امکان ثبت نشدن تخلف به علت استفاده متخلف از دستگاههای مختل کننده (Jammer) وجود ندارد. همچنین دستگاههای هشدار دهنده وجود سیستمهای سرعت سنج که با آشکار سازی امواج رادار به متخلف هشدار میدهند نیز دیگر کاربری نخواهند داشت. این سیستمهای سرعت سنج دارای دونوع هستند.[۱]
- سرعت سنج ثابت که بر روی پایههایی در کنار بزرگراهها و جادهها نصب میشوند.[۲] - سرعت سنج خودرویی که بر روی خودروی پلیس سوار میشود. به علت حرکت خودروی پلیس استفاده از الگوریتمهای ثابت کننده تصویر به منظور حذف حرکت خودروی پلیس لازم میباشد. از این نمونه بر روی خودروهای زانتیای کنترل نامحسوس پلیس ایران نصب شده است.[۳]
پلاک خوانی خودرو با آموختن کاراکترهایی که پلاک خودرو از آن تشکیل شده است میتوان در تصویر بدست آمده از دوربین پلاک خوان به دنبال آن کاراکترها گشت. سیستمهای پلاک خوان خودرو کاربردهای مختلفی دارد که میتوان به چند نمونه اشاره کرد.[۴]
پلاک خوان پارکینگی با بهرهگیری از توان قرائت پلاک به منظور هوشمندسازی و اتوماسیون پارکینگهای عمومی مورد استفاده قرار میگیرد. این سامانه با ثبت ورود و خروج هر یک از خودروها و محاسبه هزینه پارک خودرو بر حسب تعرفه و زمان پارک بودن خودرو کمک شایانی به مدیریت پارکینگ مینماید.
از این پلاک خوان به منظور ثبت پلاک خودرو و کنترل تردد خودروها استفاده میگردد. به کار گیری این نوع از پلاک خوانها برای سازمانها و ادارات جهت امکان کنترل تردد خودروها و انواع گزارشها، تعریف افراد مجاز و مهمان در سامانه، کنترل دربها با راهبند مکانیزه برای افراد مجاز مناسب میباشد.
این پلاک خوان جهت ثبت پلاک خودرو و آمارگیری تردد خودروها استفاده شده و از نرمافزار سادهای بهره برده و قرائت و ثبت پلاکهای عبوری با آن صورت میپذیرد.
پلاک خوان جامع در واقع به منظورکاربرد ترکیبی پلاک خوان سازمانی و پارکینگی تعریف شده است و برای مواردی بکار میرود که محاسبات مالی برای پلاکهای ناشناس با تعریف افراد مجاز دائمی ترکیب میشود و قابلیتهای هر دو سامانه را دارا میباشد.