فهرست مطالب:

مقدمه ای بر پردازش تصویر: Pixy و جایگزین های آن: 6 مرحله
مقدمه ای بر پردازش تصویر: Pixy و جایگزین های آن: 6 مرحله

تصویری: مقدمه ای بر پردازش تصویر: Pixy و جایگزین های آن: 6 مرحله

تصویری: مقدمه ای بر پردازش تصویر: Pixy و جایگزین های آن: 6 مرحله
تصویری: این آسون ترین روش برای پردازش تصویره! | سه نمونه پردازش تصویر - Pod MC #01 2024, جولای
Anonim
مقدمه ای بر پردازش تصویر: Pixy و جایگزین های آن
مقدمه ای بر پردازش تصویر: Pixy و جایگزین های آن

در این مقاله ، معنای پردازش تصویر دیجیتال (DIP) و دلایل استفاده از سخت افزاری مانند Pixy و سایر ابزارها برای ایجاد فرایند روی تصاویر یا فیلم ها را توضیح خواهیم داد. در پایان این مقاله ، خواهید آموخت:

  • چگونه یک تصویر دیجیتالی شکل می گیرد.
  • پردازش تصویر دیجیتال چیست.
  • ابزارهای پردازش تصویر
  • Pixy چیست و چگونه از آن استفاده کنیم.

مرحله 1: پردازش تصویر چیست؟

پردازش تصویر چیست؟
پردازش تصویر چیست؟

عکس ها ، فیلم ها و به طور کلی تصاویر علاوه بر ذخیره لحظه ای از خاطرات ما ، کاربردهای دیگری نیز دارند. شاید دوربین های امنیتی را در مکان های عمومی ببینید یا روبات هایی را ببینید که یک خط ، شیء یا موارد پیشرفته تری را تشخیص می دهند و وضعیت را تشخیص می دهند ، ناخالصی ها را از محصولات موجود در خط تولید جدا می کنند و بسیاری از برنامه های مشابه یا حتی مشابه با برخی محاسبات روی تصاویر انجام می دهند. نام محاسبات پردازش تصویر است.

برای درک بهتر ، دانستن ساختار تصویر مفید است. هر تصویر یک سیگنال با مقادیر پیکسل در هر نقطه از آن است. (پیکسل واحد اصلی یک تصویر دیجیتال است که می تواند برای روشنایی و/یا رنگ آن مقادیر متفاوتی داشته باشد ، این مقادیر "شدت" نامیده می شود) سیگنال سیگنال ولتاژ پیوسته است که توسط سنسور بصری داده می شود ، این سیگنال به دیجیتال تبدیل می شود با برخی از فرایندها مانند نمونه گیری شکل می گیرد. شکل دیجیتالی این داده ها مانند یک آرایه دو بعدی یا ماتریسی است که یک تصویر دیجیتالی ایجاد می کند بنابراین شکل آنها برای مکان و مقدار f (X ، Y) است. فراموش نکنید که هر ویدئو مجموعه ای از تصاویر است که با سرعت مشخصی در یک ثانیه پخش می شود.

پس از تشکیل تصویر ، روند شروع می شود. برای چه هدفی به فرایندی نیاز داریم؟ اگر به اطلاعات یک تصویر نیاز داشته باشیم ، از دید رایانه استفاده می کنیم. بینایی رایانه ای راهی برای شبیه سازی بینایی انسان است. بینایی انسان توانایی "یادگیری" و ارائه داده از ورودی های بصری را دارد. اساساً بینایی کامپیوتری زمینه ای است که باعث شده است کامپیوتر از تصاویر یا فیلم های دیجیتالی ، حتی برای استفاده در زمان واقعی ، درک بالایی ببرد. و پردازش تصویر دیجیتال بخشی از آن است.

مرحله 2: چگونه می توان پردازش تصویر را انجام داد؟

چگونه می توان پردازش تصویر را انجام داد؟
چگونه می توان پردازش تصویر را انجام داد؟
چگونه می توان پردازش تصویر را انجام داد؟
چگونه می توان پردازش تصویر را انجام داد؟

اگر ما در مورد یک برنامه رباتیک برای پردازش تصویر فکر می کنیم ، دو راه وجود دارد:

  1. انتخاب یک ماژول معمولی دوربین (ارائه تصویر بدون هیچ گونه پردازش روی آن) و سپس استفاده از برنامه نویسی و محاسبات توسط کاربر.
  2. استفاده از وسایلی سخت که این فرآیند را برای استفاده سریعتر و آسانتر انجام می دهند. مثل دوربین پیکسی…

راه حل اول: برای اولین روش ، نرم افزارهای متفاوتی مانند MATLAB یا کتابخانه هایی مانند OpenCV برای کدگذاری وجود دارد. اسامی دیگری نیز در ابزارهای پردازش وجود دارد. اما نامهای مشهوری که برای این پردازش جستجو می کنند OpenCV و MATLAB است. بیایید مقایسه سریع بین آنها را ببینیم. نمودار مقایسه MATLAB و OpenCV به ما کمک می کند.

راه حل دوم: استفاده از سخت افزار ویژه! مانند دوربین هایی با قابلیت پردازش تصویر. آنها معمولاً دارای رابط کاربری هستند و نیازی به کد نویسی ندارند. این ساده تر به نظر می رسد اما به نوعی محدودیت هایی ایجاد می کند و آنها می توانند آنچه را که برای آن تعیین شده است انجام دهند. به عنوان مثال ، یک دوربین تشخیص چهره نمی تواند تشخیص رنگ را به طور معمول انجام دهد (شاید با برخی تغییرات در سیستم عامل بتوان الگوریتم تشخیص را تغییر داد اما این یک راه سخت و معمول نیست!) دو راه ، اما کدام بهتر است؟

نمودار دوم مقایسه دو روش است.

مرحله 3: شروع به کار با Pixy

شروع به کار با Pixy
شروع به کار با Pixy

PIXY یکی از ماژول های دوربین است که برای پردازش تصویر تعیین شده است ، الگوریتم تشخیص فیلترینگ مبتنی بر رنگ است. هدف اصلی این دوربین تشخیص رنگها و نامگذاری آنها به عنوان یک شیء آشنا است. این دوربین می تواند "یاد بگیرد" چه رنگ هایی در ابتدا به آن فکر می کردید.

اکنون که می دانید Pixy چیست ، بیایید ببینیم چگونه می توانیم از Pixy استفاده کنیم.

مرحله 4: سخت افزارهای مورد نیاز

سخت افزارهای مورد نیاز
سخت افزارهای مورد نیاز

Pixy CMUcam5 سنسور تصویر

آردوینو UNO R3

مرحله 5: شروع به کار با Pixy

شروع به کار با Pixy
شروع به کار با Pixy

حالا ، گام به گام تا انتها با ما همراه باشید:

گام اول:

خرید پیکسی! PIXY معمولی و PIXY2 دو نسخه از دوربین های pixy هستند. برای خرید نوع معمولی که مراحل استفاده از این برد را ادامه می دهیم ، روی پیوند بالا کلیک کنید.

دومین:

برقش کن این برد دارای پورت USB برای تغذیه است. از طریق اتصال به پورت USB کامپیوتر تغذیه می شود. می توان آن را از طریق دو پین پشت برد با باتری (6-10 ولت) تغذیه کرد.

سوم:

آن را از طریق کابل USB به کامپیوتر وصل کنید. یک سر کامپیوتر و سر دیگر آن پورت micro USB PIXY.

چهارم:

نرم افزار دوربین خود را از اینجا بارگیری کنید. PIXY Mon برنامه PIXY برای پلتفرم لینوکس ، مک و ویندوز است. کاری که این برنامه می تواند انجام دهد پیکربندی است و آنچه PIXY می تواند ببیند را نشان می دهد.

پنجم:

تا این مرحله ، اگر شما نیاز به مشاهده و تشخیص بدون هیچ چیز دیگری دارید ، لزوماً نیازی به اتصال دوربین به میکروکنترلر یا برد نیست. تشخیص بستگی به اتصال خرد ندارد. به هر حال ، برای آموزش ، یک شی با رنگ متمایز و خوب انتخاب کنید. به دلیل الگوریتم تشخیص فیلتر رنگ بر اساس رنگ ، رنگ و نور محیط می تواند بر نتیجه تأثیر بگذارد. بنابراین ، اشیاء سفید ، سیاه یا خاکستری را انتخاب نکنید زیرا این رنگها رنگی ندارند!

ششم:

برای شروع آموزش ، دکمه بالای PIXY را فشار دهید. ابتدا LED چشمک می زند و پس از آن ، LED RGB رنگ قسمت مرکزی ناحیه دید را دریافت می کند. جسم مقابل دوربین را انتخاب کنید ، اگر LED رنگ مناسب را نشان داد ، قفل مناسب را نشان می دهد. فاصله بین لنزها و شی باید 6 تا 20 اینچ باشد. راه دوم استفاده از PIXY MON است. منطقه بزرگی از شی را در PIXY MON انتخاب کرده و سپس آن را انتخاب می کند.

هفتم:

شبکه شیء به صورت pixy mon نشان داده می شود. ببینید آیا شبکه مساحت مناسب شی است که پس زمینه را شامل نمی شود. لغزنده های پیکربندی شده می توانند به داشتن منطقه بهتر کمک کنند.

هشتم:

اکنون برای هر "رنگ" ، دوربین یک عدد را تعیین می کند. 7 امضا به معنی 7 رنگ برای تشخیص است. با استفاده از رنگ های نزدیک به هم ، به عنوان مثال ، یک برچسب با رنگ های قرمز-صورتی-آبی می توانید یک شی یا مکانی را برای دوربین تعریف کنید ، به عنوان مثال ، آن برچسب محل در را نشان می دهد. این می تواند به تشخیص هزاران شی با این دوربین کمک کند! این مجموعه رنگها "کد رنگ" یا CC نامیده می شود. برای تنظیم CC باید از PIXY mon استفاده کنید و سپس می توانید مانند هر امضا از آن استفاده کنید.

نهم:

پس از آموزش موفقیت آمیز ، اگر میکروکنترلر یا برد به دوربین متصل باشد ، می تواند شی را توسط pixy تشخیص دهد. اگر از Arduino استفاده می کنید ، از این pinout برای اتصال استفاده کنید. (برای اطلاعات بیشتر اینجا را کلیک کنید) ، سپس کتابخانه PIXY را در اینجا بارگیری کنید ، به کتابخانه های Arduino در جهت Sketch> Include library> افزودن کتابخانه ZIP اضافه کنید. حالا فایل zip کتابخانه را انتخاب کنید. تمام شد! اکنون با طرح پیش فرض PIXY ، X و Y (محل) و عرض و طول (اندازه) شیء را نشان می دهد. از طرح های دیگر نیز می توان استفاده کرد. مانند تابه و کج شدن برای اتصال سایر بردها ، اینجا را ببینید.

نکته: آموزش همانطور که توضیح دادیم دارای دو روش است: 1. استفاده از PIXY بدون PIXY MON ، مانند کاری که روبات ها انجام می دهند و به رایانه متصل نیستند. روش این است که چگونه شماره امضا را تنظیم کنیم؟ اگر PIXY در اولین لحظات تدریس تغییر رنگ می دهد ، کلیک کنید که بر روی کدام رنگ شماره را تنظیم می کند. از قرمز به معنی 1 تا بنفش به معنی 7. در روش 2 ، تنظیم اعداد فقط با کاربرد انجام می شود.

مرحله 6: بسیار نزدیک به "END"

ما توضیح دادیم که چه چیزی نیاز به استفاده از تصاویر را ایجاد کرده است ، پردازش تصویر دیجیتال چیست و چگونه می توان آن را انجام داد. از چه راه هایی که داریم و از نظر سخت افزاری که در حال حاضر می تواند به ما کمک کند ، PIXY را برای توضیح انتخاب کردیم. ما توضیح دادیم که چگونه کار می کند و اگر مبتدی دوربین های پیکسی هستید چه باید بکنید! اکنون می توانید پردازش تصویر را برای ربات کوچک خود آغاز کرده و از داشتن چشم سوم با رایانه خود لذت ببرید.

همچنین می توانید این پروژه را در وب سایت رسمی ElectroPeak بخوانید:

توصیه شده: