آفتاب

آشنایی با. بینایی ماشین

آشنایی با. بینایی ماشین

همشهری آنلاین: بینایی ماشین همان‌طور که از نامش پیداست قابلیتی است که به‌واسطه‌ی آن، کامپیوتر قادر به تحلیل و پردازش محیط اطراف خود است.

به‌گفته‌ی پاول گراهام دانشمند کامپیوتر، کارآفرین و سرمایه‌گذاری اقتصادی:همان‌طور که حرف می‌زنی، بنویس. 

با درنظرگرفتن این نقل‌قول می‌توان به تعریف بینایی ماشین پرداخت. در این مقاله فرض می‌شود مخاطب چیزی در این مورد نمی‌داند. TechCrunch باتوجه‌به این مسئله این تعریف را ارائه می‌کند: شخصی در اتاق یک توپ را به سمت شما پرتاب می‌کند و شما آن را می‌گیرید. ساده است، نه؟ اما این فرایند یکی از پیچیده‌ترین فرآیندهایی است که برای درک آن تلاش می‌کنیم.

و حالا یک نگاه فوری به ویکیپدیا بیندازید: بینایی ماشین یک زمینه‌ی میان‌رشته‌ای است که با نحوه‌ی ساخت کامپیوترها برای دستیابی به درک سطح‌ بالایی از تصاویر دیجیتالی یا ویدئوها سروکار دارد. بینایی ماشین دقیقا همان‌طور است که به نظر می‌رسد (کامپیوتر یا ماشین اشیا را می‌بینند) و تفاوت‌های اندکی با زمینه‌های مرتبط خود دارد.

براساس ویکی‌پدیا، بینایی ماشین عبارت است از: باز کردن اطلاعات سمبلیک داده‌های تصویری با استفاده از مدل‌هایی که به کمک هندسه، فیزیک، آمار و نظریه‌ی یادگیری ساخته شده‌اند. 

  • تاریخچه‌ی پرماجرا و طولانی بینایی ماشین

درست در زمان مرگ والت دیزنی و تولد مخترع ویکیپدیا، مردم در تلاش بودند نعمت بینایی را به کامپیوتر هدیه کنند. متن زیر برنامه‌ریزی برای ساخت یک سیستم بصری را نشان می‌دهد. براساس این متن ساخت هر بخش از این سیستم بر عهده‌ی گروه‌های مختلف است و این پروژه به یک نقطه‌ی شاخص در توسعه‌ی تشخیص الگو تبدیل می‌شود.

در این متن اشاره شده است که هدف اصلی این پروژه، ساخت سیستمی برای طبقه‌بندی اشیا و پس‌زمینه در یک تصویر است.  پیشرفت‌های قرن بیست‌ویک در زمینه‌ی محاسبات، ریاضی و زمینه‌های مرتبط، زمینه‌ای را برای این پیشرفت‌ها فراهم کرده است.

  • پردازش تصویر دیجیتال

بینایی ماشین به‌شدت به نمودارهای ون در پردازش تصویر دیجیتال وابسته است. وظایف زیر در حوزه‌ی پردازش تصویر دیجیتال قرار می‌گیرند:

تشخیص الگو: خودتوصیف. پیدا کردن قوانین.

استخراج ویژگی: تجزیه‌ی یک تصویر به ویژگی‌های مجزا

طبقه‌بندی: آیا این دسته از یال‌ها یا اشکال مانند یک خودرو به نظر می‌رسند یا سگ؟

تحلیل سیگنال چندمقیاسی: روش‌های دیگر برای دیدن این تصویر چیست؟

نگاشت گرافیکی: چگونه می‌توان یک شیء سه‌بعدی را به‌صورت دوبعدی نمایش داد؟

کد N2063440

وبگردی