سیر تحول دوربین گوشیهای هوشمند در پی انقلاب هوش مصنوعی
انقلاب دوربین موبایل از زمان عرضه نسل اول آیفون اتفاق افتاد
از سال ۲۰۰۰، هر سال دوربین تلفنهای هوشمند ما به قابلیتهای شگفتانگیزی مجهز میشوند و امکانات فوقالعادهای را در اختیارمان قرار میدهند تا آنجا که امروز میتوانیم با این دستگاهها تصاویر شگفتانگیزی خلق کنیم.
بسیاری استدلال میکنند که عصر گوشیهای هوشمند مدرن در سال ۲۰۰۷ با عرضه آیفون نسل اول آغاز شد. چراکه این گوشی دارای صفحه نمایش کاملا لمسی بهجای صفحه کلید بود، امکان اتصال به اینترنت سیمکارت را داشت، از Wi-Fi و بلوتوث و یک دوربین پشتیبانی میکرد.
این ویژگیها کمکم فراگیر شد و روی همه گوشیهای هوشمند ارایه شد. اما قابلیتی که صنعت گوشیهای هوشمند را متحول کرد، پشتیبانی از فروشگاه App Store بود که در آیفون 3GS سال ۲۰۰۸ ارایه شد و دسترسی به اپلیکیشنها را ممکن کرد و عصری جدید در صنعت تلفن همراه آغاز شد.
مرحله بعدی فناوری موبایل
تلفنهای هوشمند به قطب جادویی زندگی همه ما تبدیل شدند، زیرا همچنان پیشرفتهای تدریجی مانند دوربین بهبودیافته، قابلیت تاشو و 5G حالا روی همه گوشیها وجود دارد. در سال ۲۰۲۴، دوباره هوش مصنوعی و شارژ Qi2 دنیای گوشیهای هوشمند را متحول کرد. اما از بین تمامی قابلیتها و اجزای این دستگاههای محاسباتی شگفتانگیز و همهجا حاضر، این دوربین گوشیهای هوشمند است که فوقالعادهترین تکامل را بهخود دیده است.
دوربینهای تلفن اولین بار در دورانی ظاهر شدند که گوشیهای هوشمند کمکم درحال تبدیل شدن به دستگاههای کاربردی و روزمره بودند. سپس این دوربینها با ارایه قابلیتها و اپلیکیشنها در فروشگاههای نرمافزاری پیشرفت کردند، جاییکه شرکتهایی مانند Blackmagic Design اپلیکیشنهایی ارایه کردند که نحوه عملکرد دوربین گوشیهای هوشمند را بازتعریف کرد.
گوشیهای هوشمند پیش مدرن
اولین دستگاهی که به عنوان تلفن هوشمند شناخته شد، اریکسون 88 در سال ۱۹۹۷ بود که تنها ۲۰۰ دستگاه از آن ساخته شد و عمدتاً یک دستیار دیجیتال شخصی بود که دوربین نداشت. اما قبل از عرضه گوشیهای هوشمند مدرن، دستگاههایی با برخی ویژگیهای مدرن معرفی شدند. البته شناخته شدهترین آنها بلکبری بود. اولین دستگاههای بلکبری، مدلهای 850 و 857 حتی تلفن نبودند، بلکه پیجر با امکان دسترسی به ایمیل بودند. در سال ۲۰۰۳ بلکبری 6210 با کیبورد معروف و طراحی یکپارچه عرضه شد، اما حتی در آن زمان، این گوشی دوربین نداشت.
شارپ اولین گوشی دوربیندار جهان را سال ۲۰۰۰ معرفی و عرضه کرد که J-SHO4 نام داشت و بهطور انحصاری در بازار ژاپن موجود بود. J-SHO4 با سنسور 110000 پیکسلی خود قادر به گرفتن تصاویر دیجیتالی با وضوح بسیار پایین، تصاویر ریز و تقریباً به اندازه تمبر پستی با وضوح 383×287 پیکسل بود. سامسونگ همچنین ادعا میکند که “اولین گوشی با دوربین داخلی SCH-V200 را در سال ۲۰۰۰ عرضه کرده که دارای سنسور 0.35 مگاپیکسلی بود و میتوانست تا ۲۰ عکس با ابعاد 640×480 پیکسل بگیرد که لازم بود آن را به کامپیوتر وصل و تصاویر را دانلود میکردید.
سامسونگ همچنین ادعا میکند که دوربین سلفی را این کمپانی اختراع کرده است. در سال ۲۰۰۲، این شرکت SCH-X590 را روانه بازار کرد که یک گوشی تاشو با دوربین چرخان بود. اینجا جایی بود که مفهوم مگاپیکسل روی زبانها افتاد. وقتی عکسها به میلیونها پیکسل رسید، اصطلاح بازاریابی «مگاپیکسل» ایجاد شد. اساساً، هرچه تعداد پیکسلها بیشتر بود، وضوح تصویر بالاتر میرفت و میتوانستید با آن کار بیشتری انجام دهید.
تلفن دیگر Palm Treo 600 بود که در سال ۲۰۰۳ عرضه شد. این دستگاه کارهای زیادی انجام داد، از جمله پشتیبانی از دوربینی که قادر به گرفتن تصاویر با وضوح 640×480 بود. Treo وایفای یا بلوتوث نداشت و اتصال آن به کابل متصل به رایانه برای دانلود تصاویر محدود میشد. ادعای بزرگ آن این بود که میتوانست هر یک از هزاران برنامه PalmOS را که برای دانلود در دسترس بود اجرا کند. با این حال، نصب آن برنامهها شامل اتصال کابل به رایانه نیز بود.
۲۰۰۸: تولد گوشیهای هوشمند مدرن
اولین نسل آیفون در تاریخ ۲۹ ژوئن سال ۲۰۰۷ عرضه شد که انقلابی در دنیای موبایل ایجاد کرد. بسیاری از ما صفهای طولانی افرادی را بهیاد داریم که ساعتها منتظر بودند تا جزو اولین خریداران آیفون باشند. درحالیکه اولین آیفون تقریباً تمام ویژگیهای یک تلفن هوشمند مدرن، از جمله دوربین 2.0 مگاپیکسلی در پشت را داشت، نسل اول آیفون، اولین گوشی هوشمند مدرن واقعی نبود، چرا که امکان نصب برنامه روی دستگاه را نداشت.
هنگامیکه آیفون 3G در جولای ۲۰۰۸ با امکان دسترسی به فروشگاه اپلاستور وارد بازار شد، دنیای موبایل تغییر اساسی کرد. اپلیکیشنهای گوشیهای هوشمند به میلیاردها کاربر امکان شخصیسازی گوشیهای خود را میدادند و نصب نرمافزار جدید را با یک کلیک امکانپذیر میکرد. بهطور خاص، برنامهها میتوانستند عملکرد دوربین را تقویت کنند. با استفاده از برنامههای فیلتر، کاربران بهراحتی میتوانستند جلوههای ویژه یا تصاویر خود را ویرایش کنند.
اپلیکیشنها همچنین راه را برای دسترسی به رسانههای اجتماعی مانند اینستاگرام و TikTok هموار کردند. در نتیجه، شبکههای اجتماعی امروزه به جایگاهی برای ثبت عکسها و فیلمها تبدیل شدهاند و میتوان آنها را با دوستان، خانواده و تمام دنیا با ضربه زدن روی صفحه به اشتراک گذاشت. برای عکاسان و فیلمبرداران، اپلیکیشنها میتوانند دوربین گوشیها را بهبود ببخشند. برای مثال، برنامه Blackmagic Design’s Camera به کاربرانی که به عکاسی علاقه دارند اجازه میدهد تا تنظیماتی مانند نرخ فریم، زاویه شاتر، تعادل رنگ سفید و ISO را تنظیم کنند؛ کاری که عکاسان حرفهای در فرآیند عکاسی انجام میدهند.
صفحه نمایش با اندازه کامل، اتصال به اینترنت پرسرعت، دوربین حرفهای و توانایی شخصیسازی کامل گوشیها با برنامهها به مردم در سراسر جهان قدرت میبخشد و خیلی بیشتر از یک کامپیوتر کوچک در جیب است. اکنون همه این قابلیتهای شگفتانگیز و انعطافپذیر روی همهی گوشیها وجود دارد. آیفون 3G و اپ استور، همراه با عرضه اولین گوشی اندرویدی، سال ۲۰۰۸ را به آغاز عصر مدرن گوشیهای هوشمند تبدیل کرد.
۲۰۱۰ رقابت آغاز میشود
گوشیهای هوشمند کمکم تکامل یافتند. هر سال، قابلیتها و ویژگیها پیشرفته به گوشیهای هوشمند اضافه شد تا آنجا که دوربینها از 3.0 مگاپیکسلی به هیولاهای ۴۸ تا ۵۰ مگاپیکسلی مانند آیفون 15 پرو مکس، گوگل پیکسل 8، وان پلاس 11 و ایسوس ROG فون 8 تبدیل شدند. نکته قابل توجه گوشی هوشمند اکسپریای سونی است. در حالیکه همه گوشیهای رده بالا دارای سیستمهای دوربین استثنایی هستند، سونی تنها شرکتی است که علاوه بر گوشیهای هوشمند، دوربینهای حرفهای تولید میکند.
یک جهش جزئی دیگر در سال ۲۰۱۰ رخ داد؛ اپل آیفون 4 و اچتیسی EVO 4G مبتنی بر اندروید را معرفی کرد که هر دوی این گوشیها دارای دوربین جلو هستند و برای گرفتن عکسهای سلفی مناسباند. هیچ کدام از این دو رزولوشن قابل توجهی نداشتند، اما دوربینهای جلو نیز در طول سالها بهتر شدند. البته، ازآنجاییکه فضای ذخیره سازی هم از نظر ظرفیت و هم از نظر سرعت بهبود یافته است، میتوان حتی ویدیوهای 8K را با سرعت ۱۲۰ فریم در ثانیه روی SSD های متصل به دوربین از طریق پورت USB-C سریع ذخیره کرد.
این موضوع باعث میشود حجم عظیمی از اطلاعات را بتوان ذخیره کرد و امروزه بسیاری از دستگاهها به راحتی نیازها را برطرف میکنند. امروزه بسیاری از گوشیهای هوشمند ویدیوهای 8K را مستقیماً در حافظه گوشی ضبط میکنند؛ مثلا سامسونگ گلکسی S23 و S24، Asus ZenFone 9، OnePlus 11 و iPhone 15 Pro Max همگی میتوانند ویدیوهای 8K را مستقیماً در دستگاه ضبط کنند. با گذشت زمان، افزایش در ظرفیت ذخیرهسازی، سرعت پردازنده، عمر باتری و وضوح نمایشگر با پیشرفتهایی در نرمافزار داخل گوشیها همراه شد و تولیدکنندگان برنامههای دوربین را اضافه کردند.
۲۰۱۷: آغاز عصر هوشمند
تعیین دقیق زمانی که یادگیری ماشینی به گوشیهای هوشمند راه پیدا کرد دشوار است، اما شاید سال ۲۰۱۷ زمانی است که این قابلیت به دستگاههای موبایل راه یافت. در آن سال، گوگل پیکسل 2 را عرضه کرد که حالت پرترهای داشت و پسزمینهها را تار میکرد و پردازش تصاویر HDR را بهبود بخشید.
اپل نیز در سال ۲۰۱۷ بر روی عکاسی با حالت پرتره تمرکز کرد و آیفون 8، 8 پلاس و آیفون X را معرفی کرد. هر یک از این دستگاهها شامل یک پردازنده اصلی و یک موتور پردازش بودند؛ پردازندهای که به وظایف یادگیری ماشین اختصاص داده شده بود.
بهطورکلی، این قابلیتهای یادگیری ماشینی اولیه، پردازش کلی عکس را بهبود بخشیده و جنبههایی مانند فوکوس خودکار، نوردهی، تعادل رنگ و کاهش نویز را بهبود میبخشید. ادغام یادگیری ماشین در سیستمهای دوربین پیکسل و آیفون، گام مهمی در کیفیت و قابلیتهای عکاسی با گوشیهای هوشمند بهشمار میرود.
هوش مصنوعی و یادگیری ماشین در گوشیهای هوشمند امروزی
اگر مراحل عکاسی را در نظر بگیرید؛ نور و سایه وجود داشت، سپس تصاویر ثابت به شکل آنالوگ در دسترس قرار گرفت و سپس ظهور دوربینهای دیجیتال و تلفنهای هوشمند را شاهد بودیم. در هر یک از این مراحل، یک عامل مشترک این بود که دوربین به عنوان یک دستگاه تصویربرداری در نظر گرفته شده است. اما همه چیز با گوشیهای هوشمند مدرن در حال تغییر است.
با تعبیه فناوری یادگیری ماشینی قابل توجهی در داخل این دستگاهها، دوربین به دستگاه خلق تصاویر استثنایی و ویدیوی با کیفیت تبدیل میشود. اکنون قدرتی را که یادگیری ماشینی برای گوشیهای هوشمند به ارمغان میآورد، بررسی میکنیم. بهطور خاص، به جادوی یادگیری ماشینی که در گوشیهای پرچمدار مانند آیفون 15 پرو مکس، گوگل پیکسل 8، سامسونگ گلکسی اس 23 و S24 و وان پلاس 11 گنجانده شده است در ادامه میپردازیم.
کیفیت تصویر
گوشیهای هوشمند اکنون میتوانند کیفیت تصاویری که در دوربین ثبت میشوند را بهبود بخشند. در اینجا سه نمونه از یادگیری ماشینی مورد استفاده در گوشیهای پرچمدار ذکر شده است.
پردازش و بهبود تصویر: شبکههای عصبی از یک عملیات ریاضی به نام کانولوشن استفاده میکنند که مقادیر پیکسل را بر اساس یک فیلتر کشویی محاسبه میکند و به الگوریتم کمک میکند ویژگیهای خاصی مانند لبهها، بافتها و اشکال را شناسایی کند. سپس به الگوریتمهای یادگیری ماشینی کمک میکند تا پارامترهایی مانند نوردهی، کنتراست و تعادل رنگ را برای افزایش کیفیت، تجزیه و تحلیل و تنظیم کنند. این موضوع بهویژه در شرایط نوری چالش برانگیز مفید است. اینکه چگونه گوشیهای هوشمند میتوانند عکسهایی در نور کم و با تابش زیاد بگیرند که قبلاً ثبت آنها تقریباً غیرممکن بود.
عکاسی در نور کم و حالت شب: در مورد شرایط نوری سخت، یادگیری ماشین کمکی قدرتمند در عکاسی در نور کم ارایه میکند، جاییکه به کاهش نویز، بهبود جزئیات و دقت رنگ کمک میکند. این کار را با استفاده از فناوری شبکه عصبی برای پردازش نوردهیهای متعدد انجام میدهد و آنها را در یک تصویر واحد ادغام میکند و در عینحال جزئیات را افزایش و نویز را کاهش میدهد. البته، تصمیم گیری در مورد جزئیات بیشتر و کاهش نویز در جایی است که هوش مصنوعی وارد عمل میشود.
پردازش HDR: پردازش با دامنه دینامیکی بالا (HDR) به تعادل نواحی تاریک و روشن یک تصویر برای بهبود دامنه دینامیکی کمک میکند. الگوریتمها بهصورت پویا نوردهی نواحی مختلف را در یک عکس تنظیم میکنند، نوردهیهای متعدد را برای یک تصویر متوازن با محدوده دینامیکی بالا ادغام میکنند و وفاداری بصری تصویر را حفظ میکنند و در عین حال سیاه، سفید و سایر رنگهای تیره و روشنتر را برای بازتاب بهتر، همان چیزی که هدف عکاس است ارایه میدهد.
دانش شی
در مورد فیلم، برخی از تکنیکهای آنالوگ برای بهبود تصویر امکان پذیر بود. در حال حاضر، هوش مصنوعی و ML برای داشتن اطلاعات در مورد آنچه در یک صحنه است بسیار مهم هستند.
تشخیص صحنه و اشیا: تلفنهای هوشمند میتوانند صحنههای مختلف مثل مناظر، پرتره یا تنظیمات کمنور و اشیاء درون یک تصویر را تشخیص دهند. بر این اساس، دوربین میتواند تنظیمات را برای بهترین عکس بهینه کند. الگوریتمهای یادگیری عمیق با استفاده از شبکههای عصبی کانولوشن روی مجموعه دادههای وسیعی آموزش داده شده تا بهطور دقیق صحنهها و اشیاء مختلف را در تصاویر تشخیص داده و دستهبندی کنند. اغلب، نسخههای بهینه شدهای از نتایج آموزش یا در برنامههای دوربین یا حتی در چیپستهای تلفنها تعبیه میشوند.
حالت پرتره و جلوه بوکه: مدلهای تخمین عمق که اغلب از تکنیکهای ML مانند تقسیمبندی معنایی استفاده میکنند، میتوانند یک نقشه عمق صحنه ایجاد کنند و سوژه را از پسزمینه متمایز کند. به این صورت است که حالت پرتره را دریافت میکنیم، جایی که سوژه در فوکوس است در حالی که تلفن یک پسزمینه ظاهراً هنرمندانه تار ایجاد میکند.
تشخیص چهره و زیباسازی: الگوریتمهای بینایی کامپیوتری میتوانند چهرهها را در یک تصویر تشخیص دهند و برای بهبود پرترهها، پیشرفتهای ظریفی مانند صاف کردن پوست یا تنظیم نور را اعمال کنند. این فرآیند اغلب بر اساس الگوریتم زیبایی شناختی آموخته شده انجام میشود.
فیلترها و جلوههای مبتنی بر هوش مصنوعی: برخی از اولین ویژگیهای عکس برنامه دیجیتالی گوشیهای هوشمند، فیلترها و افکتهای خلاقانه بودند. در ابتدا، این فیلترها عمدتاً الگوریتمی و بر اساس کد برنامهنویسی بودند. با گذشت زمان، تکنیکهای ML مانند شبکههای مولد مورد استفاده قرار گرفت.
این تکنیک یک الگوریتم “مولد” را در برابر یک فرآیند الگوریتم قرار میدهد، جایی که تمایز دهنده بازخوردی را به مولد ارائه میدهد تا منجر به بهبود شود. افکتهای آموختهشده یا فرآیندهای انتقال سبک، از سبکهای هنرمندان و تکنیکهای مختلف تقلید میکنند. این موضوع به کاربران اجازه میدهد تا سبکهای هنری پیچیده را روی عکسهای خود اعمال کنند و تصاویر نهایی از نظر سبکی مرتبط به نظر برسند.
بهبود کیفیت
دوربینهای گوشیهای هوشمند نه تنها عکسها و فیلمهای بهتر و بهتری میگیرند، بلکه استفاده از آنها در عین حال آسانتر میشود. در اینجا چند مورد در رابطه با بهبود کیفیت دوربین وجود دارد که گوشیهای هوشمند را برای کاربرانشان کاربردیتر میکند.
تثبیت کننده ویدیو: فرآیند ادیت یک فیلم یا ویدیو پس از پایان فیلمبرداری است، با استفاده از ادیتور از ترکیبی از ابزارها هوشمند برای ایجاد یک کلیپ از این قابلیتها استفاده میشود. اما اکنون، مدلهای ML میتوانند ویدیوهای لرزان را به صورت پویا و درست در دوربین برطرف کنند. مدلهای ML در تلفنهای هوشمند این کار را با تجزیه و تحلیل الگوهای حرکتی فریم به فریم انجام میدهند تا لرزش دوربین و تاری حرکت را پیشبینی و تصحیح کنند و در پایان، نتیجه بهتری بهدست میآید. معمولاً برخی از فریمهای ویدیو مورد استفاده قرار میگیرد تا تصویری برش خورده اما پایدارتر ایجاد کند.
فوکوس خودکار و ردیابی: قبل از یادگیری ماشینی، لنزهای دارای فوکوس خودکار از حسگرهای فاصله و محاسبات برای تعیین نقطه فوکوس لنز استفاده میکردند. اما اکنون، ML عملکرد فوکوس خودکار را بهبود بخشیده و آن را به طور قابل ملاحظهای سریعتر و دقیقتر کرده است. الگوریتمهای پیشبینیکننده و مدلهای تشخیص اشیا اغلب برای ردیابی در زمان واقعی سوژههای متحرک، حفظ قفل فوکوس در حین حرکت سوژهها استفاده میشوند.
تطبیق خودکار با تنظیمات: برخی از دوربینهای گوشیهای هوشمند از تکنیکهای یادگیری تقویتی برای تطبیق با سلیقه کاربر در طول زمان استفاده میکنند و بهطور خودکار تنظیمات یا حالتهای پیشنهادی را بر اساس استفاده قبلی انجام میدهند. نکتهای که توجه به آن ضروری است اینکه هوش مصنوعی مولد چیزی است که خارج از دوربین اتفاق میافتد.
نظرات
دیدگاه خود را اشتراک گذارید