Шта је АФ са дубинским учењем: како функционише аутофокус компаније Цанон помоћу АИ? -.

Цанон је створио велику буку због свог новог АФ система за дубоко учење, који лежи у срцу најновије водеће професионалне камере произвођача. Звучи невероватно паметно, али има пуно питања - шта је дубоко учење? Ко изводи наставу? Да ли систем учи док пуцате? Да ли је то заиста вештачка интелигенција у камери? Да ли то заправо побољшава аутофокус?

Ако сте прочитали наш преглед Цанон ЕОС-1Д Кс Марк ИИИ, знаћете да је одговор на последње питање одлучан да. Што се тиче одговора на остала питања о АФ за дубоко учење, узмите пиће и међуоброк и прочитајте даље …

Механика аутофокуса Цанон ЕОС-1Д Кс Марк ИИИ је невероватно паметна, подржавајући два појединачна АФ система. Први је оптички систем, који снима 16 слика у секунди кроз тражило, користећи сензор за мерење од 400 000 пиксела у комбинацији са наменским процесором Дигиц 8, за АФ од 191 тачке који може да прати лице.

Потом је ту систем Ливе Виев, способан да сними 20 кадрова у секунди, користећи свих 20,1 милиона пиксела сензора слике у комбинацији са новим Дигиц Кс процесором, за 3.869 Дуал Пикел ЦМОС тачака које могу да изврше АФ у потпуности у детекцији ока.

Оба ова система покреће главна технологија компаније Цанон ЕОС иТР АФКС - најновија верзија његовог интелигентног аутоматског фокусирања за праћење и препознавање, која је дебитовала у оригиналном ЕОС-1Д Кс (а потом је стигла до 7Д Марк ИИ и 5Д породице). А у његовом кругу је закопан алгоритам дубоког учења.

Дубоко учење НИЈЕ исто што и АИ

Пре свега, важно је разјаснити да се дубинско учење не сме мешати са вештачком интелигенцијом (АИ). АИ систем је нешто што је у сталном развоју. Дубоко учење или машинско учење је подскуп АИ.

За разлику од праве АИ, дубоко учење је затворен процес. То је алгоритам пред монтаже који омогућава архитектури камере да се у основи научи, много брже него што би је могли ручно програмирати људски инжењери. Када се ово учење заврши, закључава се и учитава у камеру.

Од тог тренутка више није могуће учење; упркос имену - а дубоко учење је назив технологије, а не опис процеса - камера не учи стално и неће бити „боља“ што више пуцате (заиста, истински систем интелигенције научио би што више својих лоших навика као и добрих!).

„Научено је“, објашњава Мике Бурнхилл, менаџер техничке подршке за Цанон Еуропе. "Ставите га у рачунар, он ствара алгоритам који се затим учита у камеру. Дакле, разликује се од АИ - АИ је непрекидно учење; дубоко учење је у основи, оно само себе подучава и даје вам крајњи резултат који се затим учитава у камеру “.

Због чега се поставља питање: да ли је камера заправо способна да подржи вештачку интелигенцију, са толико компанија које вичу о функцијама заснованим на АИ?

„Процесорска снага за остваривање истинске интелигенције није изводљива у фотоапарату“, каже Бурнхилл. "Ако то желите да урадите, постоје телефони - али података нема у вашем телефону, они су у Силицијумској долини. Ту је АИ систем. Само, ваша телефонска веза се на њега повезује - није овде, већ је тамо (у облак), јер вам је потребан сервер. Могли бисмо да направимо камеру, али ви бисте све време вукли џиновски случај лета ".

Како се дубоко учење подучава?

Дакле, алгоритам дубоког учења подучава сам себе - али одакле заправо учи? Једноставно речено, одговор је „од најбољих“.

„Цанон је сарађивао са нашим агенцијама“, каже нам Бурнхилл. „У основи смо добили приступ целој њиховој бази података спортске фотографије од свих главних агенција, сарађивали смо са нашим амбасадорима који се баве спортом, а они су пружали њихове слике различитих предмета, а то нам је омогућило да научимо овај АФ систем како да препозна људи у спорту “.

Спорт је, очигледно, циљана метода подучавања, јер је Цанон ЕОС-1Д Кс Марк ИИИ првенствено спортска камера. Проблем је у томе што су кошаркаш окренут према камери, скијаш у наочарама или возач Формуле 1 у кацизи, људима у спорту често су лица заклоњена - што значи да традиционални АФ за откривање лица или чак ока не не ради, а камера ће се уместо тога закључати на ствари попут бројева на играчкој униформи.

Дајући алгоритму дубоког учења приступ огромној библиотеци слика, свега, од наопаких гимнастичара до хокејаша који носе јастучиће и кациге, он је у стању да научи и разликује људски облик у бескрајним разним ситуацијама - и на крају је у стању да се изврши ово „откривање главе“, тако да чак и ако лице особе није видљиво, глава је увек примарна тачка фокуса.

„Дубинско учење је у основи слика, ви створите скуп правила по којима може да учи, а затим се искључи и креира свој сопствени алгоритам“, наставља Бурнхилл. „Дакле, ви поставите параметре како би особа изгледала, идете„ Ево особе “, затим анализира све слике људи и каже„ Ово је особа “,„ То је особа “. пролази кроз милионе слика током одређеног временског периода и креира ту базу података и сама учи “.

Заправо, алгоритам заправо ствара две базе података - једну за сервисирање АФ система оптичког визира и мерење, користећи Дигиц 8, а другу за сервисирање АФ система Ливе Виев који користи Дигиц Кс. Будући да је Дигиц Кс тај који врши сва израчунавања за праћење главе, када АФ алгоритам открије особу у кадру, све се пребацује на нови процесор.

„Једном када убаците особу, у ствари се одвија двострука обрада“, каже Бурнхилл. "Овде постоје две базе података, јер ће се улаз оба сензора мало разликовати, па ће се начин препознавања мало разликовати, па су то подскупови истог алгоритма. Основни подаци за оба су исти, само како ће се препознати и на њега применити прави подаци “.

Ако не може да научи нове ствари … шта је са АФ животиња?

Наравно, Цанон ЕОС-1Д Кс Марк ИИИ није само спортска камера - његова друга кључна публика су стрелци за дивље животиње. Ипак, камера нема могућност аутофокуса на животињама, а ми смо установили да дубоко учење заправо не може научити никакве нове трикове након што се у њу упече. Па то је то? Уз сву ову фенси нову технологију, неће ли се камера фокусирати ни на породичног пса?

Тачно је да тренутно камера нема АФ животињског (или животињског ока). „У основи смо концентрисани на људе да започну да би та врста алгоритма прво функционисала“, одговара Бурнхилл. „Због тога смо се некако фокусирали на спорт, јер је то постављени параметар и можемо га научити у одређеном временском периоду“,

Одговор се, дакле, крије у фирмверу. Бурнхилл је потврдио да постоји могућност да камера подвргне дубљем учењу, за ствари попут птица и дивљих животиња, и да овај ажурирани алгоритам буде доступан корисницима путем ажурирања фирмвера - иако не постоје конкретни планови за најаву.

"Развијаћемо га све време, тако да тренутно још увек није одлучено како и куда идемо. Али развојни тим иде и гледа друге фотографије животиња - схватамо да постоји читав низ поља, али очигледно велико фокус ове камере је спорт, а затим дивље животиње, и очигледно је то био приоритет са Токијем 2022-2023. "

То је поштено; да је Цанон чекао да Дееп Леарнинг научи све, требало би више времена да фотоапарат буде пуштен. И премда се произвођачи попут Сони-а у својим фотоапаратима могу похвалити неким селективним АФ за животиње, Бурнхилл примећује да би Цанон много радије издао комплетно решење за АФ за животиње уместо селективног, комадног. И овде ће дубоко учење постати непроцењиво.

"Невоља је у дивљини, има пуно различитих животиња - очигледно имате предаторе са очима сприједа, а затим имате зечеве (очи) са стране, имате змије, имате птице … не постоји систем који препознаје лица свих животиња. И ту се улази у читаво ово Дубоко учење, подучавање система да препозна ове сложене ствари. "

Дакле, иако ће ваш Сони можда моћи да прати вашег пса или мачку, али не и саламандера или фламинго, Цанон жели да произведе камеру која ради све или ништа. „Ако бисмо то желели, желели бисмо да то урадимо за што шири спектар - не желимо да направимо камеру прилагођену псима и камеру мачкама, већ камеру погодну за животиње то ради за широк спектар животиња на које би (професионалци) пуцали “.

Преглед Цанон ЕОС-1Д Кс Марк ИИИ
Како је Цанон направио најбржи ДСЛР икада? Преуређивањем кутије огледала
102 исправке за Цанон ЕОС-1Д Кс Марк ИИИ