Root NationNovinkyIT novinkyAko vo filmoch: Vďaka novej umelej inteligencii na spracovanie fotografií od Googlu sa ich škálovanie a vylepšenie stáva realitou

Ako vo filmoch: Vďaka novej umelej inteligencii na spracovanie fotografií od Googlu sa ich škálovanie a vylepšenie stáva realitou

-

Pravdepodobne ste videli fantasy filmy alebo televízne programy, kde hlavná postava žiada zväčšiť obrázok a zlepšiť výsledok – ukázať tvár, alebo poznávaciu značku alebo akýkoľvek iný kľúčový detail. Najnovšie systémy umelej inteligencie (AI) Google, založené na tzv difúzne modely, sú schopní vykonať tento trik.

Je to zložitý proces na zvládnutie, pretože ide v podstate o pridávanie detailov k obrázku, ktorý fotoaparát pôvodne nezachytil, pomocou superinteligentných odhadov založených na iných podobných obrázkoch.

Google

V Google sa táto technika nazýva prirodzená syntéza obrazu a v tomto konkrétnom scenári ultravysoké rozlíšenie obrazu. Začnete malou, pixelovou fotkou a skončíte niečím ostrým, jasným a prirodzeným. Možno to nie je úplne originál, ale je dosť blízko na to, aby to ľudskému oku vyzeralo ako skutočné.

Google pre túto prácu predstavil dva nové nástroje AI. Prvý sa nazýva SR3 alebo Super-Resolution via Repeated Refinement a funguje tak, že do obrazu pridá šum a následne ho odstráni. Prostredníctvom série pravdepodobnostných výpočtov založených na veľkej databáze obrázkov a určitej mágii strojového učenia si SR3 dokáže predstaviť, ako vyzerá verzia pixelového obrázku s nízkym rozlíšením v super vysokom rozlíšení.

Druhým nástrojom je CDM, čiže Cascaded Diffusion Models. Google ich popisuje ako „potrubia“, pozdĺž ktorých možno difúzne modely – vrátane SR3 – nasmerovať na vysokokvalitné prevzorkovanie obrazu. Berie modely zlepšovania a robí z nich väčšie obrázky.

Google

Používaním rôznych modelov vylepšenia v rôznych rozlíšeniach je prístup CDM schopný prekonať alternatívne metódy upscalingu obrazu, tvrdí Google. Nový AI engine bol testovaný na ImageNet, obrovskej databáze tréningových obrázkov bežne používaných na výskum v oblasti vizuálneho rozpoznávania objektov.

Konečné výsledky SR3 a CDM sú pôsobivé. V štandardnom teste s 50 ľudskými dobrovoľníkmi boli obrázky ľudských tvárí generované SR3 asi v 50 % prípadov mylne považované za skutočné fotografie – a vzhľadom na to, že ideálny algoritmus by mal dosiahnuť 50 %, je to pôsobivé. Stojí za to zopakovať, že tieto vylepšené obrázky nie sú presnými zhodami s originálmi, sú to starostlivo vypočítané simulácie založené na matematike pravdepodobnosti.

Google

Google si od svojich nových AI motorov a súvisiacich technológií sľubuje oveľa viac – nielen pokiaľ ide o zväčšovanie obrázkov tvárí a iných prírodných objektov, ale aj v iných oblastiach pravdepodobnostného modelovania.

Prečítajte si tiež:

Dzherelosciencealert
Prihlásiť Se
Upozorniť na
host

0 Komentáre
Vložené recenzie
Zobraziť všetky komentáre