Root NationČlánkytechnológieČo sú neurónové siete a ako fungujú?

Čo sú neurónové siete a ako fungujú?

-

Dnes sa pokúsime prísť na to, čo sú neurónové siete, ako fungujú a aká je ich úloha pri vytváraní umelej inteligencie.

Neurálne siete. Túto frázu počujeme takmer všade. Ide o to, že neurónové siete nájdete aj v chladničkách (to nie je vtip). Neurónové siete sú široko používané algoritmami strojového učenia, ktoré dnes možno nájsť nielen v počítačoch a smartfónoch, ale aj v mnohých iných elektronických zariadeniach, napríklad v domácich spotrebičoch. A premýšľali ste niekedy, čo sú tieto neurónové siete?

Nebojte sa, toto nebude akademická prednáška. Existuje mnoho publikácií, aj v ukrajinskom jazyku, ktoré veľmi profesionálne a spoľahlivo vysvetľujú túto problematiku v oblasti exaktných vied. Takéto publikácie sú staré viac ako tucet rokov. Ako je možné, že tieto staré publikácie sú stále aktuálne? Faktom je, že základy neurónových sietí sa nezmenili a samotný koncept – matematický model umelého neurónu – vznikol počas druhej svetovej vojny.

Čo sú neurónové siete a ako fungujú?

To isté s internetom, dnešný internet je neporovnateľne vyspelejší, ako keď bol odoslaný prvý email. Základy internetu, základné protokoly, existovali od samého začiatku jeho vzniku. Každý komplexný koncept je postavený na základe starých štruktúr. Rovnako je to aj s naším mozgom, najmladšia mozgová kôra nie je schopná fungovať bez najstaršieho evolučného prvku: mozgového kmeňa, ktorý máme v hlave už od čias oveľa starších ako existencia nášho druhu na tejto planéte.

Trochu som ťa zmiatol? Poďme to teda pochopiť podrobnejšie.

Tiež zaujímavé: ChatGPT: Jednoduchý návod na použitie

Čo sú neurónové siete?

Sieť je súbor určitých prvkov. Toto je najjednoduchší prístup v matematike, fyzike alebo technike. Ak je počítačová sieť súborom vzájomne prepojených počítačov, potom neurónová sieť je samozrejme súborom neurónov.

neurónové sieť

Tieto prvky však nie sú ani zďaleka porovnateľné zložitosťou s nervovými bunkami nášho mozgu a nervového systému, no na určitej úrovni abstrakcie sú niektoré znaky umelého neurónu a biologického neurónu spoločné. Je ale potrebné pripomenúť, že umelý neurón je oveľa jednoduchší pojem ako jeho biologický náprotivok, o ktorom ešte stále nevieme všetko.

- Reklama -

Prečítajte si tiež: 7 najúžasnejších spôsobov použitia ChatGPT

Najprv to bol umelý neurón

Prvý matematický model umelého neurónu vyvinuli v roku 1943 (áno, to nie je chyba, počas druhej svetovej vojny) dvaja americkí vedci Warren McCulloch a Walter Pitts. Podarilo sa im to na základe interdisciplinárneho prístupu spájajúceho základné poznatky z fyziológie mozgu (spomeňte si na dobu vzniku tohto modelu), matematiky a vtedajšieho mladého IT prístupu (využili okrem iného teóriu vypočítateľnosti Alana Turinga ). McCulloch-Pittsov model umelého neurónu je veľmi jednoduchý model, má veľa vstupov, kde vstupné informácie prechádzajú cez váhy (parametre), ktorých hodnoty určujú správanie neurónu. Výsledný výsledok je odoslaný na jeden výstup (pozri diagram McCulloch-Pittsovho neurónu).

neurónové sieť
Schéma umelého neurónu 1. Neuróny, ktorých výstupné signály sú vstupom na vstup daného neurónu 2. Sčítačka vstupných signálov 3. Kalkulačka prenosových funkcií 4. Neuróny, na ktorých vstupy je privedený signál daného neurónu 5. ωi — váhy vstupných signálov

Takáto stromová štruktúra je spojená s biologickým neurónom, pretože keď premýšľame o kresbách zobrazujúcich biologické nervové bunky, prichádza na myseľ charakteristická stromová štruktúra dendritov. Netreba však podľahnúť ilúzii, že umelý neurón má aspoň trochu blízko k skutočnej nervovej bunke. Týmto dvom výskumníkom, autorom prvého umelého neurónu, sa podarilo preukázať, že akúkoľvek vypočítateľnú funkciu možno vypočítať pomocou siete prepojených neurónov. Pripomeňme si však, že tieto prvé koncepty vznikali len ako myšlienky, ktoré existovali len „na papieri“ a nemali reálnu interpretáciu v podobe prevádzkových zariadení.

Prečítajte si tiež: O kvantových počítačoch jednoduchými slovami

Od modelu až po inovatívne implementácie

McCulloch a Pitts vyvinuli teoretický model, no vytvorenie prvej skutočnej neurónovej siete si muselo počkať viac ako desať rokov. Za jeho tvorcu sa považuje ďalší priekopník výskumu umelej inteligencie Frank Rosenblatt, ktorý v roku 1957 vytvoril sieť Mark I Perceptron a vy sami ste ukázali, že vďaka tejto štruktúre stroj získal schopnosť, ktorá bola predtým vlastná len zvieratám a ľuďom: to môže učiť. Teraz však vieme, že v skutočnosti boli aj iní vedci, ktorí prišli s myšlienkou, že stroj sa môže učiť, a to aj pred Rosenblattom.

Mark I Perceptron

Mnoho výskumníkov a priekopníkov informatiky v 1950. rokoch minulého storočia prišlo s nápadom, ako prinútiť stroj robiť to, čo by sám nedokázal. Napríklad Arthur Samuel vyvinul program, ktorý hral dámu s človekom, Allen Newell a Herbert Simon vytvorili program, ktorý dokázal nezávisle dokázať matematické vety. Ešte pred vytvorením prvej Rosenblattovej neurónovej siete zostrojili ďalší dvaja priekopníci výskumu v oblasti umelej inteligencie, Marvin Minsky a Dean Edmonds, v roku 1952, teda ešte pred objavením sa Rosenblattovho perceptrónu, stroj s názvom SNARC (Stochastic Neural Analog Reinforcement Calculator) - stochastická neurónová analógová kalkulačka, ktorú mnohí považujú za prvý počítač so stochastickou neurónovou sieťou. Treba poznamenať, že SNARC nemal nič spoločné s modernými počítačmi.

SNARC

Výkonný stroj s viac ako 3000 elektronickými elektrónkami a náhradným mechanizmom autopilota z bombardéra B-24 dokázal simulovať činnosť 40 neurónov, čo sa ukázalo ako dostatočné na matematickú simuláciu krysieho hľadania východu z bludiska. . Samozrejme, žiadny potkan tam nebol, išlo len o proces dedukcie a hľadania optimálneho riešenia. Toto auto bolo súčasťou Ph.D. Marvina Minského.

adalínová sieť

Ďalším zaujímavým projektom v oblasti neurónových sietí bola sieť ADALINE, ktorú v roku 1960 vyvinul Bernard Withrow. Možno si teda položiť otázku: keďže pred viac ako polstoročím vedci poznali teoretické základy neurónových sietí a dokonca vytvorili prvé funkčné implementácie takýchto výpočtových rámcov, prečo to trvalo tak dlho, až do 21. vytvárať skutočné riešenia založené na neurónových sieťach? Odpoveď je jedna: nedostatočný výpočtový výkon, ale to nebola jediná prekážka.

neurónové sieť

Hoci v 1950. a 1960. rokoch boli mnohí priekopníci AI fascinovaní možnosťami neurónových sietí a niektorí z nich predpovedali, že strojový ekvivalent ľudského mozgu je vzdialený len desať rokov. Toto sa dnes číta dokonca vtipne, pretože sme sa ešte ani len nepriblížili k vytvoreniu strojového ekvivalentu ľudského mozgu a k vyriešeniu tejto úlohy máme ešte ďaleko. Rýchlo sa ukázalo, že logika prvých neurónových sietí bola fascinujúca a zároveň obmedzená. Prvé implementácie AI pomocou umelých neurónov a algoritmov strojového učenia boli schopné vyriešiť určitý úzky rozsah úloh.

Keď však došlo na širšie priestory a riešenie niečoho naozaj vážneho, ako je rozpoznávanie vzorov a obrázkov, simultánny preklad, rozpoznávanie reči a rukopisu atď., teda veci, ktoré už dnes dokážu počítače a AI, ukázalo sa, že prvé implementácie neurónových sietí to jednoducho nedokázali. Prečo je to tak? Odpoveď dal výskum Marvina Minského (áno, ten istý zo SNARC) a Seymoura Paperta, ktorí v roku 1969 dokázali obmedzenia perceptrónovej logiky a ukázali, že zvyšovanie schopností jednoduchých neurónových sietí výlučne vďaka škálovaniu nefunguje. Bola tu ešte jedna, no veľmi dôležitá prekážka – výpočtový výkon, ktorý bol v tom čase k dispozícii, bol príliš malý na to, aby sa neurónové siete dali použiť podľa plánu.

Tiež zaujímavé:

- Reklama -

Renesancia neurónových sietí

V 1970. a 1980. rokoch minulého storočia sa na neurónové siete prakticky zabudlo. Až koncom minulého storočia sa dostupný výpočtový výkon natoľko rozrástol, že sa k nemu ľudia začali vracať a rozvíjať svoje schopnosti v tejto oblasti. Vtedy sa objavili nové funkcie a algoritmy, schopné prekonať obmedzenia prvých najjednoduchších neurónových sietí. Vtedy vznikla myšlienka hlbokého strojového učenia viacvrstvových neurónových sietí. Čo sa vlastne s týmito vrstvami deje? Dnes sú takmer všetky užitočné neurónové siete fungujúce v našom prostredí viacvrstvové. Máme vstupnú vrstvu, ktorej úlohou je prijímať vstupné dáta a parametre (váhy). Počet týchto parametrov sa mení v závislosti od zložitosti výpočtového problému, ktorý má sieť vyriešiť.

neurónové sieť

Okrem toho tu máme takzvané „skryté vrstvy“ – tu sa dejú všetky „mágie“ spojené s hlbokým strojovým učením. Práve skryté vrstvy sú zodpovedné za schopnosť tejto neurónovej siete učiť sa a vykonávať potrebné výpočty. Nakoniec posledným prvkom je výstupná vrstva, teda vrstva neurónovej siete, ktorá dáva požadovaný výsledok, v tomto prípade: rozpoznaný rukopis, tvár, hlas, vytvorený obraz na základe textového popisu, výsledok tomografickej analýzy diagnostický obraz a oveľa viac.

Prečítajte si tiež: Testoval som a urobil rozhovor s Bingovým chatbotom

Ako sa neurónové siete učia?

Ako už vieme, jednotlivé neuróny v neurónových sieťach spracúvajú informácie pomocou parametrov (váh), ktorým sú priradené jednotlivé hodnoty a spojenia. Tieto váhy sa počas procesu učenia menia, čo vám umožňuje upraviť štruktúru tejto siete tak, aby generovala požadovaný výsledok. Ako presne sa sieť učí? To je samozrejmé, treba to neustále trénovať. Nebuďte prekvapení týmto výrokom. Aj my sa učíme a tento proces nie je chaotický, ale povedzme usporiadaný. Hovoríme tomu vzdelávanie. Každopádne sa dajú trénovať aj neurónové siete, a to sa väčšinou deje pomocou vhodne zvolenej sady vstupov, ktorá sieť akosi pripraví na úlohy, ktoré bude v budúcnosti plniť. A to všetko sa krok za krokom opakuje, niekedy sa proces učenia do istej miery podobá samotnému tréningovému procesu.

Ak je napríklad úlohou tejto neurónovej siete rozpoznávať tváre, je vopred natrénovaná na veľké množstvo obrázkov obsahujúcich tváre. V procese učenia sa váhy a parametre skrytých vrstiev menia. Odborníci tu používajú slovné spojenie „minimalizácia nákladovej funkcie“. Nákladová funkcia je veličina, ktorá nám hovorí, do akej miery daná neurónová sieť robí chyby. Čím viac dokážeme minimalizovať nákladovú funkciu v dôsledku tréningu, tým lepšie bude táto neurónová sieť fungovať v reálnom svete. Najdôležitejšou vlastnosťou, ktorá odlišuje akúkoľvek neurónovú sieť od úlohy naprogramovanej pomocou klasického algoritmu, je to, že v prípade klasických algoritmov musí programátor navrhnúť krok za krokom, aké akcie bude program vykonávať. V prípade neurónových sietí je samotná sieť schopná naučiť sa správne vykonávať úlohy sama. A nikto presne nevie, ako zložitá neurónová sieť vykonáva svoje výpočty.

neurónové sieť

Dnes sú neurónové siete využívané široko a možno prekvapivo veľmi často bez toho, aby sme pochopili, ako výpočtový proces v danej sieti vlastne funguje. Nie je to potrebné. Programátori využívajú hotové strojovo naučené neurónové siete, ktoré sú pripravené na vstupné dáta určitého typu, spracovávajú ich len im známym spôsobom a produkujú požadovaný výsledok. Programátor nemusí vedieť, ako proces odvodzovania funguje vo vnútri neurónovej siete. To znamená, že človek zostáva stranou veľkého objemu výpočtov, spôsobu získavania informácií a ich spracovania neurónovými sieťami. Odtiaľ pochádzajú určité obavy ľudstva týkajúce sa modelov umelej inteligencie. Jednoducho sa bojíme, že jedného dňa si neurónová sieť zadá určitú úlohu a samostatne, bez pomoci človeka, nájde spôsoby, ako ju vyriešiť. To znepokojuje ľudstvo, spôsobuje strach a nedôveru v používanie algoritmov strojového učenia.

chat gpt

Tento utilitárny prístup je dnes bežný. U nás je to rovnaké: vieme, ako niekoho vycvičiť v konkrétnej činnosti a vieme, že tréningový proces bude efektívny, ak sa bude robiť správne. Osoba získa požadované zručnosti. Rozumieme však presne tomu, ako v jeho mozgu prebieha dedukčný proces, ktorý spôsobil tento efekt? To netušíme.

Úlohou vedcov je tieto problémy čo najviac študovať, aby nám slúžili a pomáhali tam, kde je to potrebné, a hlavne sa nestali hrozbou. Ako ľudia sa bojíme toho, čo nepoznáme.

Tiež zaujímavé: 

Yuri Svitlyk
Yuri Svitlyk
Syn Karpát, neuznaný génius matematiky, „právnik“Microsoft, praktický altruista, ľavo-pravý
- Reklama -
Prihlásiť Se
Upozorniť na
host

0 Komentáre
Vložené recenzie
Zobraziť všetky komentáre