www.wikidata.uk-ua.nina.az
Metod zvorotnogo poshirennya pomilki angl backpropagation metod navchannya bagatosharovogo perceptronu Ce iterativnij gradiyentnij algoritm yakij vikoristovuyetsya z metoyu minimizaciyi pomilki roboti bagatosharovogo perceptronu ta otrimannya bazhanogo vihodu Osnovna ideya cogo metodu polyagaye v poshirenni signaliv pomilki vid vihodiv merezhi do yiyi vhodiv v napryamku zvorotnomu pryamomu poshirennyu signaliv u zvichajnomu rezhimi roboti Barc i Ohonin zaproponuvali vidrazu zagalnij metod princip podvijnosti yakij mozhna zastosuvati do shirshogo klasu sistem vklyuchayuchi sistemi z zapiznennyam rozpodileni sistemi tosho 1 Dlya mozhlivosti zastosuvannya metodu zvorotnogo poshirennya pomilki funkciya aktivaciyi nejroniv povinna buti diferencijovnoyu Zmist 1 Funkciya ocinki roboti merezhi 2 Opis algoritmu 3 Algoritm 4 Matematichna interpretaciya navchannya nejronnoyi merezhi 5 Nedoliki algoritmu 5 1 Paralich merezhi 5 2 Lokalni minimumi 5 3 Rozmir kroku 6 Istoriya 7 Literatura 8 Znoski 9 Div takozh 10 PosilannyaFunkciya ocinki roboti merezhi RedaguvatiNavchannya nejronnih merezh mozhna predstaviti yak zadachu optimizaciyi Ociniti oznachaye vkazati kilkisno dobre chi pogano merezha virishuye postavleni yij zavdannya Dlya cogo buduyetsya funkciya ocinki Vona yak pravilo yavno zalezhit vid vihidnih signaliv merezhi i neyavno cherez funkcionuvannya vid vsih yiyi parametriv Najprostishij i najposhirenishij priklad ocinki suma kvadrativ vidstanej vid vihidnih signaliv merezhi do yih neobhidnih znachen H 1 2 t v o u t Z t Z t 2 displaystyle H frac 1 2 sum tau in v out Z tau Z tau 2 nbsp de Z t displaystyle Z tau nbsp neobhidne znachennya vihidnogo signalu Metod najmenshih kvadrativ daleko ne zavzhdi ye najkrashim viborom ocinki Retelne konstruyuvannya funkciyi ocinki dozvolyaye na poryadok pidvishiti efektivnist navchannya merezhi a takozh oderzhuvati dodatkovu informaciyu riven vpevnenosti merezhi u vidpovidi 2 Opis algoritmu Redaguvati nbsp Arhitektura bagatosharovogo perceptronuAlgoritm zvorotnogo poshirennya pomilki zastosovuyetsya dlya bagatosharovogo perceptronu U merezhi ye mnozhina vhodiv x 1 x n displaystyle x 1 x n nbsp mnozhina vihodiv Outputs i bezlich vnutrishnih vuzliv Perenumeruyemo vsi vuzli vklyuchayuchi vhodi i vihodi chislami vid 1 do N naskrizna numeraciya nezalezhno vid topologiyi shariv Poznachimo cherez w i j displaystyle w i j nbsp vagu zv yazku sho z yednuye i j i j j vuzli a cherez o i displaystyle o i nbsp vihid i go vuzla Yaksho nam vidomij navchalnij priklad pravilni vidpovidi merezhi t k displaystyle t k nbsp k O u t p u t s displaystyle k in Outputs nbsp to funkciya pomilki otrimana za metodom najmenshih kvadrativ viglyadaye tak E w i j 1 2 k O u t p u t s t k o k 2 displaystyle E w i j cfrac 1 2 sum k in Outputs t k o k 2 nbsp Yak modifikuvati vagi Mi budemo realizovuvati stohastichnij gradiyentnij spusk tobto budemo pidpravlyati vagi pislya kozhnogo navchalnogo prikladu i takim chinom ruhatisya v bagatovimirnomu prostori vag Shob dobratisya do minimumu pomilki nam potribno ruhatisya v storonu protilezhnu gradiyentu tobto na pidstavi kozhnoyi grupi pravilnih vidpovidej dodavati do kozhnoyi vagi w i j displaystyle w i j nbsp D w i j h E w i j displaystyle Delta w i j eta frac partial E partial w i j nbsp de 0 lt h lt 1 displaystyle 0 lt eta lt 1 nbsp mnozhnik sho zadaye shvidkist ruhu Pohidna rozrahovuyetsya takim chinom Nehaj spochatku j O u t p u t s displaystyle j in Outputs nbsp tobto vaga yaka nas cikavit vhodit v nejron ostannogo rivnya Spochatku zaznachimo sho w i j displaystyle w i j nbsp vplivaye na vihid merezhi lishe yak chastina sumi S j i w i j x i displaystyle S j sum i w i j x i nbsp de suma beretsya po vhodah j go vuzla Tomu E w i j E S j S j w i j x i E S j displaystyle cfrac partial E partial w i j cfrac partial E partial S j cfrac partial S j partial w i j x i cfrac partial E partial S j nbsp Analogichno S j displaystyle S j nbsp vplivaye na zagalnu pomilku tilki v ramkah vihodu j go vuzla o j displaystyle o j nbsp nagaduyemo sho ce vihid vsiyeyi merezhi Tomu E S j E o j o j S j o j 1 2 k O u t p u t s t k o k 2 s S j S j 1 2 o j t j o j 2 o j 1 o j o j 1 o j t j o j displaystyle cfrac partial E partial S j cfrac partial E partial o j cfrac partial o j partial S j left cfrac partial partial o j cfrac 1 2 sum k in Outputs t k o k 2 right left cfrac partial sigma S j partial S j right left cfrac 1 2 cfrac partial partial o j t j o j 2 right o j 1 o j o j 1 o j t j o j nbsp de s displaystyle sigma nbsp ce funkciya aktivaciyi u danomu vipadku stosovno obchislennya pohidnoyi yavlyaye soboyu Eksponencijnu sigmoyidu funkciyu Fermi rozglyanutu visheYaksho zh j j vuzol ne na ostannomu rivni to u nogo ye vihodi poznachimo yih cherez Children j U comu vipadku E S j k C h i l d r e n j E S k S k S j displaystyle cfrac partial E partial S j sum k in Children j cfrac partial E partial S k cfrac partial S k partial S j nbsp i S k S j S k o j o j S j w i j o j S j w i j o j 1 o j displaystyle cfrac partial S k partial S j cfrac partial S k partial o j cfrac partial o j partial S j w i j cfrac partial o j partial S j w i j o j 1 o j nbsp A E S k displaystyle cfrac partial E partial S k nbsp ce analogichna popravka ale obchislena dlya vuzla nastupnogo rivnya budemo poznachati yiyi cherez d k displaystyle delta k nbsp vid D k displaystyle Delta k nbsp vona vidriznyayetsya vidsutnistyu mnozhnika h x i j displaystyle eta x i j nbsp Oskilki mi navchilisya obchislyuvati popravku dlya vuzliv ostannogo rivnya i virazhati popravku dlya vuzla nizhchogo rivnya cherez popravki bilsh visokogo mozhna vzhe stvoryuvati algoritm navchannya Same cherez cyu osoblivist obchislennya popravok cej algoritm nazivayetsya algoritmom zvorotnogo poshirennya pomilki angl backpropagation Korotke vikladennya visheskazanogo Dlya vuzla ostannogo rivnyad j o j 1 o j t j o j displaystyle delta j o j 1 o j t j o j nbsp Dlya vnutrishnogo vuzla merezhid j o j 1 o j k O u t p u t s j d k w j k displaystyle delta j o j 1 o j sum k in Outputs j delta k w j k nbsp Dlya vsih vuzlivD w i j h d j x i displaystyle Delta w i j eta delta j x i nbsp Otrimanij algoritm predstavlenij nizhche Na vhid algoritmu krim zaznachenih parametriv potribno takozh podavati v yakomu nebud formati strukturu merezhi Na praktici duzhe garni rezultati pokazuyut merezhi dosit prostoyi strukturi sho skladayutsya z dvoh rivniv nejroniv prihovanogo rivnya hidden units i nejroniv vihodiv output units kozhen vhid merezhi z yednanij z usima prihovanimi nejronami a rezultat roboti kozhnogo prihovanogo nejrona podayetsya na vhid kozhnomu z nejroniv vihodiv U takomu vipadku dosit podavati na vhid kilkist nejroniv prihovanogo rivnya Algoritm RedaguvatiAlgoritm BackPropagation h a x i d t d i 1 d 1 n m N U M B E R O F S T E P S displaystyle eta alpha x i d t d i 1 d 1 n m NUMBER OF STEPS nbsp Inicializuvati w i j i j displaystyle w ij i j nbsp malenkimi vipadkovimi znachennyami D w i j i j 0 displaystyle Delta w ij i j 0 nbsp Povtoriti NUMBER OF STEPS raz Dlya vsih d vid 1 do m Podati x i d displaystyle x i d nbsp na vhid sitki i pidrahuvati vihodi o i displaystyle o i nbsp kozhnogo vuzla Dlya vsih k O u t p u t s displaystyle k in Outputs nbsp d k o k 1 o k t k o k displaystyle delta k o k 1 o k t k o k nbsp Dlya kozhnogo rivnya l pochinayuchi z ostannogo Dlya kozhnogo vuzla j rivnya l porahuvati d j o j 1 o j k C h i l d r e n j d k w j k displaystyle delta j o j 1 o j sum k in Children j delta k w j k nbsp Dlya kozhnogo rebra sitki i j D w i j a D w i j 1 a h d j o i displaystyle Delta w i j alpha Delta w i j 1 alpha eta delta j o i nbsp w i j w i j D w i j displaystyle w i j w i j Delta w i j nbsp Vidati znachennya w i j displaystyle w ij nbsp Matematichna interpretaciya navchannya nejronnoyi merezhi RedaguvatiNa kozhnij iteraciyi algoritmu zvorotnogo poshirennya vagovi koeficiyenti nejronnoyi merezhi modifikuyutsya tak shob polipshiti rishennya odnogo prikladu Takim chinom u procesi navchannya ciklichno virishuyutsya odnokriterialni zadachi optimizaciyi Navchannya nejronnoyi merezhi harakterizuyetsya chotirma specifichnimi obmezhennyami sho vidilyayut navchannya nejromerezh iz zagalnih zadach optimizaciyi astronomichne chislo parametriv neobhidnist visokogo paralelizmu pri navchanni bagato kriterialno virishuvanih zavdan neobhidnist znajti dosit shiroku oblast v yakij znachennya vsih funkcij sho minimizuyutsya blizki do minimalnih Stosovno reshti problemu navchannya mozhna yak pravilo sformulyuvati yak zavdannya minimizaciyi ocinki Oberezhnist poperednoyi frazi yak pravilo pov yazana z tim sho naspravdi nam nevidomi i nikoli ne budut vidomi vsi mozhlivi zavdannya dlya nejronnih merezh i mozhe des v nevidomosti ye zavdannya yaki ne zvodyatsya do minimizaciyi ocinki Minimizaciya ocinki skladna problema parametriv astronomichno bagato dlya standartnih prikladiv sho realizuyutsya na RS vid 100 do 1000000 adaptivnij relyef grafik ocinki yak funkciyi vid pidlashtovuvanih parametriv skladnij mozhe mistiti bagato lokalnih minimumiv Nedoliki algoritmu RedaguvatiNezvazhayuchi na chislenni uspishni zastosuvannya algoritmu zvorotnogo poshirennya pomilki vin ne ye panaceyeyu Najbilshe nepriyemnostej prinosit neviznacheno dovgij proces navchannya U skladnih zavdannyah dlya navchannya merezhi mozhut znadobitisya dni abo navit tizhni vona mozhe i vzagali ne navchitisya Prichinoyu mozhe buti odna z opisanih nizhche Paralich merezhi Redaguvati U procesi navchannya merezhi znachennya vag mozhut v rezultati korekciyi stati duzhe velikimi velichinami Ce mozhe prizvesti do togo sho vsi abo bilshist nejroniv budut funkcionuvati pri duzhe velikih znachennyah OUT v oblasti de pohidna stiskayuchoyi funkciyi duzhe mala Tak yak pomilka sho posilayetsya nazad u procesi navchannya proporcijna cij pohidnij to proces navchannya mozhe praktichno zavmerti U teoretichnomu vidnoshenni cya problema pogano vivchena Zazvichaj cogo unikayut zmenshennyam rozmiru kroku h ale ce zbilshuye chas navchannya Rizni evristiki vikoristovuvalisya dlya zapobigannya vid paralichu abo dlya vidnovlennya pislya nogo ale poki sho voni mozhut rozglyadatisya lishe yak eksperimentalni Lokalni minimumi Redaguvati Zvorotne poshirennya vikoristovuye riznovid gradiyentnogo spusku tobto zdijsnyuye spusk vniz po poverhni pomilki bezperervno pidlashtovuyuchi vagi v napryamku do minimumu Poverhnya pomilki skladnoyi merezhi silno porizana i skladayetsya z pagorbiv dolin skladok i yariv v prostori visokoyi rozmirnosti Merezha mozhe potrapiti v lokalnij minimum negliboku dolinu koli poruch ye nabagato bilsh glibokih minimumiv V tochci lokalnogo minimumu vsi napryamki vedut vgoru i merezha nezdatna z nogo vibratisya Statistichni metodi navchannya mozhut dopomogti uniknuti ciyeyi pastki ale voni povilni Rozmir kroku Redaguvati Uvazhnij rozbir dovedennya zbizhnosti 3 pokazuye sho korekciyi vag peredbachayutsya neskinchenno malimi Yasno sho ce nezdijsnenno na praktici tomu sho vede do bezkinechnogo chasu navchannya Rozmir kroku povinen bratisya skinchennim Yaksho rozmir kroku fiksovanij i duzhe malij to zbizhnist nadto povilna yaksho zh vin fiksovanij i zanadto velikij to mozhe viniknuti paralich abo postijna nestijkist Efektivno zbilshuvati krok do tih pir poki ne pripinitsya polipshennya ocinki v danomu napryamku antigradiyenta i zmenshuvati yaksho takogo pokrashennya ne vidbuvayetsya P D Vasserman 4 opisav adaptivnij algoritm viboru kroku yakij avtomatichno korektuye rozmir kroku v procesi navchannya V knizi A N Gorbanya 5 zaproponovana rozgaluzhena tehnologiya optimizaciyi navchannya Slid takozh vidmititi mozhlivist perenavchannya merezhi sho ye skorishe rezultatom pomilkovogo proektuvannya yiyi topologiyi Pri duzhe velikij kilkosti nejroniv vtrachayetsya vlastivist merezhi uzagalnyuvati informaciyu Ves nabir obraziv nadanih do navchannya bude vivchenij merezheyu ale bud yaki inshi obrazi navit duzhe shozhi mozhut buti klasifikovani nevirno Istoriya RedaguvatiCej rozdil posilayetsya na pervinni dzherela Bud laska udoskonalte jogo dodavshi posilannya na nezalezhni vtorinni chi tretinni dzherela berezen 2020 Vpershe metod buv opisanij v 1974 r A I Galushkinim 6 a takozh nezalezhno i odnochasno Polom Dzh Verbosom 7 Dali istotno rozvinenij v 1986 r Devidom I Rumelgartom en Dzhefri E Hintonom i Ronaldom Dzh Vilyamsom en 3 i nezalezhno j odnochasno S I Barcom ta V A Ohoninim 8 Literatura RedaguvatiPhilip D Wasserman Neural Computing Theory and Practice Coriolis Group June 1 1989 230 pages ISBN 13 978 0442207434 ISBN 10 0442207433 Simon S Haykin Neural Networks A Comprehensive Foundation Prentice Hall 1999 842 pages ISBN 13 978 0132733502 ISBN 10 0132733501Znoski Redaguvati Barcev S I Gilev S E Ohonin V A Princip dvojstvennosti v organizacii adaptivnyh setej obrabotki informacii V kn Dinamika himicheskih i biologicheskih sistem Novosibirsk Nauka 1989 S 6 55 Mirkes E M Nejrokompyuter Proekt standarta Arhivovano 15 chervnya 2009 u Wayback Machine Novosibirsk Nauka Sibirskaya izdatelskaya firma RAN 1999 337 s ISBN 5 02 031409 9 Inshi kopiyi onlajn 1 Arhivovano 30 chervnya 2009 u Wayback Machine 2 Arhivovano 3 lipnya 2009 u Wayback Machine a b Rumelhart David E Williams Ronald J 1986 Learning Internal Representations by Error Propagation In Parallel Distributed Processing angl Cambridge MA MIT Press 1 318 362 Wasserman P D Experiments in translating Chinese characters using backpropagation Proceedings of the Thirty Third IEEE Computer Society International Conference Washington D C Computer Society Press of the IEEE 1988 Gorban A N Obuchenie nejronnyh setej Moskva SP ParaGraf 1990 Galushkin A I Sintez mnogoslojnyh sistem raspoznavaniya obrazov M Energiya 1974 Werbos P J Beyond regression New tools for prediction and analysis in the behavioral sciences Ph D thesis Harvard University Cambridge MA 1974 Barcev S I Ohonin V A Adaptivnye seti obrabotki informacii Krasnoyarsk In t fiziki SO AN SSSR 1986 Preprint N 59B 20 s Div takozh RedaguvatiMetod zvorotnogo poshirennya pohibki v chasiPosilannya RedaguvatiOlah Christopher Calculus on Computational Graphs Backpropagation colah s blog Procitovano 5 lyutogo 2019 S kod prostoyi nejromerezhi sho navchayetsya za algoritmom zvorotnogo poshirennya pomilki Terehov S A Lekcii po teorii i prilozheniyam iskusstvennyh nejronnyh setej Mirkes E M Nejroinformatika Ucheb posobie dlya studentov s programmami dlya vypolneniya laboratornyh rabot Krasnoyarsk IPC KGTU 2002 347 s ISBN 5 7636 0477 6 Otrimano z https uk wikipedia org w index php title Metod zvorotnogo poshirennya pomilki amp oldid 38158211