www.wikidata.uk-ua.nina.az
U teoriyi informaciyi perpleksivnist skladnist ce mira togo naskilki dobre rozpodil imovirnosti abo statistichna model prognozuye vibirku Yiyi mozhna vikoristovuvati dlya porivnyannya jmovirnisnih modelej Nizka perpleksivnist oznachaye sho rozpodil jmovirnosti dobre peredbachaye vibirku Zmist 1 Perpleksivnist rozpodilu jmovirnostej 2 Perpleksivnist imovirnisnoyi modeli 3 Perpleksivnist na slovo 4 Primitki 5 PosilannyaPerpleksivnist rozpodilu jmovirnostej red Perpleksivnist PP diskretnogo rozpodilu jmovirnostej p viznachayetsya yak P P p 2 H p 2 x p x log 2 p x x p x p x displaystyle mathit PP p 2 H p 2 sum x p x log 2 p x prod x p x p x nbsp de H p entropiya u bitah rozpodilu a x diapazon podij Osnova logarifma ne obov yazkovo maye buti 2 perpleksivnist ne zalezhit vid osnovi za umovi sho entropiya ta pokaznikova funkciya vikoristovuyut tu samu osnovu Cej pokaznik takozh vidomij u deyakih oblastyah yak mira riznomanitnosti Perpleksivnist vipadkovoyi velichini X mozhe buti viznachena yak perpleksivnist rozpodilu yiyi mozhlivih znachen x V okremomu vipadku koli p modelyuye k storonnij gralnij kubik rivnomirnij rozpodil po k diskretnim podiyam yiyi perpleksivnist dorivnyuye k Vipadkova velichina z perpleksivnistyu k maye taku zh neviznachenist yak i k storonnij gralnij kubik Todi kazhut sho kubik k perpleksivnij shodo znachennya vipadkovoyi velichini Yaksho ce ne k storonnij kubik mozhlivo bilshe nizh k znachen odnak zagalna neviznachenist ne ye vishoyu tomu sho deyaki z cih znachen matimut jmovirnist bilshe 1 k zmenshuyuchi zagalne znachennya pid chas pidsumovuvannya Ponyattya perpleksivnosti inodi vikoristovuyetsya u znachenni miri skladnosti problemi peredbachennya Odnak ce ne zavzhdi tochno Yaksho u vas ye dva rezultati odin z yakih maye mozhlivist 0 9 to pri vikoristanni optimalnoyi strategiyi vashi shansi na pravilne vgaduvannya stanovlyat 90 vidsotkiv Perpleksivnist stanovit 2 0 9 log 2 0 9 0 1 log 2 0 1 1 38 Obernena velichina do neyi yaka u vipadku z k storonnim kubikom ye jmovirnistyu pravilnogo vgaduvannya dorivnyuye 1 1 38 0 72 a ne 0 9 Perpleksivnist ce pokaznikova funkciya vid entropiyi yaka ye bilsh tochnoyu velichinoyu Entropiya ce mira ochikuvanoyi abo serednoyi kilkosti bitiv neobhidnih dlya koduvannya rezultatu vipadkovoyi zminnoyi napriklad vikoristovuyuchi teoretichno optimalnij kod zminnoyi dovzhini Jogo ekvivalentno mozhna rozglyadati yak ochikuvanij informacijnij vigrash vid vivchennya rezultatu vipadkovoyi velichini Perpleksivnist imovirnisnoyi modeli red Model z nevidomim rozpodilom jmovirnosti velichini p mozhe buti stvorenoyu na osnovi navchalnoyi vibirki vzyatoyi z p Vrahovuyuchi zaproponovanu model jmovirnosti q mozhna ociniti q zʼyasuvavshi naskilki dobre vona peredbachaye okremu testovu vibirku x1 x2 xN takozh otrimanu z p Skladnist modeli q viznachayetsya yak b 1 N i 1 N log b q x i displaystyle b frac 1 N sum i 1 N log b q x i nbsp de b displaystyle b nbsp zazvichaj stanovit 2 Krashi modeli q nevidomogo rozpodilu p mayut tendenciyu viznachati vishi jmovirnosti q xi dlya testovih podij Takim chinom voni mayut nizhchu perpleksivnist tobto menshe divuyutsya testovomu zrazku Navedenu vishe eksponentu mozhna rozglyadati yak serednyu kilkist bit neobhidnih dlya predstavlennya testovoyi podiyi xi yaksho vikoristovuvati optimalnij kod z osnovoyu q Modeli z nizhchim znachennyam perpleksivnosti krashe spravlyayutsya zi spiskom testovoyi vibirki vimagayuchi v serednomu menshe bit na testovij element oskilki q xi maye tendenciyu do zrostannya Eksponentu mozhna takozh rozglyadati yak perehresnu entropiyu H p q x p x log 2 q x displaystyle H tilde p q sum x tilde p x log 2 q x nbsp de p displaystyle tilde p nbsp poznachaye empirichnij rozpodil testovoyi vibirki tobto p x n N displaystyle tilde p x n N nbsp yaksho x z yavilosya n raziv u testovij vibirci rozmiru N Perpleksivnist na slovo red V obrobci prirodnoyi movi perpleksivnist ye sposobom ocinki movnih modelej Movna model ce rozpodil jmovirnostej na cili rechennya abo teksti Vikoristovuyuchi viznachennya perpleksivnosti dlya imovirnisnoyi modeli mozhna bulo b znajti napriklad sho serednye rechennya xi u testovij vibirci mozhe buti zakodovano v 190 bit tobto testovi rechennya mali serednyu logarifmichnu jmovirnist 190 Dlya modeli ce oznachaye velichezne znachennya perpleksivnosti 2190 na rechennya Odnak chastishe zavedeno normalizuvati dovzhinu rechennya i vrahovuvati lishe kilkist bitiv na slovo Takim chinom yaksho usi rechennya testovogo zrazka mistili v cilomu 1000 sliv i yih mozhna bulo zakoduvati vikoristovuyuchi 7 95 bit na slovo to mozhna bulo b skazati sho perpleksivnist modeli 2 7 95 247 displaystyle 2 7 95 approx 247 nbsp na odne slovo Inshimi slovami model nastilki zaplutana v testovih danih nibi yij dovodilosya vibirati rivnomirno i nezalezhno z 247 mozhlivostej dlya kozhnogo slova Najmensha perpleksivnist yaka bula opublikovana v Braunivskomu korpusi mistit 1 miljon sliv amerikanskoyi anglijskoyi riznih tem i zhanriv stanom na 1992 rik dijsno stanovit blizko 247 na slovo sho vidpovidaye perehresnij entropiyi log 2 247 7 95 displaystyle log 2 247 approx 7 95 nbsp bit na slovo abo 1 75 bit na bukvu 1 yaksho skoristatisya trigramnoyu modellyu Zazvichaj mozhna dosyagti menshoyi perpleksivnist na specializovanih korpusah tekstiv oskilki voni bilsh peredbachuvani Zagalom proste peredbachennya pro te sho nastupnim slovom u korpusi Brauna ye slovo the bude mati tochnist 7 vidsotkiv a ne 1 247 0 4 vidsotki Vkazane pripushennya zasnovano na statistici unigramm korpusu Brauna a ne na statistici trigrami yaka dala slovu the perpleksivnist 247 Yak bachimo vikoristannya trigramnoyi modeli pidvishilo b shansi na pravilni pripushennya Primitki red Zatverdzhuvannya statistichnoyi modeliPosilannya red Brown Peter F March 1992 An Estimate of an Upper Bound for the Entropy of English Computational Linguistics 18 1 Procitovano 7 lyutogo 2007 Otrimano z https uk wikipedia org w index php title Perpleksivnist amp oldid 37862722