www.wikidata.uk-ua.nina.az
V statistici peretvorennya danih zvoditsya do zastosuvannya determinovanoyi matematichnoyi funkciyi do kozhnogo elementu v nabori danih tobto kozhna tochka z v nabori danih zaminyuyetsya na transformovane znachennya y i f z i displaystyle y i f z i de f ce yakas funkciya Peretvorennya zazvichaj zastosovuyutsya dlya togo shob dani tochnishe vidpovidali pripushennyam proceduri statistichnogo zvedennya a takozh dlya pokrashennya interpretaciyi abo viglyadu grafikiv Majzhe zavzhdi funkciya zastosovana dlya transformaciyi danih maye obernenu ta yeneperervnoyu Transformaciyu zazvichaj zastosovuyut do naboru porivnyanih vimiryuvan Napriklad yaksho mi mayemo nabir danih pro dohodi naselennya v yakijs valyuti transformaciyu zazvichaj vikonuyut za dopomogoyu logarifmichnoyi funkciyi Diagrama rozsiyuvannya v yakij ploshi suverennih derzhav ta zalezhnih teritorij svitu vidkladeno za vertikalnoyu vissyu navproti yihnih naselen za gorizontalnoyu vissyu Verhnya diagrama pokazuye siri dani Na nizhnij diagrami dani yak ploshi tak i naselennya bulo peretvoreno zastosuvannyam logarifmichnoyi funkciyi Zmist 1 Prichini transformaciyi danih 2 Peretvorennya danih v regresijnomu analizi 3 Prikladi transformacij 4 Tipovi transformaciyi 5 Transformaciya do normalnogo rozpodilu 6 Transformaciya do rivnomirnogo rozpodilu 7 PrimitkiPrichini transformaciyi danih red Napryamki peretvorennya danih abo obgruntuvannya neobhidnosti zastosuvannya transformaciyi mayut buti naslidkom zastosovanogo statistichnogo analizu Napriklad dlya viznachennya 95 dovirchogo intervalu serednogo znachennya dlya generalnoyi sukupnosti slid vzyati serednye znachennya vibirki plyus minus dva standartnih vidhilennya Prote vikoristannya same chisla dva obumovlyuyetsya vlastivostyami normalnogo rozpodilu i tomu mozhlive tilki v tomu vipadku koli serednye znachennya vibirki maye rozpodil blizkij do normalnogo Centralna granichna teorema stverdzhuye sho v bagatoh vipadkah serednye znachennya vibirki rozpodilene normalno yaksho rozmir vibirki dovoli velikij Prote yaksho generalna sukupnist ye asimetrichnoyu ta rozmir vibirki ye nevelikim aproksimaciya zaproponovana centralnoyu granichnoyu teoremoyu ye nekorektnoyu a tomu otrimanij v rezultati dovirchij interval mozhe mati dovirchu jmovirnist sho vidriznyayetsya vid zadanoyi Tomu asimetrichni dani zazvichaj transformuyut v simetrichnij rozpodil persh nizh obchislyuvati dovirchi intervali Yaksho neobhidno otrimanij dovirchij interval transformuyut v originalnu shkalu vikoristovuyuchi funkciyu obernenu do funkciyi peretvorennya Takozh dani transformuyut dlya sproshennya vizualizaciyi Napriklad vizmemo grafik na yakomu kozhna tochka vidpovidaye odnij zi svitovih krayin a osi h ta u zobrazhayut vidpovidno kilkist naselennya ta rozmir teritoriyi Yaksho zobrazhati takij grafik vikoristovuyuchi ne peretvoreni dani tobto dlya ploshi vikoristovuvati kvadratni kilometri a dlya naselennya kilkist osib to bilshist krayin opinitsya v nizhnomu livomu kutku u viglyadi klasteru z krapok Dekilka krayin z najbilshoyu plosheyu ta abo kilkistyu naselennya budut rozpodileni po koordinatnij ploshini Yaksho vikoristati inshi odinici vimiryuvannya napriklad ploshu viraziti v tisyachah kvadratnih kilometriv a naselennya v miljonah osib to grafik majzhe ne zminitsya Prote yaksho vikoristati logarifmichnu transformaciyu danih po oboh osyah tochki budut bilsh rivnomirno rozpodileni po grafiku Nareshti dani transformuyut dlya sproshennya interpretaciyi navit yaksho statistichnij analiz abo vizualizaciya ne vikoristovuyutsya Pripustimo sho nam potribno porivnyati avtomobili za parametrom ekonomiyi palnogo Podibni dani zazvichaj podayutsya v takih odinicyah vimiryuvannya yak kilometriv na litr palnogo Prote yaksho potribno ociniti kilkist dodatkovogo palnogo sho bude neobhidna u vipadku vikoristannya odniyeyi mashini abo inshoyi protyagom roku dani mozhna peretvoriti za dopomogoyu obernenoyi funkciyi shob otrimati znachennya virazheni v litrah na kilometr Peretvorennya danih v regresijnomu analizi red Linijna regresiya statistichnij metod sho vikoristovuyetsya dlya viznachennya vidnoshennya zalezhnoyi zminnoyi vid odniyeyi abo bilshe nezalezhnih zminnih Najprostishi regresijni modeli vidobrazhayut linijnu zalezhnist mizh matematichnim spodivannyam zalezhnoyi zminnoyi ta okremimi nezalezhnimi zminnimi pri fiksovanih znachennyah inshih nezalezhnih zminnih Yaksho navit pribliznoyi linijnoyi zalezhnosti nemaye inkoli mozhlivo transformuvati abo zalezhnu abo nezalezhni zminni v regresijnij modeli dlya viyavlennya linijnoyi zalezhnosti Inshim pripushennyam linijnoyi regresiyi ye rivnist dispersiyi dlya kozhnogo ochikuvanogo znachennya zalezhnoyi zminnoyi gomoskedastichnist Dlya otrimannya znachushih koeficiyentiv regresiyi za vikoristannya metodu najmenshih kvadrativ neobov yazkovo shob ce pripushennya vikonuvalos Prote obchisleni dovirchi intervali ta testi gipotez matimut krashi statistichni vlastivosti yaksho vono vikonuyetsya Cherez ce dlya uniknennya problem pov yazanih z geteroskedastichnistyu najchastishe vikoristovuyut odin z nastupnih pidhodiv Vikoristannya logarifmichnih peretvoren danih Zmina specifikaciyi modeli napriklad zastosuvannya linijnoyi transformaciyi nezalezhnoyi zminnoyi Vikoristannya metodu zvazhenih najmenshih kvadrativ vikoristannya MNK dlya zvazhenih abo transformovanih znachen zalezhnoyi ta nezalezhnih zminnih Obchislennya standartnoyi pohibki sho ye robastnoyu do geteroskedastichnosti Prikladi transformacij red Rivnyannya Y a b X displaystyle Y a bX nbsp Znachennya Zrostannya X na odinicyu viklikaye zrostannya Y v serednomu na b odinic Rivnyannya log Y a b X displaystyle log Y a bX nbsp Shlyahom zastosuvannya eksponencijnoyi funkciyi do oboh storin rivnyannya otrimayemo Y e a e b X displaystyle Y e a e bX nbsp Znachennya Zrostannya X na odinicyu prizvodit do zrostannya Y v serednomu na 100b Rivnyannya Y a b log X displaystyle Y a b log X nbsp Znachennya Zrostannya H na 1 prizvodit do zrostannya Y v serednomu na b 100 Rivnyannya log Y a b log X displaystyle log Y a b log X nbsp Shlyahom logarifmuvannya oboh storin rivnyannya Y e a X b displaystyle Y e a X b nbsp Znachennya Zrostannya H na 1 prizvodit do zrostannya Y v serednomu na b Tipovi transformaciyi red Dlya pozitivnih znachen danih zazvichaj zastosovuyut logarifmichnu funkciyu abo kvadratnij korin Obernenu transformaciyu vikoristovuyut dlya nenulovih znachen danih Stepeneva transformaciya yavlyaye soboyu grupu funkcij sho zastosovuyutsya v statistici dlya transformaciyi danih zi zberezhennyam rangu Ci funkciyi parametrizuyutsya za dopomogoyu nevid yemnogo parametru l rizni znachennya yakogo vidpovidayut logarifmichnij funkciyi kvadratnomu korenyu abo obernenij funkciyi Cej parametr mozhlivo statistichno ociniti dlya viznachennya tipu transformaciyi yaka bude najbilsh efektivnoyu Za dopomogoyu takoyu ocinki mozhlivo takozh viznachiti chi potribno vikoristovuvati transformaciyu vzagali Vikoristannya obernenoyi funkciyi ta stepenevih transformacij mozhlivo dlya danih yaki mayut pozitivni ta negativni znachennya stepeneva transformaciya bude korektnoyu yaksho l ye cilim ta neparnim Prote zazvichaj v takomu vipadku do vsih znachen danih dodayut konstantu shob otrimati nabir nevid yemnih danih do yakogo vzhe potim zastosovuyut transformaciyu Tipovo zastosovuvati transformaciyu u vipadkah koli dani mayut zminnij diapazon dani z riznimi ochikuvanimi znachennyami mayut riznu dispersiyu Ce vlastivo dlya danih po bagatoh fizichnih ta socialnih yavishah Dlya dodannya simetrichnosti takim danim vikoristovuyut stepenevi transformaciyi abo logarifmichne peretvorennya Prikladami takih transformacij ye transformaciya Fishera en transformaciya Anskomba en ta transformaciya Boksa Koksa en Vikoristannya logarifmichnogo peretvorennya takozh korisno u vipadku viznachennya vidnoshen Napriklad potribno porivnyati dvi pozitivni velichini X ta Y vikoristovuyuchi vidnoshennya X Y displaystyle frac X Y nbsp Todi yaksho X lt Y vidnoshennya X Y displaystyle frac X Y nbsp lezhit v intervali 0 1 a koli X gt Y vidnoshennya popadaye v interval 1 Yaksho zh zastosuvati logarifmichne peretvorennya danih to vidnoshennya X Y displaystyle frac X Y nbsp u vipadku rivnosti dvoh velichin a u vipadku yaksho H ta U ne ye rivnimi logarifmichni vidnoshennya log X Y 0 displaystyle log frac X Y 0 nbsp ta log Y X displaystyle log frac Y X nbsp budut rivnoviddalenimi vid nulya Yaksho znachennya danih kolivayutsya v mezhah vid 0 do 1 todi dlya transformaciyi mozhna vikoristati logistichnu funkciyu vona maye diapazon znachen Transformaciya do normalnogo rozpodilu red Bagato metodiv statistichnogo visnovuvannya vimagayut vikoristovuvannya normalno rozpodilenih danih Normalnist danih mozhna dosyagti cherez stepenevu transformaciyu Dlya ocinki vidpovidnosti danih parametram normalnogo rozpodilu zazvichaj vikoristovuyut grafichnij metod Odnim iz metodiv perevirki normalnosti danih ye graf Gistograma Normalno rozpodileni danni matimut viglyad simetrichnoyi Gausovoyi krivoyi Yaksho zh Gistograma viyavila nesimetrichnist dani mozhna sprobuvati transformuvati odnim iz nastupnih metodiv Logarifmichna transformaciya Y i log X i displaystyle Yi log Xi nbsp Vzyati korin iz chisla Yi Xi displaystyle ce Yi sqrt Xi nbsp Yaksho standartne vidhilennya proporcijno serednomu arifmetichnomu abo zh Gistograma pokazuye sho danni pozitivno asimetrichni mozhe dopomogti logarifmichna transformaciya Yaksho zh dispersiya proporcijna serednomu arifmetichnomu to pidijne koreneva transformaciya 1 Transformaciya do rivnomirnogo rozpodilu red Dlya naboru z n riznih znachen X 1 X n displaystyle X 1 X n nbsp mozhna zastosuvati rangovu transformaciyu Y i k displaystyle Y i k nbsp de k poryadkovij nomer Xi u ryadi ranzhovanomu za zrostannyam yaka privodit dani do rivnomirnogo rozpodilu Tak samo yaksho H vipadkova velichina a F funkciya rozpodilu jmovirnostej dlya H to yaksho F maye obernenu vipadkova velichina U F X displaystyle U F X nbsp ye rivnomirno rozpodilenoyu na odinichnomu intervali 0 1 Z rivnomirnogo rozpodilu mozhna zdijsniti transformaciyu do bud yakogo rozpodilu za dopomogoyu obernenoyi funkciyi rozpodilu jmovirnostej Tak yaksho G obernena funkciya rozpodilu jmovirnostej a U vipadkova rivnomirno rozpodilena velichina to dlya vipadkovoyi velichini G 1 U funkciya G bude funkciyeyu rozpodilu jmovirnostej Primitki red Manikandan S 1 lipnya 2010 Data transformation Journal of Pharmacology and Pharmacotherapeutics angl 1 2 s 126 ISSN 0976 500X PMID 21350629 doi 10 4103 0976 500X 72373 Procitovano 19 travnya 2021 nbsp Ce nezavershena stattya z matematiki Vi mozhete dopomogti proyektu vipravivshi abo dopisavshi yiyi Otrimano z https uk wikipedia org w index php title Peretvorennya danih statistika amp oldid 39262357