www.wikidata.uk-ua.nina.az
Iyerarhichna klasterizaciya angl hierarchical cluster analysis HCA v dobuvanni danih ta statistici metod klasternogo analizu yakij namagayetsya pobuduvati iyerarhiyu klasteriv Strategiyi pobudovi iyerarhichnoyi klasterizaciyi dilyatsya na dva tipi 1 aglomeratovi ob yednuvalni Ce pidhid znizu vgoru en Spochatku kozhna tochka maye vlasnij klaster a dali pari klasteriv ob yednuyutsya pri pidjomi po iyerarhiyi rozdilyuvalni Ce pidhid zgori vniz en Spochatku vsi tochki znahodyatsya u yedinomu klasteri potim vidbuvayetsya rekursivne rozbittya pri rusi vniz po iyerarhiyi Zazvichaj rozbittya ta ob yednannya viznachayutsya u zhadibnij sposib Otrimanu iyerarhiyu tipovo zobrazhayut yak dendrogramu en Standartnij algoritm iyerarhichnoyi klasterizaciyi maye chasovu skladnist O n3 displaystyle mathcal O n 3 ta potrebuye O n2 displaystyle mathcal O n 2 pam yati sho zanadto povilno navit dlya naboriv danih serednogo rozmiru Odnak dlya deyakih vipadkiv ye aglomeratovi metodi yaki vikonuyutsya za chas O n2 displaystyle mathcal O n 2 Ce metodi SLINK 2 3 pri odnozv yaznij ta CLINK 4 3 pri povnozv yaznij klasterizaciyi en Vikoristannya kupi dozvolyaye u zagalnomu vipadku skorotiti chas vikonannya do O n2log n displaystyle mathcal O n 2 log n cinoyu zbilshennya vimog do ob yemu pam yati Taki nakladni vitrati na pam yat dlya bagatoh mov programuvannya roblyat cej pidhid nemozhlivim dlya realizaciyi Okrim specialnogo odnozv yaznogo vipadku nemaye algoritmiv okrim povnogo pereboru za chas O 2n displaystyle mathcal O 2 n yakij bi garantuvav optimalnij rozv yazok Rozdilyuvalna klasterizaciya z povnim pereborom vikonuyetsya za chas O 2n displaystyle mathcal O 2 n prote zvichajnoyu praktikoyu ye vikoristannya bilsh shvidkih evristik dlya rozbittya taki yak k seredni Zmist 1 Dendrograma 2 Korelyacijni pleyadi 3 Diagrama Chekanovskogo 4 Div takozh 5 PrimitkiDendrograma red nbsp DendrogramaPid dendrogramoyu zazvichaj rozumiyetsya derevo tobto graf bez cikliv pobudovanij za matrici zahodiv blizkosti Dendrograma dozvolyaye zobraziti vzayemni zv yazki mizh ob yektami z zadanogo pereliku 5 Dlya stvorennya dendrogrami potribno matricya podibnosti chi vidminnosti yaka viznachaye riven sporidnenosti mizh parami ob yektiv Chastishe vikoristovuyutsya aglomerativni metodi Dali neobhidno vibrati metod pobudovi dendrogrami yakij viznachaye metod vizualizaciyi matrici podibnosti chi vidminnosti pislya ob yednannya abo podilu chergovih dvoh ob yektiv v klaster U robotah po klasternomu analizu opisanij dosit znachnij ryad sposobiv pobudovi angl sorting strategies dendrogramm 6 Metod odinochnogo zv yazku angl single linkage Takozh vidomij yak metod najblizhchogo susida Metod povnogo zv yazku angl complete linkage Takozh vidomij yak metod dalekogo susida Metod serednogo zv yazku angl pair group method using arithmetic averages Nezvazhenij angl unweighted Zvazhenij angl weighted Centroyidnij metod angl pair group method using the centroid average Nezvazhenij Zvazhenij mediannij Metod Uorda angl Ward s method Dlya pershih troh metodiv isnuye zagalna formula zaproponovana A N Kolmogorovim dlya zahodiv podibnosti 7 Kh i j k niK i k h njK j k h ni nj 1h 1 h 1 displaystyle K eta i j k left frac n i K i k eta n j K j k eta n i n j right frac 1 eta mathcal 1 leqslant eta leqslant mathcal 1 nbsp de i j displaystyle i j nbsp grupa z dvoh ob yektiv klasteriv i j displaystyle j nbsp k displaystyle k nbsp ob yekt klaster z yakim shukayetsya shozhist zaznachenoyi grupi ni displaystyle n i nbsp kilkist elementiv u klasteri displaystyle nj displaystyle n j nbsp kilkist elementiv u klasteri j displaystyle j nbsp Dlya vidstanej ye analogichna formula Lansa Vilyamsa 8 Centroyidnij metod vikoristovuye dlya pererahunku matrici vidstanej 9 Yak vidstani mizh dvoma klasterami u comu metodi beretsya vidstan mizh centrami tyazhinnya U metodi Uorda yak vidstani mizh klasterami beretsya pririst sumi kvadrativ vidstanej ob yektiv do centriv klasteriv sho otrimuyetsya v rezultati yih ob yednannya 10 Na vidminu vid inshih metodiv klasternogo analizu dlya ocinki vidstanej mizh klasterami tut vikoristovuyutsya metodi dispersijnogo analizu Na kozhnomu kroci algoritmu ob yednuyutsya taki dva klasteri yaki prizvodyat do minimalnogo zbilshennya cilovoyi funkciyi tobto vnutrishnogrupovoyi sumi kvadrativ Cej metod spryamovanij na ob yednannya blizko roztashovanih klasteriv Korelyacijni pleyadi red nbsp DendritShiroko zastosovuyutsya v geobotanici ta floristici Yih chasto nazivayut korelyacijnimi pleyadami 11 12 13 14 Okremim vipadkom ye metod vidomij yak metod pobudovi optimalnih derev dendritiv yakij buv zaproponovanij matematikom lvivskoyi shkoli Gugo Shtejngauzom 15 zgodom metod buv rozvinenij matematikami vroclavskoyi taksonomichnoyi shkoli 16 Dendriti takozh ne povinni utvoryuvati cikliv Mozhna chastkovo vikoristovuvati spryamovani dugi grafiv pri vikoristanni dodatkovo zahodiv vklyuchennya nesimetrichnih zahodiv podibnosti Diagrama Chekanovskogo red Metod diagonalizaciyi matrici vidminnosti i grafichne zobrazhennya klasteriv uzdovzh golovnoyi diagonali matrici vidminnosti diagrama Chekanovskogo vpershe zaproponovanij Yanom Chekanovskim u 1909 roci 17 Navedemo opis metodiki Sut cogo metodu polyagaye v tomu sho vsyu amplitudu otrimanih velichin podibnosti rozbivayut na ryad klasiv a potim v matrici velichin podibnosti zaminyuyut ci velichini shtrihuvannyam riznoyi dlya kozhnogo klasu prichomu zazvichaj dlya bilsh visokih klasiv podibnosti zastosovuyut temnishe shtrihuvannya Potim zminyuyuchi poryadok opisiv v tablici domagayutsya togo shob podibni opisi buli roztashovani poruch 18 Navedemo gipotetichnij priklad otrimannya takoyi diagrami Osnovoyu metodu ye pobudova matrici tranzitivnogo zamikannya 19 nbsp Priklad rozrahunku diagrami ChekanovskogoDlya pobudovi matrici tranzitivnogo zamikannya vizmemo prostu matricyu podibnosti i pomnozhimo yiyi na samu sebe K 2 i j max min K i 1 K 1 j min K i q K q j displaystyle K 2 i j max min K i 1 K 1 j min K i q K q j nbsp de K i j displaystyle K i j nbsp element sho stoyit na peretini i displaystyle i nbsp go ryadka j displaystyle j nbsp go stovpcya v novij drugij matrici otrimanij pislya pershoyi iteraciyi q displaystyle q nbsp zagalna kilkist ryadkiv stovpchikiv matrici podibnosti Danu proceduru neobhidno prodovzhuvati poki matricya ne stane idempotentnoyu tobto samopodibnoyu K n i j K n 1 i j displaystyle K n i j K n 1 i j nbsp de n displaystyle n nbsp kilkist iteracij Dali peretvoryuyemo matricyu takim chinom shob blizki chislovi znachennya znahodilisya poryad Yaksho kozhnomu chislovomu znachennyu postaviti u vidpovidnist bud yakij kolir abo vidtinok koloru yak u nashomu vipadku to otrimayemo klasichnu diagramu Chekanovskogo Tradicijno temnishij kolir vidpovidaye bilshij podibnosti a svitlishij menshij V comu vona shozha z teplokartoyu matrici vidstanej Div takozh red Graf matematika Klasternij analiz Metrichnij prostir Zavdannya klasifikaciyi Gilkova dekompoziciyaPrimitki red Rokach Lior and Oded Maimon Clustering methods Data mining and knowledge discovery handbook Springer US 2005 321 352 R Sibson 1973 SLINK an optimally efficient algorithm for the single link cluster method PDF The Computer Journal British Computer Society 16 1 doi 10 1093 comjnl 16 1 30 Arhiv originalu PDF za 24 veresnya 2014 Procitovano 31 zhovtnya 2018 a b Schutze Hinrich Christopher D Manning Raghavan Prabhakar 2008 Introduction to information retrieval Cambridge UK Cambridge University Press ISBN 0 521 86571 9 Arhiv originalu za 12 listopada 2018 D Defays 1977 An efficient algorithm for a complete link method The Computer Journal British Computer Society 20 4 doi 10 1093 comjnl 20 4 364 Arhiv originalu za 12 zhovtnya 2016 Procitovano 31 zhovtnya 2018 Zhambyu M Iyerarhichnij klaster analiz ta vidpovidnosti M Finansy i statistika 1988 345 s Klassifikaciya i klaster Pod red Dzh Ven Rajzina M Mir 1980 390 s Ajvazyan S A Buhshtaber V M Enyukov I S Meshalkin L D Prikladnaya statistika Klassifikaciya i snizhenie razmernosti M Finansy i statistika 1989 607 s Lance G N Willams W T A general theory classification of sorting strategies 1 Hierarchical systems Comp J 1967 9 P 373 380 Sneath P H A Sokal R R Numerical taxonomy The principles and practices of numerical classification San Francisco Freeman 1973 573 p Ward J H Hierarchical grouping to optimize an objective function J of the American Statistical Association 1963 236 r von Terentjev P V Biometrische Untersuchungen uber die morphologischen Merkmale von Rana ridibunda Pall Amphibia Salientia Arhivovano 5 bereznya 2016 u Wayback Machine Biometrika 1931 23 1 2 P 23 51 Terentyev P U Metod korelyacijnih pleyad Visn LDU 9 1959 S 35 43 Terentyev P U Podalshij rozvitok metodu korelyacijnih pleyad Zastosuvannya matematichnih metodiv v biologiyi T 1 L 1960 S 42 58 Vyhandu L K Pro doslidzhenni mnogopriznakovyh biologichnih sistem Zastosuvannya matematichnih metodiv v biologiyi L vyp 3 1964 S 19 22 Shtejngauz R Matematichnij kalejdoskop M Nauka 1981 160 s Florek K Lukaszewicz S Percal S Steinhaus H Zubrzycki S Taksonomia Wroclawska Przegl antropol 1951 T 17 S 193 211 Czekanowski J Zur differential Diagnose der Neandertalgruppe Korrespbl Dtsch Ges Anthropol 1909 Bd 40 S 44 47 Vasilevich V I Statisticheskie metody v geobotanike L Nauka 1969 232 s Tamura S Hiquchi S Tanaka K Pattern classification based on fuzzy relation Arhivovano 17 travnya 2017 u Wayback Machine IEEE transaction on systems man and cybernetics 1971 SMC 1 1 P 61 67 Otrimano z https uk wikipedia org w index php title Iyerarhichna klasterizaciya amp oldid 37405509