www.wikidata.uk-ua.nina.az
PageRank simejstvo algoritmiv ocinki vazhlivosti vebstorinok za dopomogoyu rozv yazannya sistem linijnih rivnyan Dlya kozhnoyi storinki obchislyuye dijsne chislo chim bilshe chislo tim vazhlivisha storinka 1 Princip roboti dlya nevelikoyi merezhiZamist pryamogo pidrahunku kilkosti posilan PageRank interpretuye posilannya storinki A na storinku B yak golos storinki A na korist storinki B Pislya cogo PageRank ocinyuye rejting storinki vidpovidno do kilkosti otrimanih golosiv PageRank takozh vrahovuye znachimist kozhnoyi storinki sho otrimala golos adzhe golosi deyakih storinok ye vazhlivishimi i vidpovidno do cogo pidvishuyetsya znachushist storinki posilannya na yaku voni mistyat Vazhlivi storinki otrimuyut bilsh visoku ocinku PageRank i vidobrazhayutsya na pershih poziciyah rezultativ poshuku Dlya viznachennya znachushosti storinki tehnologiya Google vikoristovuye kolektivnij intelekt vsesvitnoyi merezhi Lyudina ne bere uchasti v obrobci rezultativ Poshukova sistema Google ne spotvoryuye informaciyu pro poziciyi platoyu za rezultati poshuku Najbilshij pejdzhrank sered ukrayinskih resursiv maye Ukrayinska Vikipediya u yakoyi vin dorivnyuye 8 a takozh Ukrayinska pravda ta Gazeta Den po 7 dzherelo Za osnovu PageRank buv obranij akademichnij pidhid ocinki vazhlivosti publikaciyi avtora po chislu yiyi zgadok v bibliografichnih posilannyah inshih avtoriv Dlya adaptaciyi do zastosuvannya v Internet v algoritm buli vneseni nastupni zmini vaga kozhnogo posilannya vrahovuyetsya individualno i normuyetsya za kilkistyu posilan na storinci Krim togo PageRank mozhe buti interpretovano v terminah vipadkovogo blukannya Zmist 1 Istoriya 2 Obchislennya PageRank 2 1 Oglyad 2 2 Vipadkovi podorozhi 2 3 Tematika poyednanih storinok 3 Zastosuvannya Page Rank v poshukovikah 4 Literatura 5 Primitki 6 Div takozhIstoriya RedaguvatiIdeya rozv yazannya problemi analizu zv yaznih danih shlyahom obchislennya vlasnogo vektora bula zaproponovana v 1976 roci Gabrielem Pinski ta Frensis Narina yaki pracyuvali nad skladannyam naukometrichnih rejtingiv naukovih zhurnaliv 2 ta v 1977 roci Tomasom Saati v jogo koncepciyi metodu analizu iyerarhij yakij zvazhuvav alternativni varianti 3 PageRank buv stvorenij v Stenfordskomu universiteti Larri Pejdzhem i Sergiyem Brinom v 1996 roci 4 v ramkah naukovo doslidnogo proektu pro novij vid informacijno poshukovoyi sistemi 5 Sergij Brin visloviv ideyu sho informaciyu v Interneti mozhna vporyadkuvati v iyerarhiyu za populyarnistyu posilan chim bilshe posilan na storinku tim vishij u neyi rang 6 U stvorennya novogo algoritmu takozh zrobili vnesok Radzhiv Motvani i Terri Vinograd Persha stattya v yakij opisano PageRank i pochatkovij prototip informacijno poshukovoyi sistemi Google bula nadrukovana v 1998 roci 7 Trohi zgodom Pejdzh i Brin zasnuvali Google Inc kompaniyu sho stoyit za informacijno poshukovoyu sistemoyu Google Hocha PageRank ye lishe odnim z chinnikiv sho vplivayut na rezultati poshuku cej algoritm dosi zabezpechuye osnovu dlya vsih instrumentiv vebposhuku kompaniyi Google 8 Nazva PageRank poyednala prizvishe odnogo z vinahidnikiv Larri Pejdzha angl Page a takozh koncepciyu vebstorinki 9 PageRank zareyestrovana torgovelna marka kompaniyi Google a algoritm bulo zapatentovano U S Patent 6 285 999 Odnak cej patent nalezhit Stenfordskomu universitetu a ne kompaniyi Google Google maye eksklyuzivni prava na licenzijne vikoristannya patentu Stenfordskogo universitetu Natomist universitet otrimav 1 8 mln akcij Google za dozvil vikoristannya patentu akciyi buli prodani v 2005 roci za 336 mln 10 11 PageRank buv stvorenij pid vplivom algoritmu analizu citovanosti robotu nad yakim Yevgen Garfild rozpochav u 1950 ti v universiteti Pensilvaniyi ta Hyper Search rozroblenij Massimo Marhiori v universiteti Paduyi Togo zh roku koli buv oprilyudnenij algoritm PageRank 1998 Dzhon Klejnberg opublikuvav svoyu robotu pro algoritm HITS Zasnovniki kompaniyi Google posilayutsya na roboti Garfilda Marhiori ta Klejnberga u vlasnih publikaciyah 7 12 Porivnyano nevelika informacijno poshukova sistema rozrobki Robina Li RankDex sho nalezhala kompaniyi IDD Information Services vzhe v 1996 roci vikoristovuvala shozhij algoritm dlya ranzhuvannya sajtiv ta storinok 13 Vikoristanij v RankDex algoritm buv zapatentovanij v 1999 roci U S Patent 5 920 859 i zgodom buv vikoristanij u zasnovanij v Kitayii Li poshukovij sistemi Baidu 14 15 Larri Pejdzh posilavsya na robotu Li v deyakih patentah v SShA 16 Obchislennya PageRank RedaguvatiOglyad Redaguvati Osnovnoyu metoyu novogo algoritmu bulo polipshiti yakist vidpovidej na poshukovi zapiti Poshukovi sistemi togo chasu znachnoyu miroyu pokladalis na indeksuvannya storinok za klyuchovimi slovami Cim skoristalis zlovmisniki dlya manipulyaciyi rezultatami poshuku metodom poshukovogo spamu Rozrobniki PageRank zaznachili sho stanom na listopad 1997 roku lishe odna iz najposhirenishih poshukovih sistem bula zdatna vkazati vlasnu storinku v pershih 10 rezultatah pri zapiti na vlasnu nazvu bula zdatna znajti sama sebe 7 Zaproponovanij algoritm natomist brav do uvagi strukturu i tekst giperposilan Pri comu 1 Algoritm PageRank modelyuvav vipadkovu podorozh koristuvacha internet pochinayuchi z vipadkovoyi storinki Chim bilshe vipadkovih vidviduvachiv distavalis storinki tim vishe yiyi rejting Rozrobniki pripustili sho v takij sposib vdastsya uniknuti problem zi spamom za klyuchovimi slovami Vmist storinki ocinyuvali ne lishe za klyuchovimi slovami v nij a j v storinkah sho na neyi posilayutsya Rozrobniki pripustili sho zlovmisnikovi bude vazhche spotvoriti vmist storinok sho posilayutsya na jogo storinku tilki yaksho vin ne kontrolyuye inshi storinki Znachennya PageRank dlya storinki A obchislyuyetsya za takimi pravilami nehaj T 1 T n displaystyle T 1 dots T n nbsp storinki sho posilayutsya cituyut storinku A Algoritm takozh vikoristovuye koeficiyent dempingu d znachennyam yakogo znahodyatsya v promizhku mizh 0 ta 1 ta zazvichaj maye znachennya 0 85 Funkciya C T dorivnyuye kilkosti posilan sho vihodyat zi storinki T Todi znachennya PageRank storinki A PR A dorivnyuye 7 P R A 1 d d i 1 n P R T i C T i displaystyle PR A 1 d d sum i 1 n frac PR T i C T i nbsp Pri comu znachennya PageRank ce vipadkovi velichini suma yakih dlya vsih storinok dorivnyuvatime 1 Vipadkovi podorozhi Redaguvati Dlya obchislennya PageRank Veb predstavlyayetsya u viglyadi oriyentovanogo grafu vershini yakogo vidpovidayut storinkam a rebra giperposilannyam mizh nimi Nehaj do poshukovogo indeksu vneseno n storinok Todi dlya modelyuvannya vipadkovoyi podorozhi stvoryuyetsya matricya perehodiv M rozmiru n n displaystyle n times n nbsp Element ciyeyi matrici m i j displaystyle m ij nbsp sho znahoditsya v ryadku i ta stovpchiku j maye znachennya 1 k displaystyle 1 k nbsp yaksho storinka z nomerom j maye k vihidnih posilan sered yakih ye odne na storinku z nomerom i Yaksho takogo posilannya nema to element maye znachennya 0 1 Rozpodil jmovirnostej znahodzhennya vipadkovogo mandrivnika mozhe buti opisano vektor stovpchikom ryadok j yakogo dorivnyuvatime jmovirnosti perebuvannya na storinci j 17 Cej vektor vidpovidatime najprostishomu idealizovanomu variantu PageRank Pripustimo sho mandrivnik mozhe rozpochati blukannya z bud yakoyi iz n indeksovanih storinok z odnakovoyu jmovirnistyu Todi znachennya elementiv pochatkovogo vektora dorivnyuvatimut 1 n Jmovirnist znahodzhennya na bud yakij zi storinok na nastupnomu kroci jogo blukannya mozhna viznachiti obchislennyam M v 0 displaystyle M mathbf v 0 nbsp Ishe cherez krok M M v 0 M 2 v 0 displaystyle M M mathbf v 0 M 2 mathbf v 0 nbsp i tak dali Takim chinom proces vipadkovogo blukannya ye Markovskim a vektor rozpodiliv v vlasnim dlya matrici M Za umovi yaksho graf giperposilan zv yaznij tobto z kozhnoyi vershini isnuye shlyah do bud yakoyi inshoyi v grafi vidsutni tupikovi vershini tobto z kozhnoyi vershini ye bodaj odne vihidne giperposilannya to z chasom rozpodil jmovirnostej znahodzhennya mandrivnika syagne granici v M v displaystyle mathbf v M mathbf v nbsp Prote cherez te sho graf giperposilan realnoyi merezhi Veb ne zavzhdi zv yaznij ta maye tupikovi vershini u formulu vipadkovogo blukannya dovoditsya zaprovaditi mozhlivist vipadkovogo stribka na inshu vershinu Takim chinom formula obchislennya rozpodiliv znahodzhennya v displaystyle mathbf v nbsp matime viglyad 18 v b M v 1 b e n displaystyle mathbf v beta M mathbf v 1 beta mathbf e n nbsp de b konstanta sho zazvichaj maye znachennya v promizhku 0 8 0 9 e odinichnij vektor rozmirom n vsi elementi yakogo dorivnyuyut 1 n kilkist indeksovanih storinok vidpovidno kilkist vershin grafu bM v modelyuye vipadok koli z jmovirnistyu b mandrivnik virishuye obrati vihidne posilannya z potochnoyi storinki 1 b e n vektor kozhen element yakogo dorivnyuye 1 b n i yakij modelyuye poyavu mandrivnika na bud yakij storinci z jmovirnistyu 1 b Uyavit sobi idealnogo vebserfera yakij peremishayetsya po vsesvitnij pavutini Nehaj serfer vidviduye storinku p vipadkove blukannya pri comu znahoditsya v stani p Na kozhnomu kroci vebserfer abo perestribuye na inshu storinku v merezhi obranu psevdo vipadkovim chinom abo vin slid za posilannyam na potochnij storinci pri comu ne povertayuchis i ne vidviduyuchi odnu i tu zh storinku dvichi Imovirnist vipadkovogo stribka poznachimo yak d todi jmovirnist perehodu za posilannyam bude 1 d Takim chinom virogidnist znahodzhennya koristuvacha na storinci p mozhna obchisliti za takoyu formuloyu de R p PageRank storinki S p chislo posilan na storinci k chislo posilayutsya na p storinok d koeficiyent zagasannya damping factor zazvichaj 0 1 Yaksho masshtabuvati PageRank takim chinom sho de N chislo vsih storinok dlya yakih provoditsya rozrahunok PageRank to R p mozhna rozglyadati yak rozpodil jmovirnosti po vsih storinkah Dlya obchislennya PageRank skladayetsya matricya M rozmirom NxN de kozhnomu elementu mij matrici prisvoyuyetsya znachennya R0 p 1 C p v tomu vipadku yaksho z i yi storinki ye posilannya na j uyu sho vse zalishilisya elementi matrici zapovnyuyutsya nulyami Takim chinom obchislennya PageRank zvoditsya do vidshukannya vlasnogo vektora matrici M sho dosyagayetsya mnozhennyam matrici M na vektor Rj na kozhnomu kroci iteraciyi Vvedennya koeficiyenta zagasannya garantuye sho proces shoditsya Pidvishuyemo znachimist sajtu Usvidomivshi peremozhnu hodu PageRank ne mozhna ne zadumatisya pro jogo zbilshennya dlya svoyeyi storinki Intuyitivno zrozumilo sho chim avtoritetnishij resurs na yakomu rozmisheno posilannya tim bilshe vona zbilshuye PageRank storinki na yaku posilayetsya I navpaki chim bilshe posilan na storinci tim menshe bude yiyi vnesok u pidvishennya PageRank vashoyi storinki she odin dokaz marnosti uchasti v FFA Free For All sajti sho mistyat nabir posilan z vilnim dodavannyam Mensh ochevidna optimalna topologiya vzayemno ssilayushihsya storinok Napriklad storinki organizovani v kilce koli kozhna storinka posilayetsya na susida zliva i sprava ostannya posilayetsya na pershu a persha na ostannyu budut mati odin i toj zhe PageRank ne zalezhno vid kilkosti storinok v kilci yaksho ne provoditi masshtabuvannya po sumi to PageRank u vsih bude dorivnyuye 1 Te zh spravedlivo dlya zirok abo vipadku koli vsi posilayutsya na vsih i jmovirno ce tverdzhennya spravedlivo vzagali dlya vsih simetrichnih topologij Nabagato bilsh perspektivni z tochki zoru zbilshennya PageRank asimetrichni topologiyi Tverdzhennya pro marnist stvorennya porozhnih ale posilayutsya odin na odnogo sajtiv u bezkoshtovnih hosteriv ne nastilki ochevidno Napriklad mozhna organizuvati obmin posilannyami na 5 sajtah takim chinom sho v odnogo z nih PageRank bude v 15 raziv bilshe nizh minimalnij ne nulovij PageRank U comu neskladno perekonatisya napisavshi neveliku programku Deyaki poshireni pomilki pov yazani z PageRank Proanalizuvavshi povidomlennya v forumah prisvyachenih pozicionuvannyu v poshukovih sistemah mozhna vidiliti cilij ryad tverdzhen pro PageRank yak minimum spirnih a chasto prosto nevirnih Tematika poyednanih storinok RedaguvatiZastosuvannya Page Rank v poshukovikah RedaguvatiTradicijni sposobi znahodzhennya relevantnih storinok u razi odnoskladovih zapitiv ne dayut zadovilnih rezultativ tomu sho popopulyarnih tem napriklad referati robota zavzhdi znajdetsya velika kilkist storinok z odnakovoyu relevantnistyu Dlya togo shob yakos vporyadkuvati taki storinki poshukoviki vdayutsya do zastosuvannya riznih instrumentiv 19 Napriklad vidayut pershimi ti storinki yaki mayut veliku vidviduvanist Rambler abo yaki prisutni v katalozi Yandex Aport V Google dlya cih cilej zastosovuyut zokrema PageRank sho daye prigolomshlivi rezultati i za korotkij chas Google stav zajmati lidiruyuchi poziciyi ne tilki za obsyagom bazi ale i za yakistyu poshuku V berezni 2016 roku Google zayavila sho usune ostannyu publichno dostupnu mozhlivist diznavatis PageRank storinok bude pripinena robota moduliv dlya vebbrauzeriv Toolbar PageRank Odnak algoritm PageRank j nadali bude vikoristanij v poshukovij sistemi dlya ocinki yakosti storinok 20 Publichnij dostup do ocinok PageRank bulo piddano kritici oskilki ce nachebto spriyalo poshirennyu poshukovoyi optimizaciyi z yiyi negativnimi naslidkami 21 Literatura RedaguvatiCej rozdil potrebuye dopovnennya veresen 2015 Primitki Redaguvati a b v Jure Leskovec Anand Rajaraman Jeffrey D Ullman 2014 5 1 PageRank Mining of Massive Datasets Arhiv originalu za 18 veresnya 2015 Procitovano 17 veresnya 2015 Gabriel Pinski and Francis Narin Citation influence for journal aggregates of scientific publications Theory with application to the literature of physics Information Processing amp Management 12 5 297 312 doi 10 1016 0306 4573 76 90048 0 Arhiv originalu za 24 veresnya 2015 Procitovano 22 veresnya 2015 Thomas Saaty 1977 A scaling method for priorities in hierarchical structures Journal of Mathematical Psychology 15 3 234 281 doi 10 1016 0022 2496 77 90033 5 Arhiv originalu za 24 veresnya 2015 Procitovano 22 veresnya 2015 Raphael Phan Chung Wei 16 travnya 2002 New Straits Times vid Computimes 2 storinku Larri Arhivovana kopiya Arhiv originalu za 6 travnya 2002 Procitovano 16 lyutogo 2019 Stenfordskij proekt elektronnoyi biblioteki govoriti 18 serpnya 1997 arhiv 2002 187 storinkove doslidzhennya z universiteti Graca Avstriya Arhivovano 16 sichnya 2014 u Wayback Machine vklyuchaye v sebe takozh uvagu sho lyudskij mozok vikoristovuyutsya pri viznachenni rangu storinki v Google a b v g Brin S Page L 1998 The anatomy of a large scale hypertextual Web search engine Computer Networks and ISDN Systems 30 107 117 ISSN 0169 7552 doi 10 1016 S0169 7552 98 00110 X Arhiv originalu za 27 veresnya 2015 Procitovano 24 veresnya 2015 Google Technology Google com Arhiv originalu za 23 chervnya 2008 Procitovano 27 travnya 2011 David Vise and Mark Malseed 2005 The Google Story s 37 ISBN 0 553 80457 X Lisa M Krieger 1 December 2005 Stanford Earns 336 Million Off Google Stock San Jose Mercury News cited by redOrbit Arhiv originalu za 8 kvitnya 2009 Procitovano 25 lyutogo 2009 Richard Brandt Starting Up How Google got its groove Stanford magazine Arhiv originalu za 10 bereznya 2009 Procitovano 25 lyutogo 2009 Page Lawrence Brin Sergey Motwani Rajeev and Winograd Terry 1999 The PageRank citation ranking Bringing order to the Web Arhiv originalu za 27 kvitnya 2006 Procitovano 22 veresnya 2015 opublikovanij v tehnichnomu zviti 29 sichnya 1998 u formati PDF Arhivovano 10 bereznya 2020 u Wayback Machine Li Yanhong August 6 2002 Toward a qualitative search engine Internet Computing IEEE IEEE Computer Society 2 4 24 29 doi 10 1109 4236 707687 Andy Greenberg 5 zhovtnya 2009 The Man Who s Beating Google Forbes Arhiv originalu za 18 veresnya 2012 Procitovano 22 veresnya 2015 About RankDex Arhivovano 25 travnya 2015 u Wayback Machine rankdex com Div osoblivo Lourens Pejdzh patenti SShA U S Patent 6 799 176 2004 Metod dlya ozvuchuvannya dokumentiv u pov yazanoyi bazi danih U S Patent 7 058 628 2006 Metod dlya vuzla rejtingu v pov yazanoyi bazi danih i U S Patent 7 269 587 2007 Zalikovi dokumenti u zv yazanomu bazi danih 2011 Mining of Massive Datasets stor 167 Mining of Massive Datasets stor 174 Arhivovana kopiya Arhiv originalu za 2 grudnya 2013 Procitovano 2 grudnya 2013 Barry Schwartz 8 bereznya 2016 Google has confirmed it is removing Toolbar PageRank Search Engine Land Arhiv originalu za 10 bereznya 2016 Procitovano 10 bereznya 2016 Danny Sullivan 9 bereznya 2016 RIP Google PageRank score A retrospective on how it ruined the web Search Engine Land Arhiv originalu za 10 bereznya 2016 Procitovano 10 bereznya 2016 Div takozh RedaguvatiIndeks cituvan Indeks cituvannya vebsajtiv Optimizaciya dlya poshukovih sistem Markovskij proces Otrimano z https uk wikipedia org w index php title PageRank amp oldid 35700443