www.wikidata.uk-ua.nina.az
Universalnij kodovanij nabir simvoliv UCS ce standartnij nabir simvoliv viznachenij Mizhnarodnim standartom ISO IEC 10646 yakij ye osnovoyu bagatoh koduvan simvoliv Ostannya versiya mistit ponad 136 000 abstraktnih simvoliv kozhen z yakih identifikuyetsya odnoznachnim im yam i cilim chislom sho nazivayetsya kodovoyu tochkoyu Cej standart ISO IEC 10646 pidtrimuyetsya spilno zi standartom Unicode Yunikod i voni identichni kodu dlya kodu Simvoli bukvi cifri simvoli ideogrami logogrami tosho z bagatoh mov manuskriptiv ta tradicij svitu predstavleni v UCS z unikalnimi kodovimi tochkami Inklyuzivnist UCS postijno pokrashuyetsya oskilki dodayutsya simvoli ranishe nepredstavlenih sistem pisma UCS maye ponad 1 1 miljona mozhlivih kodovih tochok dostupnih dlya vikoristannya rozpodilu ale lishe pershi 65 536 Bazova bagatomovna ploshina Basic Multilingual Plane BMP uvijshli do zagalnogo koristuvannya do 2000 roku Situaciya pochala zminyuvatisya koli Kitajska Narodna Respublika KNR uhvalila rishennya u 2006 r sho vse programne zabezpechennya sho prodayetsya pid yihnoyu yurisdikciyeyu povinne pidtrimuvati GB 18030 Dlya cogo potribno bulo perenesti programne zabezpechennya priznachene dlya prodazhu v KNR za mezhi BMP Sistema svidomo zalishaye bagato kodovih tochok ne zapovnenimi navit u BMP dlya majbutnogo rozshirennya naboru i dlya togo shob zvesti do minimumu konflikti z inshimi formami koduvannya Zmist 1 Koduvannya form 2 Istoriya 3 Vidminnosti vid Unicode 4 Posilannya na Universalnij nabir simvoliv 5 Vidnosini z Unicode 6 Div takozh 7 DzherelaKoduvannya form RedaguvatiISO IEC 10646 viznachaye kilka form koduvannya simvoliv dlya Universalnogo kodovanogo naboru simvoliv Najprostishij UCS 2 vikoristovuye odne znachennya kodu viznachene yak chislo z yakih odne chi bilshe predstavlyaye kodova tochka zagalom ale dlya UCS 2 ce strogo odne znachennya kodu yake predstavlyaye kodova tochka vid 0 do 65 535 dlya kozhnogo simvolu i dozvolyaye rivno dvom bajtam odne 16 bitove slovo predstavlyati ce znachennya Takim chinom UCS 2 dozvolyaye dvijkove predstavlennya kozhnoyi tochki kodu v BMP sho predstavlyaye simvol UCS 2 ne mozhe predstavlyati kodovi tochki poza BMP Persha popravka do originalnoyi redakciyi UCS viznachila UTF 16 rozshirennya UCS 2 dlya predstavlennya kodovih tochok za mezhami BMP Diapazon kodovih tochok u S specialnij zoni BMP zalishayetsya neprisvoyenim simvolam UCS 2 zaboronyaye vikoristannya znachen kodu dlya cih kodovih tochok ale UTF 16 dozvolyaye vikoristovuvati yih parami Unicode takozh prijnyav UTF 16 ale v jogo terminologiyi elementi zoni visokoyi polovini stayut visokimi surogatami a elementi zoni nizkoyi polovini nizkimi surogatami Inshe koduvannya UCS 4 vikoristovuye chotiri bajti zagalom 32 biti dlya koduvannya odnogo simvolu prostoru kodiv Navit nezvazhayuchi na te sho Unicode obmezhuye prostir kodu verhnoyu mezheyu 10FFFF Standart ISO IEC 10646 zayaviv sho vsi majbutni priznachennya simvoliv budut vikonuvatisya v diapazoni do 0x7FFFFFFFhex UCS 4 dozvolyaye predstavlyati kozhne znachennya yak rivno chotiri bajti odne 32 bitove slovo Takim chinom UCS 4 dozvolyaye dvijkove predstavlennya kozhnoyi kodovoyi tochki v UCS v tomu chisli poza BMP Yak i v UCS 2 kozhen zakodovanij simvol maye fiksovanu dovzhinu v bajtah sho sproshuye manipulyaciyi ale zvichajno vin vimagaye vdvichi bilshe miscya dlya zberigannya nizh UCS 2 Zaraz dominuyuchim koduvannyam UCS ye UTF 8 yake ye koduvannyam zminnoyi shirini priznachenim dlya zvorotnoyi sumisnosti z ASCII a takozh dlya uniknennya uskladnen minlivosti ta poznachok poryadku bajtiv v UTF 16 ta UTF 32 Ponad 93 usih vebstorinok zakodovano v UTF 8 Robocha grupa Internet inzheneriyi IETF vimagaye vid usih protokoliv Internetu identifikaciyi koduvannya sho vikoristovuyetsya dlya danih simvoliv a pidtrimuvani koduvannya simvoliv povinni vklyuchati UTF 8 Internet poshtovij konsorcium IMC rekomenduye shob usi programi elektronnoyi poshti mali mozhlivist vidobrazhati ta stvoryuvati poshtu za dopomogoyu UTF 8 Vin takozh vse chastishe vikoristovuyetsya yak koduvannya simvoliv za zamovchuvannyam v operacijnih sistemah movah programuvannya API ta programnih dodatkah Div Takozh Porivnyannya koduvannya Unicode en Istoriya RedaguvatiMizhnarodna organizaciya zi standartizaciyi ISO mala namir sklasti universalnij simvol vstanovlenij u 1989 r i opublikuvala proekt ISO 10646 u 1990 r H yu Makgregor Ross en buv odnim z golovnih arhitektoriv Cej standart pomitno vidriznyavsya vid potochnogo Vin viznachav 128 grup 256 ploshin 256 ryadkiv 256 komirok dlya zagalnoyi sumi 21474834848 simvoliv ale naspravdi standart mig koduvati lishe 679477248 simvoliv oskilki politika zaboronyala znachennya bajtiv kontrolnih kodiv C0 ta C1 vid 0x00 do 0x1F ta 0x80 do 0x9F u shistnadcyatkovih poznachennyah u bud yakomu z chotiroh bajtiv iz zaznachennyam grupi ploshini ryadka ta komirki Napriklad latinska velika litera A mala roztashuvannya v grupi 0x20 ploshini 0x20 ryadku 0x20 komirci 0x41 Mozhna koduvati simvoli cogo pervinnogo standartu ISO 10646 odnim iz troh sposobiv UCS 4 chotiri bajti dlya kozhnogo simvolu sho zabezpechuye proste koduvannya vsih simvoliv UCS 2 dva bajti dlya kozhnogo simvolu sho dozvolyaye koduvati pershu ploshinu 0x20 Bazovu bagatomovnu ploshinu sho mistit pershi 36 864 kodovih tochok pryamolinijno ta inshi ploshini ta grupi pereklyuchivshis na nih iz poslidovnostyami vihodu z ISO 2022 UTF 1 yakij koduye vsi simvoli v poslidovnosti bajtiv riznoyi dovzhini vid 1 do 5 bajt kozhen z yakih ne mistit kontrolnih kodiv Tomu v 1990 roci isnuvali dvi iniciativi shodo universalnogo naboru simvoliv Unicode z 16 bitami dlya kozhnogo simvolu 65 536 mozhlivih simvoliv ta ISO 10646 Kompaniyi sho viroblyayut programne zabezpechennya vidmovilis prijnyati vimogu shodo skladnosti ta rozmiru standartu ISO i zmogli perekonati nizku nacionalnih organiv ISO progolosuvati proti Standartizatori ISO zrozumili sho ne mozhut prodovzhuvati pidtrimuvati standart u jogo potochnomu stani i domovilis pro unifikaciyu svogo standartu z Unicode Vidbulisya dvi zmini skasuvannya obmezhennya na simvoli zaborona znachen kontrolnogo kodu takim chinom vidkrivayuchi kodovi tochki taki yak 0x0000101F dlya rozpodilu i sinhronizaciya repertuaru Bazovogo bagatomovnogo planu z Unicode Tim chasom iz plinom chasu situaciya zminilasya i v samomu standarti Unicode 65 536 simvoliv viyavilosya nedostatnim a standart z versiyi 2 0 i dali pidtrimuye koduvannya 1112 064 kodovih tochok z 17 ploshin za dopomogoyu surogatnogo mehanizmu UTF 16 Z ciyeyi prichini ISO 10646 mistiv stilki simvoliv skilki mozhe koduvati UTF 16 i ne bilshe tobto trohi bilshe miljona simvoliv zamist ponad 679 miljoniv Koduvannya UCS 4 za standartom ISO 10646 bulo vklyucheno do standartu Unicode z obmezhennyam do diapazonu UTF 16 ta pid nazvoyu UTF 32 hocha vono majzhe ne vikoristovuye poza vnutrishnimi danimi program Rob Pajk en i Ken Tompson rozrobniki operacijnoyi sistemi Plan 9 rozrobili nove shvidke ta dobre rozroblene koduvannya zmishanoyi shirini UTF 8 yake nini najpopulyarnishe koduvannya UCS Vidminnosti vid Unicode RedaguvatiISO 10646 ta Unicode mayut odnakove koduvannya ta nomeri odnakovi simvoli z odnakovimi nomerami isnuyut v oboh standartah hocha Unicode vipuskaye novi versiyi ta dodaye novi simvoli chastishe Unicode maye pravila ta specifikaciyi sho vihodyat za ramki ISO 10646 ISO 10646 ce prosta karta simvoliv rozshirennya poperednih standartiv takih yak ISO 8859 Na vidminu vid cogo Unicode dodaye pravila zistavlennya normalizaciyi form ta dvonapravlenogo algoritmu dlya rukopisiv sprava nalivo takih yak arabskij ta ivrit Dlya vzayemodiyi mizh platformami osoblivo yaksho vikoristovuyutsya dvonapravleni rukopisi nedostatno pidtrimuvati ISO 10646 Neobhidno realizuvati Unicode Dlya pidtrimki cih pravil ta algoritmiv Unicode dodaye bagato vlastivostej en do kozhnogo simvolu v nabori takih yak vlastivosti sho viznachayut standartnij dvonapravlenij klas simvolu ta vlastivosti shob viznachiti yak simvol poyednuyetsya z inshimi simvolami Yaksho simvol predstavlyaye chislove znachennya take yak yevropejske chislo 8 abo zvichajnij drib to ce chislove znachennya takozh dodayetsya yak vlastivist simvolu Unicode maye na meti pidtrimuvati vlastivosti vzayemodiyi obrobki tekstu iz sumishshyu mov Deyaki programi pidtrimuyut simvoli ISO 10646 ale ne povnistyu pidtrimuyut Unicode Odne z takih dodatkiv Xterm en mozhe nalezhnim chinom vidobrazhati vsi simvoli ISO 10646 yaki mayut individualne vidobrazhennya simvoliv u glifi ta yedinu spryamovanist Vin mozhe obroblyati deyaki kombinuyuchi znaki prostimi metodami sho vrazhayut ale ne mozhe vidobrazhati ivrit dvonapravlenij devanagari odin simvol na bagato glifiv abo arabskij obidvi funkciyi Bilshist program grafichnogo interfejsu vikoristovuyut standartni proceduri malyuvannya tekstu OS yaki obroblyayut taki scenariyi hocha sami programi vse she ne zavzhdi obroblyayut yih pravilno Posilannya na Universalnij nabir simvoliv RedaguvatiISO 10646 zagalne neformalne cituvannya dlya simejstva standartiv ISO IEC 10646 ye prijnyatnim u bilshosti prozayichno I hocha ce okremij standart termin Unicode chasto vikoristovuyetsya tak samo neoficijno pid chas obgovorennya UCS Odnak bud yaki normativni posilannya na UCS yak publikaciyu povinni vkazuvati rik vidannya u formi ISO IEC 10646 rik napriklad ISO IEC 10646 2014 Vidnosini z Unicode RedaguvatiZ 1991 roku Konsorcium Yunikod en ta ISO rozrobili The Unicode Standard Unicode ta ISO IEC 10646 v tandemi Repertuar imena simvoliv ta kodovi tochki Unicode Versiyi 2 0 tochno vidpovidayut vimogam ISO IEC 10646 1 1993 z pershimi simoma opublikovanimi popravkami Pislya publikaciyi Unicode 3 0 u lyutomu 2000 r Vidpovidni novi ta onovleni simvoli uvijshli do UCS cherez ISO IEC 10646 1 2000 U 2003 roci chastini 1 ta 2 ISO IEC 10646 buli ob yednani v odnu chastinu yaka z tih pir mala ryad popravok sho dodayut simvoli do standartu priblizno v sinhronnij situaciyi zi standartom Unicode ISO IEC 10646 1 1993 Unicode 1 1 ISO IEC 10646 1 1993 plyus popravki 5 7 Unicode 2 0 ISO IEC 10646 1 1993 plyus popravki 5 7 Unicode 2 1 za vinyatkom simvolu yevro ta simvolu zamini ob yekta en yaki vklyucheni do Popravki 18 ISO IEC 10646 1 2000 Unicode 3 0 ISO IEC 10646 1 2000 ta ISO IEC 10646 2 2001 Unicode 3 1 ISO IEC 10646 1 2000 plyus popravka 1 ta ISO IEC 10646 2 2001 Unicode 3 2 ISO IEC 10646 2003 Unicode 4 0 ISO IEC 10646 2003 plyus popravka 1 Unicode 4 1 ISO IEC 10646 2003 plyus popravki 1 do 2 Unicode 5 0 viklyuchayuchi literi Devanagari GGA JJA DDDA ta BBA yaki vklyucheni do popravki 3 ISO IEC 10646 2003 plyus popravki vid 1 do 4 Unicode 5 1 ISO IEC 10646 2003 plyus popravki vid 1 do 6 Unicode 5 2 ISO IEC 10646 2003 plyus popravki 1 do 8 ISO IEC 10646 2011 Unicode 6 0 za vinyatkom znaku indijskoyi rupiyi ISO IEC 10646 2012 Unicode 6 1 ISO IEC 10646 2012 Unicode 6 2 za vinyatkom znaka tureckoyi liri yakij vklyuchenij do popravki 1 ISO IEC 10646 2012 Unicode 6 3 za vinyatkom znaka tureckoyi liri yakij vhodit do popravki 1 ta p yati dvonapravlenih kontrolnih simvoliv arabska literna poznachka izolyaciya zliva napravo izolyaciya sprava nalivo pershij silnij izolyator Pop Directional Isolate yaki vklyucheni do popravki 2 ISO IEC 10646 2012 plyus popravki 1 ta 2 Unicode 7 0 za vinyatkom znaku rublya ISO IEC 10646 2014 plyus popravka 1 Unicode 8 0 za vinyatkom znaka lari dev yati unifikovanih ideografiv CJK ta 41 simvolu smajlikiv ISO IEC 10646 2014 plyus popravki 1 ta 2 Unicode 9 0 za vinyatkom Adlam Newa yaponskih simvoliv telebachennya ta 74 smajliv ta simvoliv ISO IEC 10646 2017 Unicode 10 0 za vinyatkom 285 simvoliv Hentaigani 3 simvoliv kvadrata Zanabazara ta 56 simvoliv smajlivDiv takozh RedaguvatiPov yazani standarti ISO ISO 646 poziciyi vid 0 do 127 taki sami yak u ISO IEC 10646 ta Unicode a cifri 646 ta 10646 podibni Informacijni tehnologiyi ISO 2022 en Struktura kodu simvoliv ta metodi rozshirennya Kodi upravlinnya ISO 6429 en C0 ta C1 ISO 8859 poziciyi vid 0 do 255 UCS ta Unicode taki sami yak u ISO 8859 1 psevdonim ISO Latin 1 ISO 14651 en Informacijni tehnologiyi Mizhnarodne vporyadkuvannya ta porivnyannya ryadkiv Kodi ISO 15924 en dlya podannya imen scenariyiv kozhen simvol pov yazanij z odnim iz cih scenariyiv Porivnyannya koduvannya Unicode en Spisok posilan na sutnist simvoliv XML ta HTML Spisok shriftiv Unicode Universalnij nabir simvoliv en ISO IEC JTC 1 SC 2 en Dzherela RedaguvatiZagalnodostupni standarti ISO vklyuchaye kopiyu ISO 10646 2014 129 megapikselnij ZIP fajl vipushenij 01 09 2014 ta elektronni vstavki 1 7 megapikselnij ZIP fajl ISO IEC JTC1 SC2 WG2 robocha grupa vidpovidalna za ISO 10646 Poshireni zapitannya shodo UTF 8 ta Unicode Bezkoshtovni shrifti SIL redaktori ta dokumentaciya Prostij ale priyemnij priklad UTF 8 yakij pereviryaye mozhlivosti vashogo vebbrauzera ta shriftiv Problemi z naborom simvoliv dlya ADA 9x z zhovtnya 1989 r Detalno opisuyut original DIS ISO 10646 do zlittya Otrimano z https uk wikipedia org w index php title Universalnij kodovanij nabir simvoliv amp oldid 40217997