www.wikidata.uk-ua.nina.az
Yuniko d angl Unicode UNIfikovane KODuvannya promislovij standart rozroblenij shob zabezpechiti cifrove predstavlennya simvoliv usih pisemnostej svitu ta specialnih simvoliv Udoskonalenij sumisno zi standartom Universalnij Nabir Simvoliv Universal Character Set UCS i opublikovanij u formi knigi Standart Yunikod Yunikod skladayetsya z asortimentu simvoliv metodologiyi koduvannya ta komplektu naboru standartiv koduvannya simvoliv komplektu kodovih tablic dlya posilan na zobrazhennya simvoliv spisku vlastivostej simvoliv takih napriklad yak verhnij i nizhnij registr rozkladka komplekt dovidkovih danih komp yuternih fajliv pravil normalizaciyi dekompoziciyi zistavlennya i zobrazhennya renderingu Logotip Unicode Zmist 1 Oglyad 2 Rozdili standartu Yunikod 3 Marker poryadku bajtiv 4 Kodovij prostir 5 Koduvannya ta tipi tekstovih danih movi S S 6 Visnovki 7 Div takozh 8 PosilannyaOglyad RedaguvatiStandart zaproponuvala v 1991 roci organizaciya Konsorcium Yunikodu angl Unicode Consortium yaka ob yednuye najbilshi IT kompaniyi korporaciyi Konsorcium Yunikodu nepributkova nekomercijna organizaciya yaka koordinuye rozvitok Yunikodu maye ambitnu metu zaminiti v kincevomu pidsumku isnuyuchi sistemi koduvannya simvoliv Yunikodom i jogo sistemoyu standartiv Format Peretvoren Yunikodu UTF Unicode Transformation Format tomu sho bagato isnuyuchih sistem koduvannya ye obmezhenimi v rozmiri j mozhlivostyah i nesumisnimi z bagatomovnimi seredovishami Uspihi Yunikodu v unifikaciyi naboriv simvoliv prizveli do jogo rozpovsyudzhennya i dominuyuchogo vikoristannya v internacionalizaciyi i lokalizaciyi programnogo zabezpechennya komp yuteriv Standart buv vikoristanij u bagatoh novitnih tehnologiyah napriklad u XML movi programuvannya JavaScript i suchasnih operacijnih sistemah Yunikod znimaye stare obmezhennya na koduvannya simvoliv lishe odnim bajtom Natomist vikoristovuyetsya 17 prostoriv kozhen z yakih viznachaye 65 536 kodiv i daye mozhlivist opisati maksimum 1 114 112 17 216 riznih simvoliv Basic Multilingual Plane BMP Osnovna Bagatomovna Ploshina mistit majzhe vsi simvoli yaki vi budete koli nebud vikoristovuvati Yunikod maye dekilka realizacij ale najposhirenishimi ye dvi UTF Unicode Transformation Format Format Peretvorennya Yunikodu ta UCS Universal Character Set Universalna Tablicya Simvoliv Chislo pislya UTF viznachaye kilkist bitiv sho vidileni pid odin yunit a chislo pislya UCS viznachaye kilkist bajtiv Universalnij nabir simvoliv zadaye odnoznachnu vidpovidnist simvoliv kodam elementam kodovogo prostoru tobto nevid yemnim cilim chislam UTF 8 stav najposhirenishim dlya internacionalnih koduvan UTF 8 ye sistemoyu koduvannya zi zminnoyu dovzhinoyu koduvannya simvoliv Ce oznachaye sho dlya koduvannya simvoliv vin vikoristovuye vid 1 do 4 bajt na simvol Tak pershij bajt UTF 8 mozhna vikoristovuvati dlya koduvannya ASCII sho daye povnu sumisnist z kodami ASCII Perekoduvannya kodiv ASCII u kodah UTF 8 dlya latinskih simvoliv ne zbilshit rozmir danih bo dlya cogo vikoristovuyetsya tilki odin bajt na simvol Dlya simvoliv inshih mov de napriklad dlya koduvannya treba vikoristovuvati dva bajti na simvol ce koduvannya zbilshuye rozmir danih na priblizno 50 abo bilshe UTF 8 dozvolyaye pracyuvati v standartizovanomu mizhnarodno prijnyatomu bagatomovnomu seredovishi z porivnyano neznachnim zbilshennyam obsyagu danih UTF 8 yavlyaye soboyu idealnij sposib peredachi simvoliv cherez Internet elektronnu poshtu chat tosho Kodi v standarti Unicode podileni na dekilka oblastej Oblast z kodami vid U 0000 do U 007F pro zapis vidu U xxxx divis nizhche v rozdili Kodovij prostir mistit simvoli naboru ASCII Dali rozmisheni oblasti znakiv riznih pisemnostej znaki punktuaciyi i tehnichni simvoli Chastina kodiv zarezervovana dlya vikoristannya v majbutnomu Dlya simvoliv kirilici vidileni kodi vid U 0400 do U 052F div Kirilicya v Yunikodi Rozdili standartu Yunikod RedaguvatiStandart Unicode skladayetsya z dvoh osnovnih rozdiliv universalnij nabir simvoliv i simejstvo koduvan Universalnij nabir simvoliv zadaye odnoznachnu vidpovidnist simvoliv kodam elementam kodovogo prostoru sho ye nevid yemnimi cilimi chislami Simejstvo koduvan viznachaye mashinne podannya poslidovnosti kodiv universalnogo naboru simvoliv Standarti naboriv simvolivUCS 4 angl Universal Character Set 1 simvol 4 bajti vsogo mozhna zakoduvati 232 4 294 967 296 simvoliv Prote maksimalna kilkist Yunikod simvoliv na sogodni 220 216 1 114 112 UCS 2 angl Universal Character Set 1 simvol 2 bajti vsogo mozhna zakoduvati 216 65 536 simvoliv Standarti koduvanUTF 32 angl Unicode Transformation Format format peretvorennya Yunikoda odin iz sposobiv koduvannya simvoliv iz Unicode u viglyadi 32 bitovih poslidovnostej 1 simvol 32 biti UTF 16 odin iz sposobiv koduvannya simvoliv iz Unicode u viglyadi 16 bitnih poslidovnostej Simvoli z kodami menshe 0x10000 216 predstavlyayutsya yak ye odna 16 bitova poslidovnist a simvoli z kodami 0x10000 0x10FFFE u viglyadi dvoh 16 bitovih poslidovnostej tak zvana surogatna para persha z yakih lezhit v diapazoni 0xD800 0xDBFF a druga 0xDC00 0xDFFF Legko bachiti sho isnuye 210 210 220 takih kombinacij A zagalna kilkist mozhlivih simvoliv 220 216 1 114 112 Slid zaznachiti sho za standartom niyaki simvoli ne mozhut mati kodiv vlasne z diapazonu 0xD800 0xDFFF tak sho rozshifrovka koduvannya zavzhdi odnoznachna Vtim v perevazhnij bilshosti vipadkiv tekst v UTF 16 ye prosto poslidovnistyu simvoliv z UCS 2 oskilki simvoli Unicode pislya kodu 0x10000 vikoristovuyutsya vkraj ridko UTF 16LE ta UTF 16BE u potoci danih UTF 16 starshij bajt mozhe zapisuvatisya abo pered molodshim UTF 16 Big Endian abo UTF 16BE abo pislya molodshogo UTF 16 Little Endian abo UTF 16LE Inodi koduvannya Yunikoda Big Endian UTF 16BE nazivayut Yunikodom iz zvorotnim poryadkom bajtiv Analogichno isnuye dva varianti 32 bitovogo koduvannya UTF 32LE ta UTF 32BE UTF 8 poshirene sogodni koduvannya sho realizovuye predstavlennya Yunikoda sumisne z 8 bitovim koduvannyam tekstu Tekst sho skladayetsya tilki z simvoliv z nomerom menshe 128 pri zapisi v UTF 8 peretvoryuyetsya na zvichajnij tekst ASCII I navpaki v teksti UTF 8 bud yakij bajt iz znachennyam menshe 128 zobrazhaye simvol ASCII z tim zhe kodom Reshta simvoliv Yunikoda zobrazhayetsya poslidovnostyami zavdovzhki vid 2 do 6 bajtiv realno tilki do 4 bajt oskilki vikoristannya kodiv bilshe 2 ne planuyetsya v yakih pershij bajt zavzhdi maye vid 11xxxxxx a inshi 10xxxxxx Prostishe kazhuchi u formati UTF 8 simvoli latinskogo alfavitu rozdilovi znaki i keruyuchi simvoli ASCII zapisuyutsya ASCII kodami a reshta vsih simvoliv koduyetsya za dopomogoyu oktetiv poslidovnosti zavdovzhki 8 bitiv zi starshim bitom 1 U rezultati navit yaksho programa ne rozpiznaye Yunikod to latinski bukvi arabski cifri i rozdilovi znaki zobrazhatimutsya pravilno Simvoli UTF 8 otrimuyut z Unicode takim chinom Unicode UTF 8 0x00000000 0x0000007F 0xxxxxxx0x00000080 0x000007FF 110xxxxx 10xxxxxx0x00000800 0x0000FFFF 1110xxxx 10xxxxxx 10xxxxxx0x00010000 0x001FFFFF 11110xxx 10xxxxxx 10xxxxxx 10xxxxxxTakozh teoretichno mozhlivi ale ne vklyucheni v standarti Unicode UTF 8 0x00200000 0x03FFFFFF 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx0x04000000 0x7FFFFFFF 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxxMarker poryadku bajtiv RedaguvatiDokladnishe Marker poryadku bajtivDlya viznachennya formatu predstavlennya Yunikoda v tekstovomu fajli vikoristovuyetsya prijom za yakim na pochatku tekstu zapisuyetsya simvol U FEFF nerozrivnij propusk z nulovoyu shirinoyu takozh imenovanij mitkoyu poryadku bajtiv angl Byte Order Mark BOM Cej sposib dozvolyaye rozriznyati UTF 16LE i UTF 16BE oskilki simvolu U FFFE ne isnuye Takozh vin inodi zastosovuyetsya dlya poznachennya formatu UTF 8 hocha do cogo formatu i nepridatne ponyattya poryadku bajtiv Fajli yaki dotrimuyutsya cogo pravila pochinayutsya z takih bajtiv UTF 8 EF BB BF UTF 16BE FE FF UTF 16LE FF FE UTF 32BE 00 00 FE FF UTF 32LE FF FE 00 00Kodovij prostir RedaguvatiHocha formi zapisu UTF 8 i UTF 32 8 i 32 desyatkovi chisla yaki vkazuyut kilkist dvijkovih rozryadiv dozvolyayut koduvati do 231 2 147 483 648 kodovih pozicij bulo prijnyato rishennya vikoristovuvati lishe 220 216 1 114 112 dlya sumisnosti z UTF 16 Vtim navit i cogo bilsh nizh dostatno sogodni u versiyi Unicode 5 0 vikoristovuyetsya trohi bilshe 99 000 kodovih pozicij Koduvannya ta tipi tekstovih danih movi S S RedaguvatiU movi S S istorichno sklalasya taka situaciya Dlya roboti zi zvichajnimi tekstovimi danimi isnuye tip char Dlya roboti z tak zvanim shirokim tekstom isnuye tip wchar t Osoblivosti vikoristannya cih tipiv danih zalezhat vid sistemi A vlasne osoblivostyami ye koduvannya tekstu v tipah danih ta rozmir odnogo simvolu Dlya porivnyannya vizmemo dvi sistemi Linux1 char zvichajnij tekst Koduvannya UTF 8 Rozmir 1 simvolu 1 2 3 abo 4 bajti sizeof char 12 wchar t shirokij tekst Koduvannya UTF 32 Rozmir 1 simvolu 4 bajti sizeof wchar t 4Windows1 char zvichajnij tekst Koduvannya kodovi storinki Rozmir 1 simvolu 1 bajt sizeof char 12 wchar t shirokij tekst Koduvannya UTF 16 Rozmir 1 simvolu 2 abo 4 bajti sizeof wchar t 2Visnovki RedaguvatiHarakterna osoblivist naboru simvoliv UCS simvoli zavzhdi fiksovanoyi dovzhini UCS 2 1 simvol 2 bajti lishe odna ploshina z 17 ti UCS 4 1 simvol 4 bajti 65 tis ploshin ne vikoristani Harakterna osoblivist koduvannya UTF simvoli NE zavzhdi fiksovanoyi dovzhini UTF 32 yedine koduvannya z fiksovanoyu dovzhinoyu simvoliv 1 simvol 32 biti 4 bajti tomu mozhna skazati sho kod simvolu v UCS 4 dorivnyuye kodu simvolu v UTF 32 UTF 16 kodi simvoliv lt 216 odnoznachno vidpovidayut kodam simvoliv z naboru UCS 2 Kodi reshti simvoliv simvoli z kodom gt 216 ye odnoznachnimi tilki dlya UTF 16 UTF 8 kodi simvoliv lt 128 odnoznachno vidpovidayut kodam simvoliv verhnoyi chastini ASCII tablici Kodi reshti simvoliv simvoli z kodom gt 128 ye odnoznachnimi tilki dlya UTF 8 Tverdzhennya 1 bajt 1 simvol ye zastarilim i v perevazhnij bilshosti praktichnih vipadkiv ye hibnim Dovzhina simvolu NE ye fiksovanoyu vinyatok skladaye koduvannya UTF 32 ta ASCII tablicya Yunikod u programah dobra platforma dlya pidtrimki bagatomovnosti Div takozh RedaguvatiSimvol zaminiPosilannya RedaguvatiOficijna storinka Unicode Consortium Arhivovano 12 bereznya 2014 u Wayback Machine Versiyi Yunikodu 3 1 Arhivovano 5 lyutogo 2005 u Wayback Machine 3 2 Arhivovano 5 lyutogo 2005 u Wayback Machine 4 0 Arhivovano 6 lyutogo 2007 u Wayback Machine 4 0 1 Arhivovano 8 lyutogo 2007 u Wayback Machine 4 1 Arhivovano 25 travnya 2021 u Wayback Machine 5 0 0 Arhivovano 10 chervnya 2008 u Wayback Machine Otrimano z https uk wikipedia org w index php title Yunikod amp oldid 37700748