www.wikidata.uk-ua.nina.az
Cya stattya mistit perelik posilan ale pohodzhennya tverdzhen u nij zalishayetsya nezrozumilim cherez praktichno povnu vidsutnist vnutrishnotekstovih dzherel vinosok Bud laska dopomozhit polipshiti cyu stattyu peretvorivshi dzherela z pereliku posilan na dzherela vinoski u samomu teksti statti SSE angl Streaming SIMD Extensions potokove SIMD rozshirennya rozshirennya arhitekturi mikroprocesoriv x86 sho realizuye paralelne vikonannya odnakovih komand angl Single Instruction Multiple Data odna instrukciya bagato danih Zmist 1 Istoriya 2 Arhitektura 3 Priklad 4 Podalshij rozvitok 5 Div takozh 6 PosilannyaIstoriya RedaguvatiTehnologiya bula rozroblena Intel yak vidpovid na analogichnij nabir instrukcij 3DNow vid AMD yakij buv predstavlenij rokom ranishe Vpershe realizovana v procesori seriyi Pentium III Pochatkova nazva cih instrukcij bula KIN sho rozshifrovuvalosya yak Katmai New Instructions Katmai nazva pershoyi versiyi yadra procesora Pentium III Tehnologiya SSE dozvolyala virishiti 2 osnovni problemi MMX pid chas operacij MMX nemozhlivo bulo odnochasno vikonuvati instrukciyi spivprocesora oskilki deyaki registri buli ob yednanimi MMX obmezhuvalasya lishe cilochiselnimi operaciyami Arhitektura RedaguvatiSSE vklyuchila v arhitekturu procesora visim 128 bitovih registriv xmm0 do xmm7 kozhen z yakih traktuyetsya yak poslidovnist 4 znachen iz ruhomoyu komoyu odinichnoyi tochnosti ta nabir instrukcij yaki vikonuyut operaciyi zi skalyarnimi j pakovanimi tipami danih Perevaga u shvidkosti obchislen dosyagayetsya v tomu vipadku koli neobhidno vikonati odnu i tu zh poslidovnist dij nad riznimi danimi Realizaciya blokiv SIMD vikonuyetsya rozparalelyuvannyam obchislyuvalnogo procesu mizh danimi Tobto koli cherez odin blok danih prohodit po cherzi bagato potokiv danih Priklad RedaguvatiNastupnij priklad demonstruye peremnozhennya chotiroh par chisel z ruhomoyu komoyu odniyeyu komandoyu mulps Programa napisana movoyu ANSI C z vikoristannyam asemblernoyi vstavki asm i instrukcij asemblera dlya roboti z SSE float a 4 300 0 4 0 4 0 12 0 float b 4 1 5 2 5 3 5 4 5 asm movups xmm0 a pomistiti 4 zminni z ruhomoyu komoyu iz a v registr xmm0 movups xmm1 b pomistiti 4 zminni z ruhomoyu komoyu iz b v registr xmm1 mulps xmm1 xmm0 peremnozhiti paketi ruhomih kom xmm1 xmm1 xmm0 xmm10 xmm10 xmm00 xmm11 xmm11 xmm01 xmm12 xmm12 xmm02 xmm13 xmm13 xmm03 movups a xmm1 vivantazhiti rezultati iz registra xmm1 po adresam a Podalshij rozvitok RedaguvatiCej rozdil potrebuye dopovnennya Dokladnishe SSE2 SSE3 SSSE3 SSE4 ta Advanced Vector ExtensionsDiv takozh RedaguvatiSISD MIMDPosilannya RedaguvatiIntel 64 and IA 32 Architectures Optimization Reference Manual Arhivovano 10 sichnya 2017 u Wayback Machine Otrimano z https uk wikipedia org w index php title SSE amp oldid 39271007