www.wikidata.uk-ua.nina.az
Obro bka priro dnoyi mo vi angl Natural language processing NLP zagalnij napryam informatiki shtuchnogo intelektu ta matematichnoyi lingvistiki Vin vivchaye problemi komp yuternogo analizu ta sintezu prirodnoyi movi Stosovno shtuchnogo intelektu analiz oznachaye rozuminnya movi a sintez generaciyu rozumnogo tekstu Rozv yazok cih problem bude oznachati stvorennya zruchnishoyi formi vzayemodiyi komp yutera ta lyudini Za slovami doslidnici Elizabet Liddi Obrobka prirodnoyi movi ce komp yuterizovanij pidhid do analizu tekstu sho bazuyetsya na nizci teorij ta nabori tehnologij Cya galuz ne maye odnogo zagalnoprijnyatogo viznachennya adzhe vona perebuvaye u stani postijnih doslidzhen ta rozrobok Odnak isnuyut pevni aspekti yaki b ob yednuvali usi isnuyuchi viznachennya 1 Oleg Ivanov ukrayinskij doslidnik u galuzi masovih komunikacij viznachaye analiz prirodnoyi movi yak mizhdisciplinarnu galuz nauki sho ohoplyuye metodiki obchislyuvalnoyi lingvistiki ta teoriyi shtuchnogo intelektu osnovnim problemnim polem yakoyi ye zabezpechennya vzayemodiyi lyudskih komunikativnih aktiv verbalnih ta neverbalnih ta komp yuternih sistem 2 Zmist 1 Istoriya rozvitku 1 1 Persha faza kinec 1940 h kinec 1960 h 1 2 Druga faza kinec 1960 h kinec 1970 h 1 3 Tretya faza kinec 1970 h kinec 1980 h 1 4 Chetverta faza 1990 ti 1 5 Rozvitok obrobki prirodnoyi movi v XXI stolitti 2 Zadachi ta obmezhennya 3 Golovni zavdannya 4 Pidhodi do vikonannya zavdan 4 1 Statistichnij pidhid 4 2 Lingvistichnij pidhid 4 3 Simvolichnij pidhid 4 4 Konnektivistskij pidhid 4 5 Metod dopomizhnih vektoriv 4 6 Prihovana markovska model 4 7 Umovni vipadkovi polya 4 8 N gramni modeli 5 Rivni obrobki prirodnoyi movi 6 Div takozh 7 PrimitkiIstoriya rozvitku RedaguvatiBritanska vchena Karen Spark Dzhons vidilyaye chotiri etapi rozvitku obrobki prirodnoyi movi 3 Persha faza kinec 1940 h kinec 1960 h Redaguvati Persha faza rozvitku obrobki prirodnoyi movi pripadala na period kincya 1940 h do kincya 1960 h rokiv Robota u danij chas bula sfokusovana na mashinnomu perekladi U 1952 roci vidbulas persha mizhnarodna konferenciya fokusom yakoyi stav mashinnij pereklad Pershim prikladom mashinnogo perekladu yakij buv predstavlenij na Dzhordzhtaunskomu eksperimenti demonstraciya mashinnogo perekladu 1954 r buv anglo rosijskij elementarnij avtomatichnij pereklad 1954 j rik stav znakovim ne lishe zavdyaki pershij demonstraciyi mashinnogo perekladu a j zavdyaki publikaciyi pershogo vipusku zhurnalu Mehanichnij pereklad Kulminaciyeyu pershogo etapu stala Teddingtonska mizhnarodna konferenciya z mashinnogo movnogo perekladu ta prikladnogo movnogo analizu provedena u 1961 roci na yakij bulo predstavleno dosyagnennya riznih krayin svitu u galuzyah morfologiyi sintaksisu semantiki ta interpretaciyi Danij period vidznachivsya aktivnistyu ta entuziazmom Nezvazhayuchi na nizkij tehnologichnij rozvitok sho znachno uskladnyuvav obrobku danih doslidniki ne boyalis zishtovhnutis zi skladnimi zavdannyami yaki postavali pered nimi u cej period Druga faza kinec 1960 h kinec 1970 h Redaguvati Druga faza rozvitku obrobki prirodnoyi movi pripala na kinec 1960 h do kincya 1970 h rokiv ta pov yazana zi shtuchnim intelektom Doslidniki cogo periodu najbilshu uvagu pridilyayut znannyu pro svit ta formuvannyu pevnih znachen u movlenni Pershoyu rannoyu programoyu rozuminnya prirodnoyi movi bula SHRDLU rozroblena u 1972 roci Dana programa rozumila veliku kilkist anglomovnih sliv ta mogla robiti pevni visnovki Ce bulo velikim dosyagnennyam u doslidzhennyah shtuchnogo intelektu prote programi takogo tipu stikalis iz situaciyami realnogo svitu z yakimi yim vporatis ne vdavalos Tretya faza kinec 1970 h kinec 1980 h Redaguvati Tretya faza rozvitku obrobki prirodnoyi movi trivala z kincya 1970 h ta do kincya 1980 h rokiv V nij tisno pereplelis taki galuzi yak shtuchnij intelekt ta semantika Zastosuvannya shtuchnogo intelektu v obrobci prirodnoyi movi vimagalo rozrobki obchislyuvalnoyi gramatiki V praktichnomu sensi lingvisti rozrobili cilu nizku gramatichnih tipiv napriklad funkcionalnij ta kategorialnij yaki buli oriyentovani na obchislyuvanist Danij period takozh harakterizuyetsya strimkim rozvitkom logichnogo programuvannya z metoyu navchannya program obrobki pevnih tekstiv Chetverta faza 1990 ti Redaguvati Chetverta faza pochalas u 1990 h rokah na pochatku yakoyi zdobuv populyarnist leksichnij pidhid do gramatiki Odne z providnih misc v obrobci prirodnoyi movi zajmav statistichnij pidhid yakij dozvolyav teper ne prosto analizuvati dani ale j spravdi zastosovuvati cej metod dlya obrobki prirodnoyi movi Ostannye desyatilittya 20 go stolittya harakterizuvalos zastosuvannyam metodiki sproshennya tekstiv dlya viokremlennya vazhlivih odinic z pevnogo potoku informaciyi Rozvitok obrobki prirodnoyi movi v XXI stolitti Redaguvati Na pochatku 2023 roku vcheni Stenfordskogo universitetu Kaliforniya SShA vstanovili novij rekord roboti movnogo interfejsu mozok komp yuter Brain Computer Interface VSI dosyagnuvshi rekordno visokogo pokaznika dekoduvannya movi Novij rekord polyagaye v tomu sho shvidkist dekoduvannya movi shtuchnogo intelektu dosyagla 62 slova na hvilinu sho v 3 4 razi shvidshe za poperednij rekord dlya bud yakogo vidu BCI 4 Zadachi ta obmezhennya RedaguvatiRozuminnya prirodnoyi movi inodi vvazhayut AI povnoyu zadacheyu tomu sho rozpiznavannya zhivoyi movi potrebuye velicheznih znan sistemi pro navkolishnye seredovishe ta mozhlivosti vzayemodiyati z nim Same oznachennya zmistu slova rozumiti odna z golovnih zadach shtuchnogo intelektu V nash chas znachnu rol u virishenni zadach z obrobki prirodnomovnih danih vidigrayut ontologiyi napriklad WordNet UWN U procesi doslidzhennya obrobki prirodnoyi movi bulo dosyagnuto znachnih rezultativ sered yakih rozrobka potuzhnih leksikografichnih sistem program dlya mashinnogo perekladu elektronnih slovnikiv ta in Odnak isnuye problema yaka dosi ne znajshla svogo virishennya vona korinitsya u samij prirodi lyudskoyi movi Problema rozuminnya lyudskogo movlennya polyagaye same u jogo neodnoznachnosti Mozhna vidiliti nastupni vidi neodnoznachnostej 5 Sintaksichna neodnoznachnist u prisliv yi Chas ne kin ne pidzhenesh i ne zupinish dlya obrobki prirodnoyi movi bude absolyutno neyasnim te pro sho same jdetsya u rechenni pro konya chi pro chas Smislova neodnoznachnist u pitanni De znajti klyuch do togo zamku slovo zamok mozhe mati dva absolyutno rizni znachennya zvazhayuchi na postavlenij nagolos Vidminkova neodnoznachnist u frazah Usi buli shvilovani pered koncertom ta Ne treba davati pered slovo pered oznachaye chas abo misce sho absolyutno zminyuye sens frazi Referencijna neodnoznachnist u frazi Vidkrij polichku ta distan mokru parasolku ya hochu yiyi visushiti zajmennik yiyi za smislovim znachennyam matime vidnoshennya do mokroyi parasolki prote dlya mashini u yakoyi povnistyu vidsutnye rozuminnya realnosti danij zajmennik vidnositimetsya yak do polichki tak i do parasolki Odnim iz viklikiv yakij vinikaye u procesi obrobki prirodnoyi movi mozhna vvazhati problemu sinonimiyi v rezultati yakoyi odne ponyattya mozhe buti virazhenim dekilkoma riznimi slovami Yak naslidok relevantni dokumenti v yakih vikoristano sinonimi ponyat sho bulo vkazano koristuvachem u zapiti mozhe buti ne viznacheno sistemoyu Vpliv visheperelichenih yavish ye osoblivo vidchutnim pri stvorenni sistem mashinnogo perekladu Problema polyagaye u skladnosti vstanovlennya konkretnogo vidobrazhennya dijsnoyi semantiko sintaksichnoyi strukturi rechennya u jogo vnutrishnye logichne uyavlennya yake avtomatichno generuyetsya sistemoyu 6 Rozv yazannya takih tipiv neodnoznachnostej mozhlive za dopomogoyu vvedennya dodatkovih znachen yaki zbilshat znannya programi pro tu chi inshu galuz Sogodni program yaki rozumiyut usi tipi neodnoznachnostej u velikomu spektri galuzej ne isnuye prote ye programi sho mozhut korektno reaguvati na neodnoznachnosti u duzhe vuzkih sferah Golovni zavdannya RedaguvatiVidobuvannya danih vivchennya danih poshuk zv yazkiv ta zakonomirnostej mizh nimi Sintez movlennya ozvuchennya prochitannya tekstu dokument povidomlennya i t d golosom yakij ye nablizhenim do prirodnogo Rozpiznavannya movi vivedennya rozpiznavannya tekstu z kartinok vidskanovanih dokumentiv abo fajliv u PDF formati Syudi zh vhodit rozpiznavannya movlennya produkovane lyudskim golosom Generuvannya prirodnoyi movi konvertuvannya komp yuternih danih u prirodnu movu lyudini Mashinnij pereklad avtomatichnij pereklad z odniyeyi lyudskoyi movi na inshu Dane zavdannya ye nadzvichajno skladnim adzhe mashina ne volodiye timi znannyami yakimi volodiye lyudina sho robit yih rozuminnya tih chi inshih fraz absolyutno riznim Pitalno vidpovidalni sistemi vidpovidi na pitannya postavleni lyudskoyu movoyu Zazvichaj pitannya ye konkretizovanimi napriklad De znahoditsya Ejfeleva Vezha prote isnuyut pitannya na yaki nemaye konkretnoyi vidpovidi napriklad Chomu vsi lyudi rizni sho robit dane zavdannya nadzvichajno skladnim dlya vikonannya Rozpiznavannya viznachennya temi podil tekstu na chastini z podalshim viznachennyam providnoyi temi dlya kozhnoyi z nih Informacijnij poshuk poshuk rozpiznavannya ta vidobuvannya informaciyi Dobuvannya danih otrimannya semantichnoyi informaciyi z tekstu Otrimannya zv yazkiv viznachennya vidnosin mizh ob yektami u pevnomu shmatku tekstu napriklad hto z kim pracyuye Sproshennya tekstu 7 zmina rozshirennya abo insha obrobka informaciyi dlya sproshennya strukturi abo gramatiki tekstu zi zberezhennyam osnovnoyi dumki Rozv yazannya leksichnoyi bagatomanitnosti nadannya spisku mozhlivih znachen konkretnogo bagatoznachnogo slova sered yakih mozhna vibrati najbilsh pidhodyashe vidpovidno do kontekstu Rozpiznavannya abreviatur ta zagolovkiv Detektuvannya okremih lingvistichnih odinic Morfologichna dekompoziciya peretvorennya okremih terminiv napriklad medichnih abo tehnichnih u zrozumilu formu Pidhodi do vikonannya zavdan RedaguvatiStatistichnij pidhid Redaguvati V osnovi statistichnogo pidhodu do obrobki prirodnoyi movi lezhit pripushennya sho zmist tekstu mozhe buti viznacheno za najuzhivanishimi slovami Osnovnim zavdannyam danogo pidhodu ye viznachennya kilkosti povtoren konkretnogo slova ta slovospoluchen v teksti 8 Latentno semantichnij pidhid ye riznovidom statistichnogo metodu ta bazuyetsya na ideyi sho sukupnist usih kontekstiv u yakih zustrichayetsya abo ne zustrichayetsya dane slovo viznachaye mnozhinu vzayemnih obmezhen dlya viyavlennya shozhostej u znachennyah sliv Osnovna problema z yakoyu stikayutsya statistichni pidhodi polyagaye v rozglyadi tekstu yak naboru sliv bez smislovogo zv yazku Lingvistichnij pidhid Redaguvati Lingvistichnij pidhid do obrobki prirodnoyi movi skladayetsya z chotiroh rivniv grafematichnogo morfologichnogo sintaksichnogo ta semantichnogo 9 Pershij riven polyagaye u vidilenni okremih elementiv tekstu dokumentu napriklad rozdiliv abzaciv rechen i t d Drugij riven polyagaye u viznachenni morfologichnih harakteristik okremogo slova Tretij riven vidpovidaye za viznachennya sintaksichnoyi zalezhnosti sliv u rechennyah Ostannij riven pov yazanij zi smislovim rozuminnyam tekstu sho vklyuchaye rozrobki u sferi shtuchnogo intelektu Doslidnicki dosyagnennya u cij sferi ye duzhe obmezhenimi u zv yazku zi skladnistyu lyudskoyi movi Simvolichnij pidhid Redaguvati Simvolichnij pidhid do obrobki prirodnoyi movi zdijsnyuye glibinnij analiz lingvistichnih yavish ta bazuyetsya na yavnomu predstavlenni znan sho zdijsnyuyetsya shlyahom vikoristannya dobre doslidzhenih shem predstavlennya znan ta algoritmiv sho pracyuyut z nimi 10 Dzherelom znannya pro movu mozhut vistupati slovniki formuli ta pravila rozrobleni lyudmi Konnektivistskij pidhid Redaguvati Danij metod obrobki prirodnoyi movi vidpovidaye za obrobku zagalnih modelej z vikoristannyam konkretnih prikladiv movnih yavish Najbilsh znachusha vidminnist konnektivistskogo pidhodu vid inshih statistichnih metodiv polyagaye u poyednanni statistichnih znan ta riznih teorij uyavlen sho dozvolyayut pracyuvati z logichnimi visnovkami ta transformaciyeyu logichnih formul Metod dopomizhnih vektoriv Redaguvati Diferencijnij metod mashinnogo navchannya sho dopomagaye provesti klasifikaciyu sliv za kategoriyami Danij metod pobudovanij na pevnij mnozhini vlastivostej Prihovana markovska model Redaguvati Ce taka grafichna sistema u yakij kozhna vershina poznachaye vipadkovu zminnu sho mozhe nabuvati bud yakogo znachennya z pevnimi jmovirnostyami mizh dekilkoma stanami porodzhuyuchi pri comu odin z dekilkoh mozhlivih vihidnih simvoliv z kozhnim perehodom Mnozhina vsih mozhlivih staniv ta unikalnih simvoliv mozhe buti velikoyu Mi mozhemo bachiti vihidni dani prote pochatkovi stani sistemi ye prihovanimi Umovni vipadkovi polya Redaguvati Rozdilna diferencijna model yaka formuye logistichnu regresiyu dlya poslidovnosti danih Vikoristovuyetsya dlya peredbachennya stanu zminnoyi sho bazuyetsya na sposterezhenij zminnij N gramni modeli Redaguvati Model pobudovana na poslidovnosti z n elementiv rechen sliv bukv zvukiv i t d Model dozvolyaye rozrahuvati jmovirnist poyavi bud yakogo elementa za vidomih jmovirnostej poyavi takih poperednih elementiv Taka model zvoditsya do skinchennoyi mnozhini jmovirnostej kozhnu z yakih mozhe buti ocineno pislya obchislennya povtoryuvanosti vidpovidnih n gram 11 Rivni obrobki prirodnoyi movi RedaguvatiZrozumiti sho zh taki vidbuvayetsya v sistemi obrobki prirodnoyi movi mozhna zavdyaki rivnyam movnoyi strukturi Znachennya movlennya lyudini peredayetsya kozhnim rivnem movi Dlya togo shob obrobka prirodnoyi movi bula maksimalno efektivnoyu potribno shob yiyi sistema vklyuchala usi movni rivni Obrobka prirodnoyi movi vikonuyetsya u shist rivniv 12 Fonologichnij analiz polyagaye u doslidzhenni organizaciyi ta interpretaciyi zvukiv movlennya u movi Bazovimi pravilami fonologichnogo analizu vvazhayutsya fonetichni fonemni ta prosodichni Morfologichnij analiz mozhna viznachiti yak aspekt doslidzhennya sho polyagaye u identifikaciyi analizi ta opisi strukturi abo form sliv u movi Leksichnij analiz polyagaye u podili tekstu na rozdili abzaci rechennya ta abo slova Sintaksichnij analiz polyagaye v analizi sliv u rechenni zadlya rozuminnya jogo gramatichnoyi strukturi Slova peretvoryuyutsya v strukturi sho pokazuyut yakij zv yazok isnuye mizh slovami Okremi spoluchennya sliv mozhe buti vikonano u zv yazku z porushennyam gramatichnih pravil abo pravil kombinuvannya sliv u movi Semantichnij analiz maye spravu zi znachennyami sliv fraz ta rechen u movi Vin spriyaye viznachennyu mozhlivih smisliv rechennya u konteksti Pragmatichnij analiz ye aspektom doslidzhennya sho dozvolyaye zrozumiti yak kombinuyutsya rechennya z riznimi kontekstami dlya formuvannya abzaciv tekstiv abo dialogiv Pragmatichnij analiz polyagaye v interpretaciyi okremih rechen u vidpovidnih dlya nih kontekstah Div takozh RedaguvatiGliboke navchannya Informacijnij poshuk Korektura Latentno semantichnij analiz Matematichna lingvistika Pitalno vidpovidna sistema Transformer model mashinnogo navchannya Primitki Redaguvati Liddy E D 2001 Natural Language Processing In Encyclopedia of Library and Information Science 2nd Ed NY Marcel Decker Inc P 1 Ivanov O V Klasichnij kontent analiz ta analiz tekstu terminologichni ta metodologichni vidminnosti Ivanov Oleg Valerijovich Visnik Harkivskogo nacionalnogo universitetu imeni V N Karazina Harkiv Vidavnichij centr HNU imeni V N Karazina 2013 1045 S 72 Karen S Jones Natural language processing a historical review Cambridge Computer Laboratory University of Cambridge 2001 P 2 Shtuchnij intelekt postaviv svitovij rekord u zchituvanni lyudskih dumok 23 01 2023 11 40 am Istoriya kompyutera chernykh net Arhiv originalu za 8 grudnya 2015 Procitovano 30 listopada 2015 Anisimov A V Marchenko A A Sistema obrabotki tekstov na estestvennom yazyke Shtuchnij intelekt 2002 4 S 157 Demokratizaciya pismovoyi komunikaciyi dlya rozvitku vlasnih mozhlivostej NLG 21 06 2022 Slyusar V I 2020 Primenenie torcevogo proizvedeniya matric v zadachah obrabotki estestvennogo yazyka Nejromerezhni tehnologiyi ta yih zastosuvannya NMTiZ 2020 zbirnik naukovih prac XIX Mizhnarodnoyi naukovoyi konferenciyi Nejromerezhni tehnologiyi ta yih zastosuvannya NMTiZ 2020 Kramatorsk Donbaska derzhavna mashinobudivna akademiya 2020 s 156 162 Arhiv originalu za 25 sichnya 2021 Procitovano 12 grudnya 2020 Dikovickij V V Shishaev M G Obrabotka tekstov estestvennogo yazyka v modelyah poiskovyh sistem Sbornik nauchnyh trudov 2010 S 30 Liddy E D 2001 Natural Language Processing In Encyclopedia of Library and Information Science 2nd Ed NY Marcel Decker Inc P 10 Babenko T V Sushko S O Pro entropiyu ukrayinskoyi movi Naukovo praktichnij zhurnal Zahist informaciyi 2012 3 S 105 Olaronke G Iroju Janet O Olaleke A Systematic Review in Natural Language Processing in Healthcare I J Information Technology and Computer Science 2015 8 P 45 Otrimano z https uk wikipedia org w index php title Obrobka prirodnoyi movi amp oldid 40389932