www.wikidata.uk-ua.nina.az
Nestrukturovani dani dani yaki ne vidpovidayut zazdalegid viznachenij modeli danih i yak pravilo predstavleni u viglyadi tekstu z datami ciframi faktami yaki roztashovani v nomu v dovilnij formi 1 2 Taki dani vazhko analizuvati osoblivo z dopomogoyu tradicijnih program priznachenih do roboti zi strukturovanimi danimi anotovanimi abo timi sho zberigayutsya u bazah Za ocinkami Merrill Lynch 1998 roku blizko 80 90 vid usiyeyi potencijno korisnoyi dilovoyi informaciyi bulo predstavleno v nestrukturovanij formi prote ce spivstavlennya ne gruntuvalosya na statistici abo kilkisnih doslidzhennyah a bulo pripushennyam Computerworld en ocinyuye obsyag nestrukturovanih danih v organizaciyah u 70 80 vid usih danih Zmist 1 Istoriya 2 Problemi terminologiyi 3 Robota z nestrukturovanimi danimi 4 Div takozh 5 Primitki 6 DzherelaIstoriya red Najranishi doslidzhennya u sferi biznes analitiki zoseredzhuvalisya ne na chislovih danih a na nestrukturovanih tekstovih danih Vzhe 1958 roku taki doslidniki u sferi informacijnih tehnologij yak G P Lun en vivchali sposobi vidilyannya ta klasifikaciyi danih u nestrukturovanomu teksti 3 Prote lishe z pochatku 2000 h rokiv nayavni tehnologiyi nazdognali doslidnickij interes U 2004 roci SAS Institute en rozrobiv SAS en Text Miner yakij vikoristovuye singulyarne rozkladannya shob zvoditi tekstovij prostir visokoyi rozmirnosti do menshoyi kilkosti vimiriv dlya znachnogo sproshennya mashinnogo analizu 4 neavtoritetne dzherelo Dosyagnennya v galuzi matematiki ta tehnologij mashinnoyi obrobki tekstiv stimulyuvali provedennya doslidzhen komercijnimi organizaciyami v takih galuzyah yak analiz tonalnosti tekstu sentiment analiz zbirannya ta analiz dumok zamovnikiv en avtomatizaciya centriv obrobki viklikiv 5 neavtoritetne dzherelo Poyava tehnologij velikih danih naprikinci 2000 h rokiv stimulyuvala pidvishenij interes do program dlya analizu nestrukturovanih danih u suchasnih oblastyah takih yak prognozuvannya en ta analiz pershoprichin 6 Problemi terminologiyi red Termin nestrukturovani dani mozhe vvazhatisya netochnim z kilkoh prichin struktura navit yaksho vona ne viznachena formalno mozhe matisya na uvazi dani yaki mayut strukturu deyakoyi formi mozhut harakterizuvatisya yak nestrukturovani yaksho yihnya struktura ne priznachena dlya mashinnoyi obrobki nestrukturovana informaciya mozhe mati deyaku strukturu taka informaciya nazivayetsya napivstrukturovanoyu en abo navit buti dobre strukturovanoyu ale timi sposobami yaki ye neochevidnimi bez poperednogo uzgodzhennya Robota z nestrukturovanimi danimi red Taki tehniki yak intelektualnij analiz danih angl data mining obrobka prirodnoyi movi angl Natural Language Processing ta intelektualnij analiz tekstu nadayut metodi poshuku zakonomirnostej z metoyu tak chi inakshe interpretuvati nestrukturovanu informaciyu Metodi strukturuvannya tekstu zazvichaj vklyuchayut ruchne markuvannya metadani abo rozmitku chastinami movi dlya podalshogo strukturuvannya tekstu Arhitektura upravlinnya nestrukturovanoyu informaciyeyu en angl UIMA zabezpechuye zagalnu osnovu dlya obrobki ciyeyi informaciyi dlya otrimannya znachen i stvorennya strukturovanih danih na osnovi nestrukturovanoyi informaciyi Programne zabezpechennya sho stvoryuye mashinno obroblyuvanu strukturu danih vikoristovuye lingvistichni zvukovi ta vizualni strukturi sho isnuyut u vsih formah lyudskogo spilkuvannya Napriklad specialni algoritmi mozhut vivesti strukturu z tekstu shlyahom analizu morfologiyi sintaksisu rechen tosho Potim mozhna provesti rozmitku nestrukturovanoyi informaciyi dlya uniknennya neodnoznachnosti a dlya pokrashennya poshuku vikoristovuyutsya metodi ocinki relevantnosti Prikladom nestrukturovanih danih mozhut buti knigi zhurnali dokumenti metadani medichni zapisi en audio video analogovi dani zobrazhennya a takozh fajli sho mayut za osnovu nestrukturovanij tekst povidomlennya elektronnoyi poshti vebstorinki dokumenti stvoreni za dopomogoyu tekstovih procesoriv Nestrukturovana informaciya mozhe zberigatisya u viglyadi strukturovanih ob yektiv napriklad u viglyadi fajliv chi dokumentiv yaki v svoyu chergu mayut strukturu Pri comu poyednannya strukturovanih ta nestrukturovanih danih u sukupnosti takozh nazivayetsya nestrukturovani dani Napriklad u vebstorinkah HTML vzhe ye rozmitka prote vona pridatna lishe dlya vidobrazhennya U nij ne mistitsya informaciya pro znachennya abo funkciyi tih chi inshih rozmichenih elementiv u viglyadi pridatnomu dlya avtomatichnoyi obrobki Rozmitku zasobami XHTML prostishe obroblyati avtomatichno ale zazvichaj u nij ne mistitsya semantichnih znachen viraziv Oskilki nestrukturovani dani zazvichaj zberigayutsya u viglyadi elektronnih dokumentiv programi dlya analizu zmistu abo upravlinnya dokumentami nadayut perevagu klasifikuvannyu cilih dokumentiv nizh yihnih okremih chastin Takim chinom programi dlya obrobki takogo tipu danih zazvichaj yavlyayut soboyu zasobi dlya stvorennya kolekcij dokumentiv z nestrukturovanoyu informaciyeyu Prote sogodni isnuyut takozh rishennya sho pracyuyut z atomarnimi elementami menshimi nizh cilij dokument 7 Poshukovi sistemi stali odnim iz populyarnih instrumentiv dlya indeksaciyi ta poshuku v nestrukturovanih danih Div takozh red Klasteruvannya Rozpiznavannya obraziv Perelik programnogo zabezpechennya intelektualnogo analizu tekstu en Primitki red Unstructured data geeksforgeeks org Unstructured data PC Magazine en Encyclopedia Grimes Seth A Brief History of Text Analytics B Eye Network Procitovano 24 chervnya 2016 Albright Russ Taming Text with the SVD SAS Procitovano 24 chervnya 2016 Desai Manish Applications of Text Analytics My Business Analytics Blogspot Procitovano 24 chervnya 2016 Chakraborty Goutam Analysis of Unstructured Data Applications of Text Analytics and Sentiment Mining SAS Procitovano 24 chervnya 2016 Datagrav A Framework for Knowledge Sharing Using Transclusion Enabled Collaboration Media Sergey Kochuguev Academia eduDzherela red Artak Oganesyan Nestrukturovani dani 2 0 Vidkriti sistemi SUBD 2012 04 Leonid Chernyak Analitika nestrukturovanih danih Vidkriti sistemi SUBD 2012 06 Anton Ivanov Kompleksnij analiz nestrukturovanih danih Vidkriti sistemi SUBD 2013 06 Artem Grishkovskij Integrovana obrobka nestrukturovanih danih Vidkriti sistemi SUBD 2013 06 Structure Models and Meaning Is unstructured data merely unmodeled Intelligent Enterprise March 1 2005 Structuring Unstructured Data Forbes April 5 2007 Christopher C Shilakes and Julie Tylman Enterprise Information Portals Merrill Lynch 16 November 1998 Holzinger Andreas Stocker Christof Ofner Bernhard Prohaska Gottfried Brabenetz Alberto Hofmann Wellenhof Rainer Combining HCI Natural Language Processing and Knowledge Discovery Potential of IBM Content Analytics as an Assistive Technology in the Biomedical Field Human Computer Interaction and Knowledge Discovery in Complex Unstructured Big Data Holzinger Andreas Pasi Gabriella Springer 2013 S 13 24 Lecture Notes in Computer Science ISBN 978 3 642 39146 0 DOI 10 1007 978 3 642 39146 0 2 Unstructured Data and the 80 Percent Rule Seth Grimes Clarabridge Bridgepoints 2008 Q3 Today s Challenge in Government What to do with Unstructured Information and Why Doing Nothing Isn t An Option Noel Yuhanna Principal Analyst Forrester Research listopad 2010 New Digital Universe Study Reveals Big Data Gap Less Than 1 World s Data is Analyzed Less Than 20 is Protected pres reliz EMC gruden 2012 Semi and unstructured data processing preparation in IRI CoSort traven 2014 Otrimano z https uk wikipedia org w index php title Nestrukturovani dani amp oldid 37623419