TEXT MINING
Termín: |
|
---|---|
Forma: |
|
Cena: | 6 800 Kč / 270 € + 21% DPH |
Cena s videozáznamem: |
|
Úroveň: | středně pokročilý |
---|---|
Jazyk: | český |
Počet dnů: |
|
ÚVOD
Tradiční dataminingové postupy umožňují extrahovat a využít užitečnou informaci z elektronických dat uložených ve strukturovaném tabulkovém formátu. Většina elektronických dat je však nestrukturovaná. Textové dokumenty, jako jsou například emaily, novinové články, vědecké publikace, zápisky z call center, korespondence na sociálních sítích nebo jen komentáře k produktům nabízejí také množství skryté informace, jež může dataminingové predikce významně zkvalitnit. Skrytou informaci v textech je třeba extrahovat do strukturovaných atributů, aby se dala použít pro následné modelování. Díky vlastnostem a bohatosti přirozených jazyků je extrakce klíčových atributů z textu značně specifická, atributy musí být navíc citlivě vybrány i s ohledem na řešenou textminingovou nebo dataminingovou úlohu.
CÍL VZDĚLÁVACÍHO PROGRAMU
KURZ JE URČEN
PŘEDPOKLADY
PŘÍNOS ÚČASTI NA KURZU
POPIS OBSAHU A POSTUPU
PROGRAM KURZU
-
úlohy text miningu
-
strukturovaná reprezentace textových dokumentů
-
získání a indexace textové kolekce
-
procedury zpracování textu a jejich řazení
-
extrakce konceptů, jejich vlastností a komplexních vzorů
-
redukce dimenzionality extrahovaných atributů
-
analýza obsahu
-
klasifikace a seskupování dokumentů
-
vyhledávání v kolekci
-
dataminingové úlohy s podporou textových dat
-
správa a modifikace lingvistických zdrojů
Ve výjimečných případech změna programu vyhrazena dle zaměření
a zkušeností dané skupiny účastníků.