TEXT MINING

Termín:	bude upřesněn (9:00 - 16:30 hodin)
Forma:	prezenční: Krakovská 7, Praha 1 online: aplikace MS Teams
Cena:	6 800 Kč / 270 € + 21% DPH
Cena s videozáznamem:	9 000 Kč / 360 € + 21% DPH (dostupnost videozáznamu je 30 dní)

Úroveň:	středně pokročilý
Jazyk:	český
Počet dnů:	1 den (8 výukových hodin)

Poptávka po kurzu

ÚVOD

Tradiční dataminingové postupy umožňují extrahovat a využít užitečnou informaci z elektronických dat uložených ve strukturovaném tabulkovém formátu. Většina elektronických dat je však nestrukturovaná. Textové dokumenty, jako jsou například emaily, novinové články, vědecké publikace, zápisky z call center, korespondence na sociálních sítích nebo jen komentáře k produktům nabízejí také množství skryté informace, jež může dataminingové predikce významně zkvalitnit. Skrytou informaci v textech je třeba extrahovat do strukturovaných atributů, aby se dala použít pro následné modelování. Díky vlastnostem a bohatosti přirozených jazyků je extrakce klíčových atributů z textu značně specifická, atributy musí být navíc citlivě vybrány i s ohledem na řešenou textminingovou nebo dataminingovou úlohu.

CÍL VZDĚLÁVACÍHO PROGRAMU

Textminingový kurz seznámí účastníky s metodami extrakce klíčových vlastností z textu a s jejich využitím při predikčním modelování. Pro extrakci vlastností z textu budeme používat metody statistického zpracování přirozených jazyků (NLP). Ty umožní detekovat koncepty a skrytá témata, která lze díky variabilitě a bohaté slovní zásobě přirozených jazyků vyjádřit mnoha způsoby. V kurzu budou probírány extrakce příznaků na různých úrovních: od písmenných skupin zvaných n-gramy přes termíny až po komplexní sémantická témata a jejich vlastností. Příkladem extrakce komplexních vzorů z textu může být analýza sentimentu, kdy rozeznáváme kladné a záporné postoje autora. Metody statistického zpracování přirozených jazyků musí být nezbytně podporovány mnoha lingvistickými zdroji ve formátu slovníků a pravidel. Účastníci se seznámí i s touto jazykovou oporou, aby byli schopni vhodně vybrat a případně modifikovat lingvistické zdroje pro konkrétní úlohu.

KURZ JE URČEN

Kurz je určen pro analytiky, marketingové pracovníky, žurnalisty a vyšetřovatele, kteří potřebují zpracovat větší množství textů, aniž by museli všechny dokumenty přečíst, a využít získanou informaci k rozhodování.

PŘEDPOKLADY

Pro úspěšné absolvování kurzu postačí uživatelská znalost práce na počítači.

PŘÍNOS ÚČASTI NA KURZU

Účastníci se seznámí s metodami anotace textových dat nezbytnými pro extrakci užitečných atributů. Budou schopni navrhnout postup automatického zpracování textové kolekce.

POPIS OBSAHU A POSTUPU

Výuka textminingových postupů probíhá za podpory softwaru IBM SPSS Modeler Professional, IBM SPSS Modeler Text Analytics a modulu ACREA Text Mining.

PROGRAM KURZU

úlohy text miningu
strukturovaná reprezentace textových dokumentů
získání a indexace textové kolekce
procedury zpracování textu a jejich řazení
extrakce konceptů, jejich vlastností a komplexních vzorů
redukce dimenzionality extrahovaných atributů
analýza obsahu
klasifikace a seskupování dokumentů
vyhledávání v kolekci
dataminingové úlohy s podporou textových dat
správa a modifikace lingvistických zdrojů

Ve výjimečných případech změna programu vyhrazena dle zaměření
a zkušeností dané skupiny účastníků.

LEKTOR

Mgr. Ondřej Háva, Ph.D.

Profil lektora →

INFORMACE

Přehled vypsaných kurzů

Organizační informace ke kurzu

POUŽÍVANÝ SOFTWARE

IBM SPSS Modeler Professional

IBM SPSS Modeler Text Analytics

ACREA Text Mining

PŘEČTĚTE SI

V čem se liší text mining od data miningu?

Tato stránka používá cookies

Na stránkách používáme soubory cookies. Některé jsou nezbytné pro fungování stránek, jiné nám umožňují poskytnout vám lepší zkušenost při návštěvě našich stránek nebo zobrazování reklamy, pomáhají nám analyzovat návštěvnost a stránky zlepšovat. Více informací

Nastavení cookies Přijmout vše

Souhlas s používáním cookies

Cookies jsou malé soubory, které se dočasně ukládají ve vašem počítači a pomáhají nám k lepší uživatelské zkušenosti na našich stránkách. Cookies používáme k personalizaci obsahu stránek a reklam, poskytování funkcí sociálních sítí a k analýze návštěvnosti. Informace o vašem používání našich stránek také sdílíme s našimi partnery v oblasti sociálních sítí, reklamy a analýzy, kteří je mohou kombinovat s dalšími informacemi, které jste jim poskytli nebo které shromáždili při vašem používání jejich služeb.

Ze zákona můžeme na vašem zařízení ukládat pouze soubory cookie, které jsou nezbytně nutné pro provoz těchto stránek. Pro všechny ostatní typy souborů cookie potřebujeme vaše svolení. Budeme vděční, když nám ho poskytnete a pomůžete nám tak, naše stránky a služby zlepšovat. Svůj souhlas s používáním cookies na našem webu můžete samozřejmě kdykoliv změnit nebo odvolat. Více informací

Jednotlivé souhlasy

Nezbytné - aby stránky fungovaly, jak mají.

Nezbytné soubory cookie pomáhají učinit webové stránky použitelnými tím, že umožňují základní funkce, jako je navigace na stránce a přístup k zabezpečeným oblastem webové stránky. Bez těchto souborů cookie nemůže web správně fungovat.

Preferenční - abychom si pamatovali vaše preference.

Preferenční cookies umožňují, aby si stránka pamatovala informace, které upravují, jak se stránka chová nebo vypadá. Např. vaše přihlášení, obsah košíku, zemi, ze které stránku navštěvujete.

Statistické - abychom věděli, co na webu děláte a co zlepšit.

Statistické cookies pomáhají provozovateli stránek pochopit, jak návštěvníci stránek stránku používají, aby mohl stránky optimalizovat a nabídnout jim lepší zkušenost. Veškerá data se sbírají anonymně a není možné je spojit s konkrétní osobou.

Marketingové - abychom vám ukazovali pouze relevantní reklamu.

Marketingové cookies se používají ke sledování pohybu návštěvníků napříč webovými stránkami s cílem zobrazovat jim pouze takovou reklamu, která je pro daného člověka relevantní a užitečná. Veškerá data se sbírají a používají anonymně a není možné je spojit s konkrétní osobou.

Uložit nastavení

Přijmout vše