DATAMININGOVÉ MODELY:
Rozhodovací stromy
Termín: | bude upřesněn |
---|---|
Místo: | Krakovská 7, Praha 1 |
Cena: |
|
Úroveň: | středně pokročilý |
---|---|
Jazyk: | čeština |
Počet dnů: |
|
ÚVOD
Rozhodovací stromy se staly oblíbenými dataminingovými modelovacími algoritmy díky své transparentnosti a robustnosti. Rozhodovací strom je tvořen soustavou návazných hierarchických pravidel, což u nevelkých stromů umožňuje snadnou interpretaci rozhodovacího procesu. Rozhodovací stromy nejsou náročné na přípravu dat, zpravidla umí i zpracovávat vynechané hodnoty. Díky svým vlastnostem se rozhodovací stromy používají v data miningu nejen jako predikční modely, ale i jako nástroje pro nahrazování vynechaných hodnot, výběr vstupních proměnných a optimální kategorizaci.
CÍL VZDĚLÁVACÍHO PROGRAMU
Cílem kurzu je seznámit účastníky s principy, vytvářením a používáním rozhodovacích stromů v data miningu. Během kurzu budou popsány některé algoritmy a vylepšení, kterými se rozhodovací stromy doplňují, např. penalizace chyb či prořezávání. Konkrétních algoritmů na vytváření stromů existuje velké množství, v kurzu jsou prezentovány dva: CHAID a CaRT. Kromě samostatných stromů se v data miningu používají i rozhodovací lesy. Při výuce budou prezentovány postupy kombinování stromů do rozhodovacích lesů.
KURZ JE URČEN
Kurz je určen analytikům, marketingovým pracovníkům a dataminerům, kteří chtějí vytvářet snadno interpretovatelné a robustní dataminingové modely.
PŘEDPOKLADY
Pro úspěšné absolvování kurzu postačí uživatelská znalost práce na počítači. Jako úvod do problematiky data miningu doporučujeme kurz Data mining – dolování znalostí z databází.
PŘÍNOS ÚČASTI NA KURZU
Účastníci budou po kurzu schopni využívat rozhodovací stromy jako dataminingové predikční modely a interpretovat je.
POPIS OBSAHU A POSTUPU
Kurz probíhá za podpory softwaru IBM SPSS Modeler. Po teoretickém úvodu do metody a představení používaných algoritmů si účastníci prakticky vyzkouší budování, interpretaci, evaluaci a nasazení rozhodovacích stromů a lesů.
PROGRAM KURZU
- principy vytváření a interpretace rozhodovacích stromů
- záznam stromů a jejich přepis na rozhodovací pravidla
- predikce pomocí stromů
- přesnost a obecnost
- prořezávání stromů
- penalizace chyb
- algoritmy CHAID a CaRT
- evaluační statistiky a grafy
- rozhodovací lesy
Ve výjimečných případech změna programu vyhrazena dle zaměření
a zkušeností dané skupiny účastníků.