KLASIFIKAČNÍ A ASOCIAČNÍ STROMY

Ikona kurzy statistiky
Termín:4. 6. 2018
Místo:Praha
Cena:5 600 Kč / 200 € + DPH
Úroveň:středně pokročilý
Jazyk:čeština
Počet dnů:
  • 1 den
  • (8 výukových hodin)

ÚVOD

Metoda klasifikačních či asociačních stromů je založena na postupném členění případů do stejnorodých skupin na základě jejich vlastností. Při použití metody se volí cílová vlastnost případů, která má být ve skupinách homogenní. Nejčastěji je predikována příslušnost případu k určité kategorii -  zákazníci se například stromem rozdělí do skupin podle zájmu o konkrétní produkt. Strom nejen případy rozdělí do skupin, ale zjistí také, co příslušnost ke skupině určuje.

CÍL VZDĚLÁVACÍHO PROGRAMU

Cílem kurzu je seznámit posluchače s principy vytváření klasifikačních stromů, s jejich aplikacemi a poskytnout znalosti potřebné k vytváření stromů. Látka bude ilustrována a procvičována na praktických příkladech. Posluchači získají dostatečné znalosti pro samostatné vytváření klasifikačních stromů.

KURZ JE URČEN

Kurz je vhodný pro každého, kdo pracuje s případy (např. osoby, předměty), které jsou rozčleněny do kategorií. Klasifikační stromy mu pomohou zjistit, proč případ do dané kategorie patří, a určit, do které kategorie přiřadit nový případ a předpovědět jeho chování. Kategorizované případy se vyskytují zejména: v marketingu, kde kategoriemi je např. odchod nebo setrvání zákazníka, zájem nebo nezájem o produkt atd., pojišťovnictví, kde se pojistné plnění třídí například na nepochybné, podezřelé a s vysokým rizikem podvodu, v bankovnictví, kde kategorie tvoří míra problému se splácením, ve státní sféře, kde se kontroluje např. oprávněnost žádostí od dotace.

PŘEDPOKLADY

U účastníků kurzu se předpokládá znalost typů statistických proměnných, základních statistických pojmů a frekvenční analýzy. Vhodná, ale ne nutná, je znalost kontingenčních tabulek.

PŘÍNOS ÚČASTI NA KURZU

Účastník kurzu se seznámí s obecným principem tvorby klasifikačních stromů. Konkrétně jsou probírány široce použitelné algoritmy CHAID a CART. Účastník se dozví o teoretických základech algoritmů a budou je umět používat pro řešení konkrétních úloh ze své praxe.

POPIS OBSAHU A POSTUPU

Na kurzu je nejprve představena základní myšlenka a princip klasifikačních stromů. Následuje podrobnější popis zvolených algoritmů a vysvětlení jejich parametrů. Těžištěm kurzu je pak práce s modely nad daty a seznámení se se s běžnými problémy, které v reálných datech nastávají, a jejich řešením. V této části se účastníci zapojí do aktivní práce s daty a budování modelů.

PROGRAM KURZU

  • kontingenční tabulky a ANOVA
  • obecné principy klasifikačních stromů
  • algoritmus CHAID
  • algoritmus CART
  • klasifikace případů
  • vyhodnocení modelu, tréningová a testovací množina
  • rozšířené možnosti algoritmů (ztrátová matice, chybějící hodnoty)
  • skórování
LEKTOR
Ondřej Brom

Ing. Ondřej Brom

lektor, analytik a odborný konzultant

Profil lektora →
Věra Kumová

Bc. et Bc. Věra Kumová

lektor, analytik a odborný konzultant

Více informací →

INFORMACE

Kalendář kurzů

ke stažení v PDF

Organizační informace

k realizaci kurzu v Praze

FAQ

Nejčastější otázky

POUŽÍVANÝ SOFTWARE

Ve výjimečných případech změna programu vyhrazena dle zaměření a zkušeností dané skupiny účastníků.