IBM SPSS MODELER:
Příprava dat pro modelování
Termín: |
|
---|---|
Forma: |
|
Cena: | 15 400 Kč / 620 € + 21% DPH |
Cena s videozáznamem: |
|
Úroveň: | základní |
---|---|
Jazyk: | český |
Počet dnů: |
|
ÚVOD
Program IBM SPSS Modeler (PS CLEMENTINE) je komplexní dataminingový nástroj, který pokrývá celý dataminingový proces od přípravy dat až po aplikaci modelů do praxe. V tomto kurzu se zaměříme především na nástroje určené pro přípravu dat a jejich praktické využití. Kvalitní příprava dat je nutnou podmínkou pro jakékoli analýzy. Chybná nebo nekvalitní příprava má za následek chybné závěry či nevhodné modely. V dataminingové metodologii CRISP-DM je přípravě dat věnována jedna fáze, kterou uživatelé hodnotí jako časově nejnáročnější. V praxi neexistují data, která by nevyžadovala úpravu před analýzou a modelováním. Typické operace ve fázi přípravy dat zahrnují slučování zdrojů, agregování, restrukturalizaci, prosté i sekvenční odvozování atributů, formátování, výběry, doplňování vynechaných hodnot či hledání duplicit. Ačkoli lze mnohé operace zapsat v SQL nebo v nějakém programovacím jazyce, tento přístup je časově náročný, nepřehledný a odvádí pozornost dataminera od cíle projektu.
CÍL VZDĚLÁVACÍHO PROGRAMU
KURZ JE URČEN
PŘEDPOKLADY
PŘÍNOS ÚČASTI NA KURZU
POPIS OBSAHU A POSTUPU
PROGRAM KURZU
- datové formáty a přístup k datům, ODBC
- vizuální programování
- uzly IBM SPSS Modeler pro práci se záznamy (Record Operations)
- uzly IBM SPSS Modeler pro práci s proměnnými (Field Operations)
- zápis manipulačních formulí v jazyce CLEM
- datový audit a interaktivní výstupy IBM SPSS Modeler
Ve výjimečných případech změna programu vyhrazena dle zaměření
a zkušeností dané skupiny účastníků.