IBM SPSS MODELER: 
Příprava dat pro modelování

Termín:
  • bude upřesněn
  • (9:00 - 16:30 hodin)
Forma:
  • prezenční: Krakovská 7, Praha 1
  • online: aplikace MS Teams
Cena:15 400 Kč / 620 € + 21% DPH
Úroveň:základní
Jazyk:český
Počet dnů:
  • 3 dny
  • (24 výukových hodin)

ÚVOD

Program IBM SPSS Modeler (PS CLEMENTINE) je komplexní dataminingový nástroj, který pokrývá celý dataminingový proces od přípravy dat až po aplikaci modelů do praxe. V tomto kurzu se zaměříme především na nástroje určené pro přípravu dat a jejich praktické využití. Kvalitní příprava dat je nutnou podmínkou pro jakékoli analýzy. Chybná nebo nekvalitní příprava má za následek chybné závěry či nevhodné modely. V dataminingové metodologii CRISP-DM je přípravě dat věnována jedna fáze, kterou uživatelé hodnotí jako časově nejnáročnější. V praxi neexistují data, která by nevyžadovala úpravu před analýzou a modelováním. Typické operace ve fázi přípravy dat zahrnují slučování zdrojů, agregování, restrukturalizaci, prosté i sekvenční odvozování atributů, formátování, výběry, doplňování vynechaných hodnot či hledání duplicit. Ačkoli lze mnohé operace zapsat v SQL nebo v nějakém programovacím jazyce, tento přístup je časově náročný, nepřehledný a odvádí pozornost dataminera od cíle projektu.

CÍL VZDĚLÁVACÍHO PROGRAMU

Cílem kurzu je naučit účastníky připravovat data pomocí vizuálního programování v prostředí IBM SPSS Modeler (PS CLEMENTINE). Naučí se pracovat s procesními uzly tohoto softwaru, osvojí si i speciální manipulační funkce jazyka CLEM. Společně s přípravou dat se budeme věnovat i jejich vizualizaci, neboť interaktivní grafika IBM SPSS Statistics (PS CLEMENTINE) umožňuje generovat mnoho datových manipulací ad hoc přímo z grafů.

KURZ JE URČEN

Kurz je určen především analytikům, dataminerům a datovým specialistům, kteří plánují pro svoji práci užívat nebo užívají software IBM SPSS Modeler (PS CLEMENTINE).

PŘEDPOKLADY

Pro úspěšné absolvování kurzu postačí uživatelská znalost práce na počítači, ovládání softwaru IBM SPSS Modeler (PS CLEMENTINE) se účastníci naučí během kurzu.

PŘÍNOS ÚČASTI NA KURZU

Účastníci získají schopnost používat uzly datových manipulací v softwaru IBM SPSS Modeler (PS CLEMENTINE). Naučí se připojit na datové zdroje, analyzovat kvalitu dat, sloučit zdroje do modelovací matice a data upravit tak, aby poskytovala kvalitní vstup pro modelovací metody.

POPIS OBSAHU A POSTUPU

Výuka probíhá na softwaru IBM SPSS Modeler (PS CLEMENTINE). Systematicky se probírají jednotlivé datové manipulace, které tento software nabízí, a zároveň se procvičují na praktických příkladech.

PROGRAM KURZU

  • datové formáty a přístup k datům, ODBC
  • vizuální programování
  • uzly IBM SPSS Modeler pro práci se záznamy (Record Operations)
  • uzly IBM SPSS Modeler pro práci s proměnnými (Field Operations)
  • zápis manipulačních formulí v jazyce CLEM
  • datový audit a interaktivní výstupy IBM SPSS Modeler

Ve výjimečných případech změna programu vyhrazena dle zaměření
a zkušeností dané skupiny účastníků.