fbpx

IBM SPSS MODELER: Príprava dát pre modelovanie

- individuálna výučba

Ikona kurzy softwaru IBM SPSS
Termín:podľa dohody
Miesto:
  • u zákazníka
  • (stred a západ Slovenska)
Cena:840 € + 20% DPH
Úroveň:základná
Jazyk:slovenčina
Počet dnů:
  • 3 dni
  • (24 hodín výučby)

ÚVOD

Program IBM SPSS Modeler (PS CLEMENTINE) je komplexný dataminingový nástroj, ktorý pokrýva celý dataminingový proces od prípravy dát až po aplikáciu modelov do praxe. V tomto kurze sa zameriame predovšetkým na nástroje určené pre prípravu dát a ich praktické využitie. Kvalitná príprava dát je nutnou podmienkou akejkoľvek následnej analýzy. Chybná alebo nekvalitná príprava má za následok chybné závery či nevhodné modely. V dataminingovej metodológii CRISP-DM je príprave dát venovaná jedna fáza, ktorú užívatelia hodnotia ako časovo najnáročnejšiu. V praxi neexistujú dáta, ktoré by nevyžadovali úpravu pred analýzou a modelovaním. Typické operácie vo fáze prípravy dát zahŕňajú zlučovanie zdrojov, agregovanie, reštrukturalizáciu, prosté aj sekvenčné odvodzovanie atribútov, formátovanie, výbery, doplňovanie vynechaných hodnôt či hľadanie duplicít. Hoci ide mnohé operácie zapísať v SQL alebo v nejakom programovacom jazyku, tento prístup je časovo náročný, neprehľadný a odvádza pozornosť dataminera od cieľa projektu.

CIEĽ VZDELÁVACIEHO PROGRAMU

Cieľom kurzu je naučiť účastníkov pripravovať si dáta pomocou vizuálneho programovania v prostredí IBM SPSS Modeler (PS CLEMENTINE). Naučia sa pracovať s procesnými uzlami tohto softvéru, osvoja si aj špeciálne manipulačné funkcie jazyka CLEM. Spoločne s prípravou dát sa budeme venovať aj ich vizualizácii, pretože interaktívna grafika IBM SPSS Modeler (PS CLEMENTINE) umožňuje generovať mnoho dátových manipulácií ad hoc priamo z grafov.

KURZ JE URČENÝ

Kurz je určený predovšetkým analytikom, dataminerom a dátovým špecialistom, ktorí budú pre svoju prácu používať alebo používajú softvér IBM SPSS Modeler (PS CLEMENTINE).

PREDPOKLADY

Pre úspešné absolvovanie kurzu postačí užívateľská znalosť práce na počítači, ovládanie softvéru IBM SPSS Modeler (PS CLEMENTINE) sa účastníci naučia počas kurzu.

PRÍNOS ÚČASTI NA KURZE

Účastníci získajú schopnosť používať uzly dátových manipulácií v softvéri IBM SPSS Modeler (PS CLEMENTINE). Naučia sa pripojiť na dátové zdroje, analyzovať kvalitu dát, zlúčiť zdroje do modelovacej matice a dáta upraviť tak, aby poskytovali kvalitný vstup pre modelovacie metódy.

POPIS OBSAHU A POSTUPU

Výučba prebieha na softvéri IBM SPSS Modeler (PS CLEMENTINE). Systematicky sa preberajú dátové manipulácie, ktoré tento softvér ponúka a zároveň sa precvičujú na praktických príkladoch.

PROGRAM KURZU

  • dátové formáty a prístup k dátam, ODBC

  • vizuálne programovanie

  • uzly IBM SPSS Modeler pre prácu so záznamami (Record Operations)

  • uzly IBM SPSS Modeler pre prácu s premennými (Field Operations)

  • zápis manipulačných formúl v jazyku CLEM

  • dátový audit a interaktívne výstupy IBM SPSS Modeler