Stáhněte si skripty k softwaru IBM SPSS Statistics

DATAMININGOVÉ MODELY:
SESKUPOVÁNÍ A DETEKCE ANOMÁLIÍ

Ikona kurzy data miningu
Termín:možnost realizace jako kurz na klíč
Místo:bude upřesněno
Cena:bude upřesněno
Úroveň:středně pokročilý
Jazyk:čeština
Počet dnů:
  • 1 den
  • (8 výukových hodin)

ÚVOD

Ne všechny dataminingové úlohy mohou být řešeny pomocí supervizovaných predikčních modelů, kdy pro učení máme k dispozici historická data s cílovou proměnnou. Seskupování představuje nesupervizované modelovací postupy, které jsou určeny k hledání podobných nebo naopak anomálních případů v datech. Své uplatnění najdou všude tam, kde neznáme historické hodnoty cílových atributů nebo se vzory chování mění tak rychle, že modely naučené na historických datech nejsou aktuální již v době, kdy vznikají.

Seskupovací algoritmy se hojně využívají v marketingu, kde slouží jako nástroj pro přípravu segmentace. V data miningu se seskupovací postupy používají k redukci dimenzionality, jako součást metamodelů a především pro detekci anomálního chování.

CÍL VZDĚLÁVACÍHO PROGRAMU

V kurzu se účastníci seznámí s často používanými seskupovacími algoritmy, naučí se pro ně připravovat data a využijí jejich výstupy nejen k detekci anomálního chování.

KURZ JE URČEN

Kurz je určen analytikům a dataminerům, kteří chtějí budovat predikční modely nad daty bez cílové proměnné, např. v úlohách, kde je pomocí modelů potřeba upozornit na neobvyklé chování.

PŘEDPOKLADY

Pro úspěšné absolvování kurzu postačí uživatelská znalost práce na počítači a znalost matematiky na středoškolské úrovni. Jako úvod do problematiky data miningu doporučujeme kurz Data mining – dolování znalostí z databází.

PŘÍNOS ÚČASTI NA KURZU

Účastníci se v kurzu naučí klasifikovat nové případy do předem neznámých kategorií pomocí seskupovacích metod. Budou umět používat seskupovací postupy k detekci anomálních a podezřelých případů.

POPIS OBSAHU A POSTUPU

V první části kurzu představíme účastníkům metody kompetičního nesupervizovaného učení využívané k detekci klastrů v datech. Ukážeme, jak tyto postupy mohou být využity k detekci mnohorozměrných neobvyklých případů. Ve druhé části si účastníci vyzkouší získané znalosti na praktických příkladech. Praktická část výuky probíhá za podpory softwaru IBM SPSS Modeler.

PROGRAM KURZU

  • komparace vícerozměrných profilů
  • měření podobnosti, vzdálenost
  • příprava dat pro seskupování
  • kompetiční učení
  • algoritmus k-means
  • dvoustupňové seskupování
  • Kohonenovy mapy
  • evaluace kvality seskupení
  • detekce vícerozměrných anomálií
  • skórování anomálních případů
GARANT KURZU
Ondřej Brom

Ing. Ondřej Brom

lektor, analytik a odborný konzultant

Profil lektora →

INFORMACE

Kalendář kurzů

ke stažení v PDF

Organizační informace

k realizaci kurzu v Praze

FAQ

Nejčastější otázky

POUŽÍVANÝ SOFTWARE

Ve výjimečných případech změna programu vyhrazena dle zaměření a zkušeností dané skupiny účastníků.