fbpx

SEMESTRÁLNÍ KURZ:
Data mining - cesta od dat k akční znalosti

Ikona kurzy data miningu
Termín:5. 3. - 18. 6. 2020
Místo:Krakovská 7, Praha 1
Cena:
  • 44 600 Kč / 1 610 €
  • + 21% DPH
Úroveň:základní
Jazyk:čeština
Počet dnů:
  • 14 půldenních lekcí
  • (56 výukových hodin)
  • každý čtvrtek
  • 9:00 - 12:30 hodin

20% SLEVA PŘI PŘIHLÁŠENÍ DO 31.12.2019

35 680 Kč / 1 288 € + 21% DPH

"Kurz splnil plně očekávání, je znát, že lektory problematika velmi zajímá. Doporučil bych, jako úvod do problematiky DM i jako SW školení DM Modeleru. Organizace kurzu byla bezproblémová, oceňuji vstřícnost při přesunu kurzu."

Daniel VicheraČeská spořitelna, a.s.

"Získala som komplexný pohľad na proces data miningu ako aj základné poznatky a prehľad o možnostiach modelovania (rôzne modelovacie algoritmy, vyhodnotenie algoritmov apod.). Lektori dobre poznajú danú problematiku, boli ochotní a ústretoví. V Centre výuky bolo príjemné prostredie, bolo o nás dobre postarané, kurz bol organizačne dobre zabezpečený."

Ing. Zuzana MokráňováPrvá stavebná sporiteľňa, a.s.

"Od kurzu jsem čekala přehled o různých data miningových modelech. Těm byla věnována největší část kurzu. Teoretická část byla vždy velmi pěkně zpracovaná, podstata modelu jednoduše vysvětlená. Oceňuji rozsah praktické části výuky. I když naše firma software SPSS nepoužívá, práce s konkrétními příklady prohloubí pochopení modelu a ukáže na možná kritická místa. Lektor byl vstřícný, pohotově reagoval na dotazy. Na vysoké úrovni bylo i zázemí pro účastníky kurzu."

Ing. Eva LukášováKomerční banka, a.s.

"Kurz pro mě byl velice přínosný. Oceňuji, že problém je podáván v celé šíři, od definice problému, přes datové manipulace po implementaci řešení. S data miningem jsem doposud neměla téměř žádné zkušenosti, tudíž byl pro mě kurz velice efektivní. Zejména jsem si poopravila svůj názor na data mining, nyní ho vnímám jako celý proces (od definování problému po implementaci řešení), ne pouze jako datové manipulace.“

Ing. Zuzana Pacáková, Ph.D.Česká zemědělská univerzita v Praze
0
účastníků kurzu
0
,30
hodnocení kurzu
0
,6 osob z 5
uplatní poznatky v praxi

ÚVOD

Data mining umožňuje extrahovat z elektronických dat klíčové vzory chování potřebné k optimalizaci rozhodovacích postupů. Své uplatnění nachází napříč všemi sférami, portfolio dataminingových úloh se stále rozrůstá. Mezi dataminingové úlohy patří například predikce selhání dlužníka, detekce podvodů, predikce odchodu ke konkurenci, doporučování služeb nebo predikce selhání stroje. Také zdroje, z nichž data čerpáme, neustále přibývají. Kromě dat z relačních databází zpracováváme texty, obrázky či data ze sociálních sítí. Dataminingové predikční modely po implementaci do predikčních procesů významně zhodnotí investice vložené do získávání dat a budování modelů.

CÍL VZDĚLÁVACÍHO PROGRAMU

Semestrální kurz je založen a strukturován podle obecně přijaté metodologie CRISP-DM (Cross Industry Standard Process for Data Mining). Ve čtrnácti půldenních lekcích se posluchači seznámí s přístupy a principy metod data miningu a na konkrétních datech z různorodých datových zdrojů si podrobně procvičí postupy ze všech šesti fází metodologie CRISP-DM. Probíraná látka je prokládána praktickými příklady. S účastníky diskutujeme dostupnost potřebných dat, nastavení predikčních algoritmů a nástrahy nasazovaní řešení do procesů. Důraz je kladen na získání dostatečného nadhledu nad řešenou úlohou, jejíž řešení je třeba dekomponovat na dílčí etapy. Výuka probíhá za podpory profesionálního dataminingového softwaru IBM SPSS Modeler (PS CLEMENTINE). Tento software bezplatně zapůjčíme účastníkům kurzu po celou dobu jeho trvání.

KURZ JE URČEN

Kurz je určen analytikům, řešitelům dataminingových projektů, pracovníkům marketingu, IT specialistům i všem ostatním, kteří se chtějí hlouběji seznámit s praktickou aplikací dataminingových metod a postupů.

PŘEDPOKLADY

Základní znalosti popisné statistiky a ovládání PC. Uživatelská znalost softwaru se nepředpokládá.

PŘÍNOS ÚČASTI NA KURZU

Účastníci budou schopni samostatně naplánovat dataminingový projekt, načíst a připravit data z různých datových zdrojů, vybudovat predikční model a nasadit řešení do praxe. Budou znát podstatu používaných dataminingových modelů a naučí se využívat všechny nezbytné datové manipulace. Díky cvičením a domácím úlohám se stanou i středně pokročilými uživateli softwaru IBM SPSS Modeler.

POPIS OBSAHU A POSTUPU

Na pozadí jednotlivých fází metodologie CRISP-DM budou procvičovány běžné postupy z dataminingové praxe. Během kurzu si účastníci vyzkouší řešení úloh z různých odvětví a seznámí se s různými typy a zdroji malých i velkých dat. Výuka probíhá především za podpory dataminingového softwaru IBM SPSS Modeler, některé postupy si ukážeme i v jiných softwarech nebo je zapíšeme v jazyce Python. Zhruba polovina každé lekce je věnována teoretickému úvodu do problematiky, v druhé části se nabyté znalosti prakticky procvičují. Účastníci mezi lekcemi samostatně řeší drobné domácí úlohy, které na začátku výuky prezentují ostatním.

PROGRAM KURZU

  1. metodologie CRISP-DM, klasifikace dataminingových úloh
  2. definování cílů a plánování dataminingového projektu
  3. napojení na interní a externí datové zdroje, big data, datový audit
  4. datové manipulace, příprava a kombinování dat pro modelování
  5. nestrukturovaná data a jejich příprava
  6. modelovací algoritmy
    • lineární a logistické regrese
    • neuronové sítě
    • rozhodovací stromy
    • asociační pravidla
    • seskupování
  7. kombinování modelů
  8. evaluace a odhad přínosů řešení
  9. nasazení optimalizačních postupů do praxe
LEKTOR
photo Mgr. Ondřej Háva, Ph.D.

Mgr. Ondřej Háva, Ph.D.

lektor, analytik a odborný konzultant

Profil lektora →

INFORMACE

Kalendář kurzů

ke stažení v PDF

Organizační informace

k realizaci kurzu v Praze

FAQ

Nejčastější otázky

POUŽÍVANÝ SOFTWARE

Ve výjimečných případech změna programu vyhrazena dle zaměření a zkušeností dané skupiny účastníků.