SEMESTRÁLNÍ KURZ:
Datová věda a Python

Termín:
  • 24. 10. 2024 - 23. 1. 2025
  • (9:00 - 12:30 hodin)
Forma:
  • prezenční: Krakovská 7, Praha 1
  • online: aplikace MS Teams
Cena:31 900 Kč / 1 280 € + 21% DPH
Úroveň:základní
Jazyk:český
Počet dnů:
  • 10 půldenních lekcí
  • (40 výukových hodin)
  • každý čtvrtek dopoledne

ÚVOD

Datová věda se neustále rozvíjí, neboť elektronická data v sobě ukrývají velký informační potenciál. Datová věda (dříve data mining nebo dobývání znalostí) nachází uplatnění napříč všemi obory tam, kde je potřeba pomocí individuálních predikcí chování zákazníků, strojů, daňových poplatníků apod. optimalizovat návratnost investic.

CÍL VZDĚLÁVACÍHO PROGRAMU

V posledních letech mezi SW nástroji používanými datovými vědci dominuje programovací jazyk Python. S jeho užíváním nejsou spojeny žádné poplatky, nabízí komfortní datové struktury a je vybaven specializovanými knihovnami pro datovou vědu.

KURZ JE URČEN

Kurz je určen pro ty, kdo chtějí začít s datovou vědou a používat nejrozšířenější softwarové nástroje v této oblasti jimiž jsou Python a jeho specializované knihovny.

PŘEDPOKLADY

Kurz předpokládá základní zkušenosti s prací s daty a algoritmické myšlení. Před kurzem by účastníci měli mít základní znalost programování Pythonu. Není třeba se předem seznamovat s knihovnami pro datovou vědu. Účastníkům bez znalosti Pythonu doporučujeme kurz Úvod do Pythonu v rozsahu tří dopoledních lekcí.

PŘÍNOS ÚČASTI NA KURZU

Účastníci se během kurzu naučí řešit a řídit dataminingové projekty na pozadí metodologie CRISP-DM od specifikace úlohy přes datové manipulace a strojové učení až po nasazení řešení do provozu. Osvojí si vybrané knihovny jazyka Python určené datovým vědcům. Budou umět sestavit program pro běžné operace používané při analýze a přípravě dat, vytvářet často používané strojové modely, ověřovat kvalitu modelů a aplikovat vyvinuté řešení na nová data.

POPIS OBSAHU A POSTUPU

Pravidelné týdenní výukové lekce se skládají z teoretické a praktické části. V praktické části procvičujeme prezentované postupy na datech z různých oborů a používáme při tom jazyk Python a jeho knihovny jako jsou Pandas nebo Sci-Kit Learn. Dovednosti získané v hodinách si účastníci zopakují při řešení domácích úloh.

PROGRAM KURZU

  •  úlohy datové vědy a metodologie CRISP-DM
  • datový audit a vizualizace vztahů
  • příprava datové modelovací matice
  • vybrané metody strojového učení
  • evaluace predikčních modelů
  • nasazení řešení do provozu
  • reportování a vizualizace dat v Pythonu
  • datové objekty a manipulace s daty v knihovně Pandas
  • strojové učení a evaluace v knihovně Sci-Kit Learn a dalších knihovnách

Ve výjimečných případech změna programu vyhrazena dle zaměření a zkušeností dané skupiny účastníků.