KNIHOVNA SCIKIT-LEARN

Termín:
  • 8. 4. 2026
  • (9:00 - 16:30 hodin)
Forma:
  • prezenční: Krakovská 7, Praha 1
  • online: aplikace MS Teams
Cena:5 600 Kč / 230 € + DPH
Cena s videozáznamem:
  • 7 400 Kč / 300 € + DPH
  • (dostupnost videozáznamu 3 měsíce)
Úroveň:středně pokročilý
Jazyk:český
Počet dnů:
  • 1 den
  • (8 výukových hodin)

CENOVĚ VÝHODNÝ BALÍČEK KURZŮ - 20% SLEVA

  • 16 640 Kč / 670 € + 21% DPH
  • 22 200 Kč / 890 € + 21% DPH s videozáznamem

V přihlášce kurzu uveďte jen jméno kolegy či kolegyně

ÚVOD

Strojové učení je klíčovým nástrojem na vytěžování užitečné informace z dat. Strojově naučené rozhodovací modely slouží k optimalizaci a automatizaci rozhodování o zákaznících, úvěrech, pacientech, výrobcích apod. Nejčastěji řešené úlohy vyžadují vytvoření klasifikačních modelů, které předpovídají, zda nastane nebo nenastane nějaký jev. Jevem zde rozumíme např. splácení úvěru, poruchu stroje nebo dotační podvod. Na základě předpovědi modelu se pak rozhodujeme, zda úvěr přidělíme, vyměníme kritickou součástku nebo poskytneme dotaci. Kromě klasifikačních modelů se v praxi setkáváme s regresními a seskupovacími modely. Regresní modely předpovídají číselné veličiny, např. budoucí cenu akcie, seskupovací modely přiřazují entity do předem neznámých skupin, např. navrhují zákaznické segmenty.

Protože většina datových vědců, kteří připravují strojově učené modely, používá jazyk Python, existují v Pythonu knihovny, nabízející algoritmy strojového učení. Zřejmě nejpoužívanější z nich je knihovna scikit-learn. Knihovna zahrnuje pestrou škálu běžně používaných modelů pro klasifikaci, regresi i seskupování. Navíc zde nalezneme metody pro vybrané datové transformace a redukce dimenzionality, které usnadňují strojové učení. Možnosti knihovny jsou ještě širší, nabízené nástroje nám umožní i hodnotit kvalitu modelů a pro toto hodnocení si předem připravit evaluační design. Na základě hodnocení pak můžeme modely vybírat nebo dokonce vytvářet jejich ansámbly.

CÍL VZDĚLÁVACÍHO PROGRAMU

V kurzu vás naučíme používat běžné algoritmy strojového učení z knihovny scikit-learn, představíme důležité datové manipulace a procvičíme si také evaluační postupy.

KURZ JE URČEN

Kurz je určen pro všechny, kdo zpracovávají tabulková data v Pythonu a potřebují pomocí metod strojového učení ze svých dat extrahovat užitečnou informaci pro predikční model. Metody z knihovny scikit-learn nejsou oborově závislé, predikční modely můžete uplatnit při rozhodování ve výrobě, financích, státní sféře i medicíně.

PŘEDPOKLADY

Kurz předpokládá základní zkušenosti s analýzou tabulkových dat a mírnou znalost jazyka Python. Znalost algoritmů strojového učení není nutná.

PŘÍNOS ÚČASTI NA KURZU

Studenti se během kurzu naučí používat modul scikit-learn. Budou umět rozdělit modelovací matici na bloky potřebné k učení a evaluaci modelů. Vyzkouší si strojové učení, evaluaci a nasazení běžných modelů pro klasifikaci, regresi i seskupování a naučí se nastavovat hlavní metaparametry těchto modelů. Účastníci také získají povědomí, jaké datové manipulace je možné provádět před strojovým učením, aby učení bylo efektivní, modely nebyly zbytečně složité a využily maximum informace uložené v datech.

POPIS OBSAHU A POSTUPU

Jednodenní kurz se zaměřuje na praktické postupy používání objektů z knihovny scikit-learn. Během výuky budeme vytvářet a evaluovat různé typy predikčních modelů a připravovat data pro strojové učení. Práci s funkcemi a objekty knihovny scikit-learn budeme procvičovat v intuitivním prostředí Jupyter Notebook s nainstalovaným jazykem Python, kde je možné spouštět zvolené části kódu a ke kódu připisovat přehledné komentáře.

PROGRAM KURZU

  • přehled možností knihovny

  • instalace scikit-learn

  • transformace škál a rozdělení

  • redukce dimenzionality

  • štěpení dat a evaluační design

  • klasifikační modely: logistická regrese, rozhodovací stromy, podpůrné vektory, nejbližší sousedé, vícevrstvý perceptron, naivní Bayesovský klasifikátor, lineární diskriminační analýza

  • regresní modely: lineární regrese, rozhodovací stromy, podpůrné vektory, nejbližší sousedé, vícevrstvý perceptron

  • ansámbly modelů: náhodné lesy

  • seskupovací modely: k-means, DBSCAN

  • výběr a evaluace modelů

Ve výjimečných případech změna programu vyhrazena dle zaměření
a zkušeností dané skupiny účastníků.