| strojové učení |
učení programů na základě dat |
| model |
mapování vstupů na výstupy (řešení úlohy strojového učení) |
| datová sada (dataset) |
data pro trénování modelu |
| příklad (example) |
jeden kompletní vstup pro model (řádek datasetu) |
| atribut (feature) |
informace o příkladech použitá modelem (sloupec datasetu) |
| štítek (label) |
správný výstup pro daný příklad |
| anotování dat |
přiřazování správných výstupů (štítků) |
| označkovaná data |
data s požadovaným výstupem (štítkem) |
| predikce |
předpověď, odhad (výstup modelu) |
| inference |
vytvoření odhadů natrénovaným modelem |
| učení s učitelem (supervised learning) |
přístup ke strojovému učení využívající označkovaná data |
| učení bez učitele (unsupervised learning) |
přístup ke strojovému učení využívající neoznačkovaná data |
| učení s částečným dohledem (semi-supervised learning) |
přístup ke strojovému učení využívající označkovaná i neoznačkovaná data |
| posilované učení, zpětnovazební učení (reinforcement learning) |
učení skrze interakci s prostředím zahrnující zpětnou vazbu na provedené akce |
| klasifikace |
úloha určit příslušnost příkladu k jedné z několika předem daných kategorií (např. žánr knížky) |
| regrese |
úloha určit číselnou hodnotu pro daný příklad (např. hodnocení knížky) |
| řazení (ranking) |
úkol uspořádat příklady (např. doporučení knížek) |
| detekce anomálií |
úkol odhalit příklady, které se výrazně liší od zbytku dat |
| shlukování (clustering) |
úloha rozdělit příklady do skupin (shluků, clusters) s podobnými vlastnostmi |
| generativní umělá inteligence (generative AI) |
modely generující komplexní výstupy, např. odpovědi nebo obrázky |
| lineární model |
model určující výstup na základě váženého součtu atributů |
| rozhodovací strom (decision tree) |
model určující výstup na základě posloupnosti podmínek |
| náhodný les (random forest) |
model složený z mnoha rozhodovacích stromů |
| neuronová síť |
model volně inspirovaný strukturou mozku, složený z mnoha propojených „neuronů“ počítajících jednoduchou funkci, typicky organizovaných do vrstev |
| hluboké učení (deep learning) |
učení neuronových sítí s mnoha vrstvami |
| velký jazykový model (Large Language Model, LLM) |
rozsáhlá neuronová síť predikující pravděpodobnost dalšího slova (např. GPT) |
| transformátor (transformer) |
typ neuronové sítě umožňující efektivní učení na rozsáhlých datech (T v GPT znamená právě transformátor) |
| parametry, váhy |
hodnoty modelu, které lze měnit během učení |
| gradientní sestup (gradient descent) |
učicí algoritmus, který opakovaně mění parametry modelu ve směru největší změny (gradientu) chybové funkce |
| stochastický gradientní sestup (SGD) |
efektivní varianta gradientního sestupu využívají prvek náhodnosti |
| trénovací data |
data použitá k učení modelu |
| testovací data |
data použitá k vyhodnocení modelu |
| generalizace |
schopnost predikovat správné výstupy i pro nová data (tedy zobecňovat) |
| memorizace |
pouhé zapamatování správných výstupů trénovací data |
| podučení (underfitting) |
model má vysokou chybovost, protože je příliš jednoduchý na danou úlohu |
| přeučení (overfitting) |
přesné zapamatování trénovacích dat na úkor schopnosti generalizovat |
| regularizace |
metody zabraňující přeučení, např. penalizace komplexity modelu |
| zkreslení, předpojatost, (bias) |
systematická chyba, která vede k neférovým důsledkům |
| výběrové zkreslení (selection bias) |
typ zkreslení, kdy data nereprezentují adekvátně všechny typy případů |
| základní model (baseline) |
jednoduché řešení úlohy použité pro srovnání se složitějšími metodami |
| metrika |
hodnota vyjadřující kvalitu modelu |
| střední kvadratická chyba (mean squared error) |
metrika pro regresní úlohy, průměrná druhá mocnina odchylky mezi predikovanou a skutečnou hodnotou |
| správnost (accuracy) |
metrika pro klasifikační úlohy, podíl správných odpovědí |
| přesnost (precision) |
metrika pro klasifikační úlohy, kolik ze všech označených příkladů je pozitivních |
| pokrytí (recall) |
metrika pro klasifikační úlohy, kolik ze všech pozitivních příkladů model detekoval |
| matice záměn (confusion matrix) |
tabulka zobrazující, kolik kterých kategorií bylo jak klasifikováno |
| tenzorové procesy, TPU (Tensor Processing Unit) |
procesory specializované na strojové učení |