Výpis souhrnů
Vizualizace dat: typy grafů
Prohlížíte si souhrny informací k určitým tématům. Systémy Umíme se zaměřují hlavně na jejich procvičování. Ke cvičením k jednotlivým podtématům se dostanete pomocí odkazů níže.
Podtémata
Vizualizace dat: typy grafů
Pojem „graf“ má bohužel v češtině několik odlišných významů. Mimo jiné máme grafy funkcí, grafy modelující vztahy mezi objekty a grafy znázorňující data. Zde se zabýváme posledním zmíněným významem.
- Sloupcové grafy typicky používáme pro znázornění hodnot pro několik kategorií (např. počet obyvatel pro jednotlivé státy). Data jsou vyjádřena jako sloupečky.
- Koláčové grafy využíváme především pro vyjádření „části z celku“ (např. jaká část lidí žije na jednotlivých kontinentech), mají blízký vztah k procentům. Data jsou vyjádřena jako výseče kruhu.
- Spojnicové grafy využíváme pro data, která jsou přirozeně uspořádána do posloupností, především pro data měnící se v čase (např. průměrná teplota v měsících). Data jsou vyjádřena pomocí lomených čar.
- Plošné grafy jsou podobné jako spojnicové, ale znázorňují hodnoty pomocí plochy.
- Bodové grafy využíváme pro vyjádření vztahu mezi dvěma veličinami (např. vztah mezi výškou a hmotností žáků ve třídě). Data jsou vyjádřena pomocí bodů.
- Histogramy vypadají podobně jako sloupcové grafy, používají se pro vyjádření rozložení hodnot spojité veličiny rozdělené do intervalů (např. rozložení hmotnosti v populaci).
Výše uvedené typy grafů je dobré umět rozlišovat. Též se hodí znát jednotlivé součásti grafů a jejich použití.
Pracovní listy
Kromě níže uvedených interaktivních cvičení jsou k dispozici také následující pracovní listy, které vždy zobrazují graf vycházející z reálných dat a k němu několik úkolů:
Rozlišování typů grafů
Pro různá data se hodí využít různé typy grafů. Základem jejich použití je znát jejich názvy, abychom je například našli v programu, který pro analýzu dat používáme.
Sloupcový graf Znázorňuje data pomocí obdélníků (sloupců), ty mohou být uspořádány svisle nebo vodorovně a uspořádány do skupin. |
![]() |
Koláčový graf Vyznačuje část celku pomocí výsečí. Čím větší je určitá výseč, tím větší část celku znázorňuje. |
|
Spojnicový graf Zobrazuje data pomocí bodů, které jsou spojeny čárami. Používá se hlavně pro časové řady. |
|
Plošný graf Podobný jako spojnicový, ale znázorňuje hodnoty pomocí plochy. |
![]() |
Bodový graf Popisuje vztah dvou proměnných skrze souřadnice bodů. |
|
Histogram Zobrazuje rozložení dat pomocí sloupců, jejichž výška odpovídá četnosti dat v daném intervalu. Na rozdíl od sloupcového grafu nejsou na vodorovné ose kategorie, ale spojitá proměnná (např. hmotnost). |
![]() |
Krabicový graf Zobrazuje interval, ve kterém leží polovina dat, čára uvnitř obdélníku značí medián. Význam čar vycházejících z obdélníku se různí, mohou například zobrazovat maximální rozsah dat. |
![]() |
Sloupcové grafy
Sloupcový graf (bar chart) znázorňuje data pomocí obdélníků (sloupců), jejichž délka odpovídá hodnotě, kterou představují. Sloupce mohou být uspořádány svisle nebo vodorovně. Vodorovně uspořádané sloupcové grafy se také někdy označují jako řádkové či pruhové.
K dispozici jsou tato podtémata:
- Sloupcové grafy: základní – Procvičuje orientaci v grafech, které obsahují pro každou skupinu dat jen jednoduchý sloupec.
- Sloupcové grafy: skupinové a skládané – Složitější grafy, které pro určitou skupinu dat zobrazují více hodnot (sloupce vedle sebe či části sloupců nad sebou).
- Sloupcové grafy: mix
Sloupcové grafy: základní
Sloupcový graf (bar chart) znázorňuje data pomocí obdélníků (sloupců), jejichž délka odpovídá hodnotě, kterou představují. Sloupce mohou být uspořádány svisle (na ukázce vlevo) nebo vodorovně (na ukázce vpravo). Vodorovně uspořádané sloupcové grafy se také někdy označují jako řádkové či pruhové.
Typ zobrazených dat
Sloupcový graf se používá především pro vyjádření hodnot příslušných ke kategoriím (kategorickým datům).
kategorická proměnná (jednotlivé sloupce) | příslušná hodnota (délka obdélníku) |
---|---|
nemoci | počty úmrtí |
státy | rozlohy |
města | počty obyvatel |
sociální sítě | počty uživatelů |
Sloupcový graf většinou není vhodný pro zobrazení změn v čase, k tomu lépe slouží spojnicové grafy.
NahoruSloupcové grafy: skupinové a skládané
Skupinový sloupcový graf
Skupinový sloupcový graf (grouped bar chart, clustered bar chart) pro každou skupinu zobrazuje několik hodnot formou sloupců vedle sebe. Následující příklad pro každou zemi zobrazuje spotřebu zvlášť piva a vína (průměr na osobu a měsíc).
Skládaný sloupcový graf
Skládaný sloupcový graf (stacked bar chart) zobrazuje také pro každou skupinu několik hodnot, ale ty jsou poskládány nad sebe. Díky tomu můžeme snadno porovnávat jejich součet. Následující graf zobrazuje zisky medailí z olympiád. Medaile jsou rozděleny podle své hodnoty (zlato, stříbro, bronz), současně však snadno vidíme i celkové zisky.
Pracovní list
K dispozici jsou následující materiály k vytištění:
NahoruKoláčové grafy
Koláčový graf (výsečový graf, kruhový diagram, anglicky pie chart) znázorňuje data formou kruhu rozděleného na sektory, přičemž velikost každého sektoru odpovídá podílu dané kategorie na celku. Tento typ grafu je vhodný pro vizualizaci procentuálního rozdělení nebo relativních četností různých kategorií v rámci jednoho datového souboru. Výseče mohou být popsané počty procent z celku nebo přímo hodnotami.
Koláčové grafy poskytují rychlou orientaci v celkovém složení. Například z uvedených ukázek na první pohled vidíme, že zázvorky jsou přibližně z třetiny tvořené cukrem a že polovinu vánoční zásoby cukroví tvoří linecké dohromady s perníčky.
Koláčový graf je nejčastěji používán pro zobrazení kategorických dat, kde lze snadno srovnávat relativní velikosti kategorií. Typická použití zahrnují zobrazení složení rozpočtu, populace či analýzu odpovědí v dotazníku.
Varianty grafu
Koblížkový graf (anglicky donut chart nebo doughnut chart) je variací koláčového grafu, kde je střed vyříznut a graf tak tvoří prstenec (název je odvozen od americké koblihy donut). Jde pouze o estetickou variaci, která má jinak stejné použití jako základní koláčový graf.
Vícevrstvý prstencový graf (v angličtině sunburst) má více vrstev zanořených prstenců. Jde o pokročilejší typ grafu, který je vhodný pro zobrazení hierarchických dat.
Nevhodná použití koláčového grafu
Koláčové grafy není vhodné kombinovat s 3D efekty a naklápěním. Takové zobrazení může vypadat atraktivně, ale vede ke zkreslení zobrazených dat. Vizualizace dat mají především věrně zobrazovat data.
Koláčové grafy nejsou vhodné pro srovnání přesných hodnot mezi kategoriemi nebo pro zobrazení malých rozdílů, protože odhad velikosti sektorů může být nepřesný. Také pokud máme více než 5-7 kategorií, koláčový graf se stává přeplněným a těžko čitelným. V těchto případech je vhodnější jej nahradit sloupcovým grafem.
Koláčové grafy nejsou vhodné pro zobrazení změn v čase. Pro takové účely je lepší použít spojnicové grafy, které poskytují jasnější vizualizaci trendů.
Pracovní list
Kromě níže uvedených interaktivních cvičení je k dispozici také materiál na vytištění:
NahoruSpojnicové grafy
Spojnicový graf (liniový graf, anglicky line chart) zobrazuje data pomocí bodů, které jsou spojeny čárami. Tento typ grafu dává smysl pro data, která jsou přirozeně uspořádána do posloupností.
Typické použití spojnicových grafů je pro zobrazení časových řad. Můžeme je však použít i v jiných případech, například pro zobrazení průběhu cyklistického závodu, kde osa x představuje vzdálenost od startu a osa y nadmořskou výšku.
Varianty grafu
Spojnicový graf může obsahovat více datových řad, přičemž každá může mít svůj vlastní popisek osy y. Toto zobrazení může být někdy méně přehledné, ale poskytuje možnost detailního srovnání různých datových sad.
Variací spojnicového grafu je plošný graf, ve kterém jsou oblasti mezi čarami vyplněny barvou. Plošné grafy jsou vhodné pro zobrazení kumulativních hodnot, jako jsou celkové výnosy firmy nebo celková spotřeba energie v průběhu času.
Nevhodná použití spojnicového grafu
Volba rozsahu osy y je klíčová. Obvykle by měla začínat od nuly, protože jinak může být vyznění grafu matoucí – může naznačovat výrazné trendy tam, kde nejsou. Toto pravidlo však není univerzální. To ostatně ukazuje výše uvedený příklad s teplotou, kde by nebylo vhodné, aby graf začínal od nuly.
Pokud nejsou prvky v zobrazované řadě pravidelně rozmístěny (např. máme data pro leden, únor, červen a prosinec), mělo by použité zobrazení správně odpovídat rozestupům. Pokud toto nezohledníme, může být graf zavádějící.
Pokud data nejsou přirozeně seřazena, je použití spojnicového grafu většinou nevhodné. Graf v takovém případě může vytvářet dojem kontinuity tam, kde žádná není. Například pokud máme data o výšce žáků ve třídě, zobrazení pomocí spojnicového grafu bude obsahovat spojnice, které neodpovídají žádným relevantním trendům. V takových případech je většinou vhodnější použít sloupcové grafy.
Pracovní list
Kromě níže uvedených interaktivních cvičení jsou k dispozici také materiály na vytištění:
NahoruBodové grafy
Bodový graf (anglicky scatter plot) znázorňuje hodnoty dvou proměnných vztahujících se ke stejnému objektu. Například následující graf zobrazuje průměrnou teplotu v lednu a červnu pro různá evropská města.
Bodový graf může zobrazovat informace i o dalších proměnných pomocí různých ztvárnění bodů. Například následující graf ukazuje pro státy světa dvě hlavní proměnné: střední délku života mužů a střední délku života žen. Tyto proměnné určují polohu bodů. Kromě toho graf ještě zobrazuje velikost populace jednotlivých států (velikost bodů) a jejich příslušnost ke kontinentům (barva bodů).
Varianta bodového grafu s různě velkými body se někdy nazývá bublinový graf (bubble chart).
Pracovní list
Kromě níže uvedených interaktivních cvičení jsou k dispozici také materiály na vytištění:
NahoruPlošné grafy
Plošný graf (anglicky area chart) je podobný jako spojnicový graf a také se typicky využívá pro zobrazení časových řad. V plošném grafu jsou oblasti mezi křivkami vyplněny barvou nebo vzorkem.
Plošné grafy se využívají především pro zobrazení kumulativních hodnot – součtů z několika kategorií. Následující příklad zobrazuje změny v počtu obyvatel na jednotlivých kontinentech. Plochy pro jednotlivé kontinenty jsou naskládány na sobě a v grafu tedy snadno vidíme i celkovou velikost populace na celém světě.
Dalšími příklady využití plošných grafů jsou zobrazení výnosů firmy z různých produktů nebo změny ve složení emisí skleníkových plynů.
NahoruHistogramy
Histogram znázorňuje počet výskytů různých hodnot sledované veličiny a často se používá, pokud měříme stejnou veličinu pro různé subjekty nebo v různých časech. Například následující histogram ukazuje hmotnost 200 různých lidí:
Měřená veličina (hmotnost) je rozdělena do několika intervalů, přičemž každý interval je reprezentován sloupcem. Výška sloupce ukazuje, kolikrát změřená hodnota padla do daného intervalu. Graf ukazuje, že hmotnost mezi 65 a 70 kg má právě 30 lidí.
Volba šířky intervalů
Důležitou volbou při tvorbě histogramů je velikost intervalů. Příliš široké intervaly mohou skrýt důležité rozdíly, protože odlišná pozorování shromáždí do stejného intervalu. Použití příliš úzkých intervalů naopak znamená, že v každém bude příliš málo pozorování, a vynikne statistický šum.
Histogramy s více třídami
Pokud je v datové sadě zastoupeno několik různých tříd (např. muži a ženy), je možné histogramy pro obě třídy překrýt, aby lépe vynikly rozdíly mezi těmito třídami. Následující histogram ukazuje, že ženy jsou zpravidla menší než muži, ale existuje i značný překryv – nejvyšší ženy jsou větší než nejmenší muži.
Použití histogramů
Histogramy umožňují rychle identifikovat nejčastější nebo naopak neobvyklé hodnoty. Používají se také jako odhad rozložení pravděpodobnosti. V takovém případě jsou místo počtů výskytů na ose y relativní četnosti v procentech.
Věkové pyramidy
Speciálním typem histogramu je věková pyramida, která ukazuje věkové rozložení populace. Měřená veličina (věk) bývá vynesena na svislé ose a šířka sloupců nalevo, resp. napravo od svislé osy ukazuje počet mužů/žen daného věku.
Histogramy vs. sloupcové grafy
Histogramy se podobají sloupcovým grafům, jen místo kategorických tříd sledují spojitou veličinu (např. hmotnost, výška, teplota, rychlost). Použitím intervalů uměle rozdělíme data do oddělených tříd, ty jsou ale stále seřaditelné. Občas se můžete setkat i s různě širokými intervaly v rámci jednoho grafu.