Histogram znázorňuje počet výskytů různých hodnot sledované veličiny a často se používá, pokud měříme stejnou veličinu pro různé subjekty nebo v různých časech. Například následující histogram ukazuje hmotnost 200 různých lidí:
Měřená veličina (hmotnost) je rozdělena do několika intervalů, přičemž každý interval je reprezentován sloupcem. Výška sloupce ukazuje, kolikrát změřená hodnota padla do daného intervalu. Graf ukazuje, že hmotnost mezi 65 a 70 kg má právě 30 lidí.
Volba šířky intervalů
Důležitou volbou při tvorbě histogramů je velikost intervalů. Příliš široké intervaly mohou skrýt důležité rozdíly, protože odlišná pozorování shromáždí do stejného intervalu. Použití příliš úzkých intervalů naopak znamená, že v každém bude příliš málo pozorování, a vynikne statistický šum.
Histogramy s více třídami
Pokud je v datové sadě zastoupeno několik různých tříd (např. muži a ženy), je možné histogramy pro obě třídy překrýt, aby lépe vynikly rozdíly mezi těmito třídami. Následující histogram ukazuje, že ženy jsou zpravidla menší než muži, ale existuje i značný překryv – nejvyšší ženy jsou větší než nejmenší muži.
Použití histogramů
Histogramy umožňují rychle identifikovat nejčastější nebo naopak neobvyklé hodnoty. Používají se také jako odhad rozložení pravděpodobnosti. V takovém případě jsou místo počtů výskytů na ose y relativní četnosti v procentech.
Věkové pyramidy
Speciálním typem histogramu je věková pyramida, která ukazuje věkové rozložení populace. Měřená veličina (věk) bývá vynesena na svislé ose a šířka sloupců nalevo, resp. napravo od svislé osy ukazuje počet mužů/žen daného věku.
Histogramy vs. sloupcové grafy
Histogramy se podobají sloupcovým grafům, jen místo kategorických tříd sledují spojitou veličinu (např. hmotnost, výška, teplota, rychlost). Použitím intervalů uměle rozdělíme data do oddělených tříd, ty jsou ale stále seřaditelné. Občas se můžete setkat i s různě širokými intervaly v rámci jednoho grafu.