Abychom mohli s daty pracovat, musíme je nejdříve získat a přehledně zaznamenat, případně najít již existující data. Data mohou mít různou podobu: například textu nebo čísla, mohou mít určitý formát. Při sběru dat je vhodné myslet na to, že získaná data mohou zkreslovat popis skutečnosti.

Při získávání dat je velmi často efektivní je uspořádat do tabulky.

K získávání dat slouží například:

  • pozorování – Využívá lidské smysly.
  • měření – Výsledkem jsou číselné údaje, které lze porovnávat. Obvykle mají určitou jednotku (např. m, kg). Pro měření bývají často využívané přístroje. Měření může být podle způsobu provedení různě přesné.
  • využití dotazníků – Zahrnuje získávání informací od většího množství lidí. Často se využívá ve výzkumech veřejného mínění. Data zjištěná dotazníkem můžeme spojit s identitou (např. jménem) určitého člověka, či je sbírat anonymně.
  • analýza (zpracování, vyhodnocení) jiných dat

Získaná data lze zaznamenávat do digitálních zařízení, ale třeba i jednoduše na papír.

Různá data se získávají různě obtížně. Člověk zpravidla snáze bude získávat data, která se týkají skutečností v jeho okolí, data, která se týkají menšího množství lidí či data, k jejichž získání nejsou potřeba specializované přístroje.

Mnohá data byla již zjištěna a není nutné je získávat znovu. Stačí je vyhledat ve vhodném zdroji (např. počet obyvatel Brna v minulém roce zjistíme na webu ČSU). Již existující data ale nejsou vždy volně dostupná.

Při získávání i zpracování dat se mohou vyskytnout chyby či zkreslení. Zvláště při získávání/zpracování větších souborů dat se těmto jevům nelze zcela vyhnout, je však vhodné pokusit se jejich výskyt omezit.

Abychom mohli s daty pracovat, musíme je nejdříve získat a přehledně zapsat. Základní způsob, jak si data o světě kolem nás udržovat, je použít tabulku. Některá data můžeme získat přímo v tabulkové podobě, například na Wikipedii lze najít řadu zajímavých tabulek o světě (třeba státy podle počtu obyvatel).

Co když chceme zpracovávat informace ze svého okolí? Například data o tom, jaká domácí zvířata mají doma spolužáci, na Wikipedii nenajdeme. Můžeme si ale vyrobit vlastní tabulku.

Vyjádření informací slovně a číslem

Přejít ke cvičením na toto téma »

Některé informace vyjadřujeme číslem. Jedná se např. o počty, míry či časové údaje. Číselné hodnoty jsou mnohdy spojeny s určitou jednotkou (např. cm, kg, Kč). S čísly jde provádět početní operace (např. sčítání, násobení). Například:

  • Můj bratr se narodil v roce 2023.
  • Eva má 2 morčata.
  • Představení začíná v 19.00 hodin.
  • Kopretina bílá dorůstá výšky asi 0,5 m.
  • Předplatné stálo 500 Kč.

Mnohé informace se vyjadřují slovy či slovním popisem. Například:

  • Žofie má přátelskou povahu.
  • Martin má hnědé oči.
  • Film měl skvělé vizuální efekty, ale nezajímavý příběh.

Někdy lze vlastnost obvykle popisovanou slovy přeneseně vyjádřit pomocí čísla. S číslem se mnohdy snáze pracuje, případně se s číselnými hodnotami dá počítat. Například:

  • „Ponorný tyčový mixér AppetitChef Turbo“ může obdržet např. katalogové číslo 1 334 751. Tak produkt v e-shopu jednoznačně identifikujeme.
  • Delší slovní recenzi filmu můžeme úderně shrnout třeba tak, že filmu dáme hodnocení 3 hvězdičky z 5 možných.

Data mohou mít různý formát. V základu mohou mít tvar textového řetězce (např. želva), čísla (např. 1) nebo logické hodnoty (TRUE – pravda, FALSE – nepravda).

Čísla mohou mít rozličnou podobu. Pokud 0 zastupuje číslici (respektive v některých případech celé číslo), můžeme získat například:

  • 0,0 – desetinné číslo
  • 000 000 000 – telefonní číslo bez předvolby
  • 000 00 – poštovní směrovací číslo
  • 0/0 – zlomek
  • 0 % – procento

Specifické je formátování času. Uvažme, že Y zastupuje rok, m měsíc, d den, H hodinu, M minutu a S sekundu. V rámci tohoto formátu získáme například:

  • H.M – čas v rámci dne, uplynulé hodiny a minuty
  • M:S – uplynulé minuty a sekundy
  • d. m. Y – datum (formát typický pro češtinu)
  • m/d/Y – datum (formát typický pro americkou angličtinu)

Zástupné znaky (jako výše) se pro formátování dat používají např. v rámci programovacích jazyků či tabulkového procesoru. Na podobném principu fungují regulární výrazy, které se používají hlavně pro vyhledávání v datech.

Využít konkrétní formát (či kontrolu) dat je výhodné třeba v dotaznících: pokud chceme od respondenta získat PSČ, hodí se vstup omezit pouze na 5 číslic. Zamezíme tak zadání chybných dat.

Při práci s daty se může snadno stát, že dostupná data jsou nějakým způsobem zkreslená. Taková data pak nevypovídají dobře o skutečnosti. Pokud zkreslení nevezmeme v úvahu, může zpracování takových dat vést k matoucím závěrům. Je proto užitečné základní typy zkreslení znát.

Výběrové zkreslení

Při sběru dat většinou není reálné posbírat „všechna data“, často používáme jen nějaký výběr. Tento výběr by měl ideálně představovat takzvaný reprezentativní vzorek, které dobře odpovídá charakteristikám celkové populace. Pokud tomu tak není, tak jsou data zkreslená.

Příklady nereprezentativních vzorků

  • Průzkum názorů na politiku, který agentura provede pouze v Praze na náměstí.
  • Výzkum účinků léku, do kterého jsou zapojeni pouze studenti sportovního gymnázia.

K tomuto typu zkreslení může dojít například tak, že se účastníci průzkumu sami rozhodují, zda se zúčastní či nikoliv (zkreslení neúčasti). Ti, kteří se rozhodnou neúčastnit, se často liší v důležitých ohledech od těch, kteří se účastní. Příklad: Dotazník o počítačových hrách vyplní s větší šancí ti, kdo rádi hrají počítačové hry.

Na výběrovém zkreslení se může podílet také množství získaných dat. Příklad: Když budeme zjišťovat zpětnou vazbu k výuce pouze u 2 žáků ve třídě, pravděpodobně to nebude vypovídat o celé třídě.

Zkreslení odpovědí

Pokud sbíráme odpovědi dotazníkovým šetřením, může se stát z různých důvodů stát, že poskytnuté odpovědi neodpovídají přesně realitě. Účastníci výzkumu například mohou upravovat své odpovědi podle společenských očekávání či mohou odpovídat nepřesně, protože si přesnou odpověď nedovedou vybavit. Odpovědi mohou ovlivnit také takové detaily, jako je pořadí odpovědí v dotazníku.

Příklady zkreslení odpovědí

  • Účastníci výzkumu o stravování mohou ve svých odpovědích přeceňovat konzumaci zdravých potravin nebo podceňovat příjem nezdravých potravin.
  • Průzkum trávení času o loňských prázdninách může být zkreslen nepřesnými vzpomínkami.

Potvrzující zkreslení (konfirmační zkreslení)

Lidé mají přirozeně tendenci upřednostňovat informace, které podporují vlastní názory, a naopak ignorovat či podceňovat informace, které jsou s názory v rozporu. To se může přímo či nepřímo projevit i při sběru dat.

Příklad potvrzujícího zkreslení

  • Výzkumník zkoumá vliv videoher na agresi.
  • Má hypotézu, že videohry vedou k násilnému chování.
  • Při průzkumu dostupných studií věnuje větší pozornost sběru a analýze dat, které odpovídají jeho hypotéze.

Publikační zkreslení

K publikačnímu zkreslení dochází, když výsledek experimentu či analýzy ovlivňuje rozhodnutí, zda data publikovat nebo jinak šířit.

Příklad publikačního zkreslení

V lékařském výzkumu mohou farmaceutické společnosti rozhodnout o publikování pouze studií, které prokazují pozitivní výsledky nového léku, zatímco utají nebo nepublikují studie s nepříznivými výsledky. Toto zkreslení zpráv může vést k nadhodnocení účinnosti léku a zastření potenciálních rizik nebo vedlejších účinků.

NAPIŠTE NÁM

Děkujeme za vaši zprávu, byla úspěšně odeslána.

Napište nám

Nevíte si rady?

Nejprve se prosím podívejte na časté dotazy:

Čeho se zpráva týká?

Vzkaz Obsah Ovládání Přihlášení Licence