Zpátky Domů

Článek | Zjistil.cz

Český název: Vědecká data
Anglický název: Data

Co jsou data Data jsou soubor samostatných nebo souvislých hodnot, které přenášejí informace. Popisují množství, kvalitu, fakta, statistiky nebo jiné základní jednotky významu. Mohou to být také jen sekvence symbolů, které lze dále formálně interpretovat. Datum je samostatná hodnota ve sbírce dat. Data jsou obvykle organizována do struktur, jako jsou tabulky, které poskytují další kontext a význam. Tyto struktury lze samy o sobě použít jako data ve větších strukturách. Data lze použít jako proměnné ve výpočetním procesu. Data mohou představovat abstraktní myšlenky nebo konkrétní měření. Data se běžně používají ve vědeckém výzkumu, ekonomice a prakticky ve všech ostatních formách lidské organizační činnosti. Příklady datových souborů zahrnují cenové indexy (jako je index spotřebitelských cen), míry nezaměstnanosti, míry gramotnosti a data ze sčítání lidu. V tomto kontextu data představují surová fakta a čísla, ze kterých lze extrahovat užitečné informace. Data se shromažďují pomocí technik, jako je měření, pozorování, dotazování nebo analýza. Obvykle se zobrazují jako čísla nebo znaky, které lze dále zpracovávat. Polní data jsou data, která se shromažďují v nekontrolovaném prostředí in situ. Experimentální data jsou data, která jsou generována v průběhu kontrolovaného vědeckého experimentu. Data se analyzují pomocí technik, jako je výpočet, úvaha, diskuse, prezentace, vizualizace nebo jiné formy postanalýzy. Před analýzou se obvykle čistí surová data (nebo nezpracovaná data): odstraní se výjimky a opraví se zjevné chyby nástroje nebo zadávání dat. Data lze chápat jako nejmenší jednotky faktických informací, které lze použít jako základ pro výpočet, úvahu nebo diskusi. Data mohou sahat od abstraktních myšlenek po konkrétní měření, včetně, ale nejen, statistiky. Tematicky propojená data prezentovaná v nějakém relevantním kontextu lze považovat za informace. Kontextuálně propojené části informací lze pak popsat jako datové postřehy nebo inteligenci. Zásoba postřehů a inteligence, která se časem hromadí v důsledku syntézy dat do informací, lze pak popsat jako znalost. Data byla popsána jako „nová ropa digitální ekonomiky“. Data jako obecný koncept odkazují na skutečnost, že nějaká existující informace nebo znalost je reprezentována nebo kódována v nějaké formě vhodné pro lepší použití nebo zpracování. Pokroky v počítačových technologiích vedly k příchodu velkých dat, což obvykle odkazuje na velmi velké množství dat, obvykle v řádu petabajtů. Pomocí tradičních metod analýzy dat a výpočtů je práce s takovými velkými (a rostoucími) datovými sadami obtížná, dokonce nemožná. (Teoreticky by nekonečná data přinesla nekonečné množství informací, což by znemožnilo získání postřehů nebo inteligence.) V reakci na to relativně nový obor datové vědy využívá strojové učení (a další metody umělé inteligence (AI)), které umožňují efektivní aplikace analytických metod na velká data.

Facebook Twitter