Big data: Porovnání verzí
Řádek 3: | Řádek 3: | ||
'''Big data''' pojem nejčastěji vyskytující se v oblasti Informačních technologií (ICT), který označuje takové množství dat, které není možné v reálném čase zpracovat na běžně dostupném hardwarovém a softwarovém vybavení. | '''Big data''' pojem nejčastěji vyskytující se v oblasti Informačních technologií (ICT), který označuje takové množství dat, které není možné v reálném čase zpracovat na běžně dostupném hardwarovém a softwarovém vybavení. | ||
[[Soubor:BigData 2267x1146 trasparent.png|thumb|upright 1|right|náhled]] | [[Soubor:BigData 2267x1146 trasparent.png|thumb|upright 1|right|náhled]] | ||
+ | |||
+ | |||
+ | == Rozdělení == | ||
+ | |||
+ | Big Data se definují čtyřmi dimenzemi. | ||
+ | '''První je objem (volume).''' | ||
+ | To jsou data, co se nepohybují, ale narůstají obrovským tempem. Bylo již zmíněno v úvodu práce, že tempo růstu objemu dat je rychlejší každým rokem, a do roku 2020 bude ze současných 8000 exabajtů až 35000 exabajtů dat na světě. | ||
+ | |||
+ | '''Druhou dimenzí je rychlost (velocity).''' | ||
+ | Míněna je rychlost dat a jejich pohybu, vytváření, hromadění a zpracování. Streamovaná data s milisekundovou odezvou, real-time komunikační odezvy a informace. | ||
+ | |||
+ | '''Třetí dimenze je typ (variety).''' | ||
+ | Data v mnoha různých formách. Strukturovaná, nestrukturovaná, textová a multimediální. | ||
+ | |||
+ | '''Čtvrtá dimenze je věrohodnost (veracity).''' | ||
+ | Tuto dimenzi přidala společnost IBM pro lepší a přesnější definování Big Data. Nejistá data jsou z důvodů nekonzistence, věrohodnosti či neúplnosti. Při analyzování veškerých dat kolem nás musíme s určitou mírou nevěrohodnosti počítat. V některých zdrojích je jako čtvrtá dimenze uváděna hodnota (value), ve smyslu hodnoty pro podnik a lepší byznys modely. |
Verze z 5. 11. 2015, 17:02
Na této stránce se právě pracuje. Prosím needitujte tuto stránku, dokud na ní zůstává tato šablona. Předejdete tak editačnímu konfliktu. Jestliže uběhla od poslední editace doba alespoň dvou dnů, neváhejte tuto šablonu odstranit. |
Big data pojem nejčastěji vyskytující se v oblasti Informačních technologií (ICT), který označuje takové množství dat, které není možné v reálném čase zpracovat na běžně dostupném hardwarovém a softwarovém vybavení.
Rozdělení
Big Data se definují čtyřmi dimenzemi. První je objem (volume).
To jsou data, co se nepohybují, ale narůstají obrovským tempem. Bylo již zmíněno v úvodu práce, že tempo růstu objemu dat je rychlejší každým rokem, a do roku 2020 bude ze současných 8000 exabajtů až 35000 exabajtů dat na světě.
Druhou dimenzí je rychlost (velocity). Míněna je rychlost dat a jejich pohybu, vytváření, hromadění a zpracování. Streamovaná data s milisekundovou odezvou, real-time komunikační odezvy a informace.
Třetí dimenze je typ (variety). Data v mnoha různých formách. Strukturovaná, nestrukturovaná, textová a multimediální.
Čtvrtá dimenze je věrohodnost (veracity). Tuto dimenzi přidala společnost IBM pro lepší a přesnější definování Big Data. Nejistá data jsou z důvodů nekonzistence, věrohodnosti či neúplnosti. Při analyzování veškerých dat kolem nás musíme s určitou mírou nevěrohodnosti počítat. V některých zdrojích je jako čtvrtá dimenze uváděna hodnota (value), ve smyslu hodnoty pro podnik a lepší byznys modely.