R - programovací jazyk

R je volně (zdarma) dostupný programovací jazyk. Je specializovaný hlavně na statické výpočty, statickou analýzu dat a jejich grafické zobrazení. Výstupem jsou tedy nejčastěji 2D a 3D grafy. Podporuje také matice a maticové výpočty stejně jako podobný MATLAB. R se stalo standardem v oblastech statistiky a jeho prostředí je stále rozšiřováno přímo uživateli eRka. Je tím myšleno rozšíření funkcí R - tzv. knihovny, nebo také balíčky (packages).

Balíčky/Packages

Sada základních balíčků je automaticky instalována společně s R. Dále je k dispozici více než 11 000 balíčků volně ke stáhnutí. Balíčky dat jsou prakticky funkce navíc, které jazyk rozšiřují o další možnosti. Jedná se například o nástroj na import či export dat, tvorba reportů, nebo speciálně vytvořené balíčky pro určitý druh projektu/projekt, ke kterému je R využíváno. Jsou k dispozici např. na stránkách Comprehensive R Archive Network (CRAN), Bioconductor (projekt, nabízí balíčky v oblasti pro analýzu genomických dat), GitHub, Omegahat...atd.

Programovací jazyk R je opravdu pouze jazyk, tzv. interpretovaný jazyk - tzn. přístup pomocí příkazového řádku (interpret). Potřebuje tedy nějaké grafické uživatelské rozhraní (GUI - Graphical User Interface) ve kterém může uživatel R s jazykem pracovat. Je možné ho instalovat na operační systémy UNIX, Windows i MacOS.

Grafické uživatelské rozhraní (GUI)

  • RKWard
  • RStudio (multiplatformní open-source IDE - Integrated Development Environmenty)
  • Deducer (pro analýzu dat)
  • JAVA GUI pro R - JGR
  • Rattle GUI
  • ReExcel (propojení aplikace Microsoft Excel s jazykem R)

Kladné vlastnosti

  • Silné objektově orientované programování na rozdíl od většiny ostatních statických počítačových jazyků.
  • Statická grafika díky které generuje grafy. Zahrnuje také matematické symboly.
  • Má svůj vlastní formát podobný LaTexu.
  • Kód je možné propojit s dalšími jazyky (C, C++, Fortram).

Důležité milníky

  • 1997 - Vznik poslední funkční verze jazyka R, který je vyvinut z jazyka S. Je jeho nástupce, akorát má svobodnou licenci na rozdíl od S.
  • Téhož roku se R stává oficiálně součástí projektu GNU (projekt zaměřený na svobodný software, inspirován OS unixového typu - OS se svobodnou licencí).
  • 2001 - První verze pro MacOS.
  • 2005 - Podpora kódování UTF-8 (způsob kódování znaků - zahrnuje čtení českých znaků) a počátky internacionalizace a lokace pro různé jazyky.
  • 2010 - Podpora pro 64 bitové MS Windows.

Datové struktury a typy

Datové struktury

Zahrnuje vektory, matice, datové rámce (tabulky podobné tabulkám v relačních databázích), listy (seznamy), pole, faktory. Neobsahuje skaláry, zde jsou reprezentovány jako vektory s délkou jedna.

Datové typy

Obsahuje základních 5 typů. Pokud si není uživatel jistý jaký typ dat vektor/tabulka/list obsahuje, může tuto informaci rychle zjistit pomocí funkce class()

  • 1. numeric
  • 2. integer
  • 3. complex
  • 4. logical
  • 5. character

Numeric

Reálná čísla - tzn. všechna kladná, záporná, celá i desetinná čísla. U desetinných čísel je třeba dávat pozor na psaní teček mezi číslicemi, nikoli čárek. Není to český program a tečky nepochopí. Při exportu českých dat, která čárky místo teček obsahují, není třeba vše v dokumentu přepisovat, stačí ve skriptu upozornit program pomocí funkce separated sep = " , ".

př.: > 1.234

Integer

celá čísla

Complex

Numerická hodnota je doplněna o komplexní jednotku. Např. i. Vždy musí obsahovat numerickou hodnotu i kdyby se jednalo o 1i.

př. : > 1 + 2i

Logical

Logické hodnoty - TRUE/FALSE nebo jen T/F. (Pozor! Jazyk R je citlivý na velká a malá písmena, proto logické hodnoty nelze psát jinak než uvedeným způsobem.) Logické hodnoty se používají pro některé argumenty funkcí, jsou výsledkem testování výrazů.[1]

př.:

> 2.3 > 3

[1] FALSE

Character

Slovní řetězce, které se používají pro textové hodnoty (popisky, názvy atd.). Řetězec musí být zadán do jednoduchých apostorfů ' nebo do dvojitých uvozovek ". př.: > r <- "retezec"

Zdroje

Použitá literatura

Reference