Šablona:Článek týdne/2022/22
Data mining (dobývání znalostí z databází) je netriviální proces poznávání platných, dosud neznámých, potenciálně užitečných a srozumitelných vzorů v datech. Data mining je nejrychleji rostoucím segmentem business intelligence. Dle definice TDKIV se jedná o technologie vyhledávání, modelování a prezentace předem neznámých informací, příp. znalostí a vztahů mezi daty v rozsáhlých databázích a datových skladech. Analýzy se odvozují přímo z obsahu dat, nikoliv na základě hypotéz či dotazů uživatele. Využívají se techniky umělé inteligence (neuronové sítě, rozpoznávání či samoučící se algoritmy), jež mohou být kombinovány s technikami statistického a matematického modelování (klasifikační pravidla nebo stromy, regrese a shluková analýza) a s nástroji OLAP. S pomocí data miningu se snažíme z ukládaných dat získat složitější a užitečnější informace než jen grafy a základní přehledy. Ze statistického úhlu pohledu se jedná o hledání korelací, tedy vyšetřování vzájemných vztahů nebo vzorů v datech. Smyslem je tedy analyzovat datové závislosti či určit trendy a pokud to typ dat umožňuje, předpovědět budoucí vývoj.