- Stahuj zápisky z přednášek a ostatní studijní materiály
- Zapisuj si jen kvalitní vyučující (obsáhlá databáze referencí)
- Nastav si své předměty a buď stále v obraze
- Zapoj se svojí aktivitou do soutěže o ceny
- Založ si svůj profil, aby tě tví spolužáci mohli najít
- Najdi své přátele podle místa kde bydlíš nebo školy kterou studuješ
- Diskutuj ve skupinách o tématech, které tě zajímají
Studijní materiály
Zjednodušená ukázka:
Stáhnout celý tento materiálRelační databáze – údaje uloženy ve 2D tabulkách
Primární klíč – jednoznačný identifikátor každého záznamu tabulky
Kandidátní klíč – má dvě časově nezávislé vlastnosti: jednoznačnost a minimalista
Důvod použití datových skladů? Potřeba získávat strategické informace z obrovského množství dat, které v nich nejsou přímo uvedeny a činit rozhodnutí na základě těchto informací
Business Inteligence – proces transformace údajů na informace a převod informací na poznatky pro koncového uživatele, velké množství dat na vstupu, výstupem bývají dosud poznatky, které lze využít v procesu rozhodování
prostředky BI – DS, OLAP analýza, Data mining
Nevhodnost běžných databází? Slouží především pro ukládání údajů, výhodné pro jednoduché transakce (vkládání, mazání), nevhodné pro složitější analýzy, velmi rozsáhlé výstupy, složité hledání souvislostí mezi výstupy, nejsou uchovávány historická data, pracuje se pouze s aktuálními daty
Multidimenzionální databáze – obsahuje především nenormalizované tabulky (rychlý přístup k datům), slouží jak podklad pro získání sumarizovaných a agregovaných údajů
+ rychlý přístup k datům, možnost komplexních analýz, dobré schopnosti pro modelování a prognózy
vyšší nároky na kapacitu úložiště, problémy při změně některé z dimenzí
kostka – ekvivalent tabulky v klasické databázi, pro její výpočet je nutné velké množství výpočtů, může mít i více než tři dimenze, získávání údajů za pomocí průniků jednotlivých dimenzí
operační DB – uložení dat do systému, Informační databáze – využití uložených dat
Datové sklady – jejich problémem je to, že je v nich obsaženo přísliš velké množství údajů, které samy o sobě nepřináší žádný užitek. Cílem DS tedy je převést údaje na informace a tyto informace poté použít na získání znalostí
DS je strukturované úložiště údajů, znaky DS: subjektová orientace (údaje jsou zapisovány podle předmětu zájmu), integrovanost (údaje týkající se konkrétního předmětu se ukládají pouze jednou, nutnost vyčištění, úpravy a sjednocení dat), časová variabilita (data jsou ukládána jako série snímků, jeden snímek reprezentuje jeden časový úsek), neměnnost (v DS se data většinou nemění, jen se přidávají nové)
Požadavky na DS: databáze musí být navržena pro analytické dotazy, možnost integrování dat z více aplikací, interaktivní a jednoduché využití bez lidí z IT, zpracování současných i historických dat
Schéma DS: získání údajů - > úprava a zavedení do DS -> analýza -> zpřístupnění uživatelům
Fáze ETL – místo, kde probíhá příprava údajů – mezistupeň mezi vstupními daty a datovým skladem, extrakce, transformace a loading – výsledkem jsou data připravená pro analýzu a je možné je uložit do DS
Metadata – uchovává data popisující data – informace a datových strukturách, souborech atd, jedna z klíčových oblastí DS, obs. Popis struktury DS, původ dat, stav dat, algoritmy používané pro sumarizaci, schémata skladu, obchodní pojmy
Každá datová kostka obsahuje dva typy údajů – fakta a dimenze.
Fakta – největší tabulka v DB, zpravidla jen jedna, v kombinaci s dimenzemi tvoří určitá schémata
- vlastnosti tabulky faktů: primární klíč je složený, data jsou závislé na dotazu, jednotky jsou vždy odvoditelné z dotazu (procenta např.), tabulka je rozsáhlá
Dimenze – logicky nebo hierarchicky uspořádané
Vloženo: 28.04.2009
Velikost: 47,50 kB
Komentáře
Tento materiál neobsahuje žádné komentáře.
Mohlo by tě zajímat:
Skupina předmětu DS_2 - Datové sklady
Reference vyučujících předmětu DS_2 - Datové sklady
Podobné materiály
- DM - Diskrétní matematika - Tahák
- FP - Finance podniku - Tahák
- MA2 - Matematika 2 - Tahák
- MA2 - Matematika 2 - Tahák.doc
- MAK - Makroekonomie - Taháky ke Groligové (2)
- MAK - Makroekonomie - Taháky ke Groligové
- MIK - Mikroekonomie - tahák na teorii (2)
- MIK - Mikroekonomie - Tahák na teorii
- OOPP - Občanské, obchodní a pracovní právo - Tahák na zkoušku 38 otázek
- OOPP - Občanské, obchodní a pracovní právo - Tahák na zkoušku 38.otázek
- PS - Pravděpodobnostní statistika - Malej tahák (2)
- PS - Pravděpodobnostní statistika - Malej tahák
- PS - Pravděpodobnostní statistika - Tahák na teorii (2)
- PS - Pravděpodobnostní statistika - Tahák na teorii
- PSI - Počítačové sítě - Aktualizovaný tahák na PSI
- RPV - Řízení projektů vývoje IT/IS - Tahák
- VM - Výpočetní metody - Tahák
- ZEP - Základy ekonomiky podniku - Tahák na zápočet
- ZK - Základy komunikace - Tahák ke zkoušce
- ZM2 - Parametrické modelování - Pro/Engineer - Tahák na ZK
- ZOR - Základy optimalizace a rozhodování - Tahák na zkoušku teorie final salec
- MAK - Makroekonomie - Tahák na zkoušku (2)
- MAK - Makroekonomie - Tahák na zkoušku
- VPU - Vnitropodnikové účetnictví - Účetnictví zimní semestr tahák
- MAK - Makroekonomie - Tahák na zkoušku
- Bmik1P - Mikroekonomie 1 - tahák na cviko
- Kmik1P - Mikroekonomie 1 - tahák
- KfuP - Finanční účetnictví - tahák
- KstatP - Statistika - tahák
- BpisP - Podnikové IS - Kompletní tahák
- BpisP - Podnikové IS - tahák
Copyright 2023 unium.cz. Abychom mohli web rozvíjet a dále vylepšovat podle preferencí uživatelů, shromažďujeme statistiky o návštěvnosti, a to pomocí Google Analytics a Netmonitor. Tyto systémy pro unium.cz zaznamenávají, které stránky uživatel na webové stránce navštívil, odkud se na stránku dostal, kam z ní odešel, jaké používá zařízení, operační systém či prohlížeč, či jaký má preferenční jazyk. Statistiky jsou anonymní, takže unium.cz nezná identitu návštěvníka a spravuje cookies tak, že neumožňuje identifikovat konkrétní osoby. Používáním webu vyjadřujete souhlas použitím cookies a následujících služeb: