- Stahuj zápisky z přednášek a ostatní studijní materiály
- Zapisuj si jen kvalitní vyučující (obsáhlá databáze referencí)
- Nastav si své předměty a buď stále v obraze
- Zapoj se svojí aktivitou do soutěže o ceny
- Založ si svůj profil, aby tě tví spolužáci mohli najít
- Najdi své přátele podle místa kde bydlíš nebo školy kterou studuješ
- Diskutuj ve skupinách o tématech, které tě zajímají
Studijní materiály
Zjednodušená ukázka:
Stáhnout celý tento materiálUVOD-prednaska
Nevhodné OLTP
- Decentralizovanost systémů OLTP
Data jsou většinou uložena v různých DB na různých místech, není většinou k dispozici integrovaný zdroj údajů a je velmi složité tato data integrovat
Nehomogenní struktura údajů – různé názvy, datové typy…
Multidimenzionální databáze
Některé výpočty, které by se opakovaně prováděly, jsou spočteny dopředu a uloženy
Obsahuje především nenormalizované tabulky
Tabulky faktů – obsahují velké množství dat
Tabulky dimenzí – nenormalizované, menší množství dat
Hlavní výhody
Rychlý přístup k velkému objemu dat
Možnost komplexních analýz – pohled na data z různých úrovní abstrakce
Dobré schopnosti pro modelování
Nevýhody
Vyšší nároky na kapacitu úložiště – redundance dat
Problémy při změně některé z dimenzí – nutnost přepočítat agregovaná data
Multidimenzionální databáze - kostka
Kostka (krychle) = ekvivalent tabulky v relační DB
Pro její výpočet je nutné velké množství výpočtů
Může mít i více než tři dimenze
Pomocí průniků jednotlivých dimenzí lze získat údaje (např. za určité časové období nebo určitý region)
Operační DB – uložení dat do systému, jejich správa
Informační DB – využití (analýza) uložených dat
např.: zjištění, které produkty se nejlépe prodávají
Co je to datový sklad?
Strukturované úložiště údajů
Definice:
Databáze sloužící k podpoře rozhodování, která je uložena odděleně od operační databáze
Klasický vs. Datový sklad
Klas.: Ukládáme za účelem rychlé expedice
Dat.: Ukládáme za co nejdelší období…
Znaky datových skladů
Subjektová orientace
Data jsou organizována podle hlavních subjektů (zákazník, výrobek, apod.)
Integrovanost
Údaje týkající se konkrétního předmětu se ukládají pouze jednou -> jednotná terminologie, jednotky veličin
Časová variabilita
Čas = klíčový atribut
Časový horizont datového skladu je zpravidla podstatně delší než u operační databáze
Operační databáze: pouze současně aktuální data
Data v datovém skladu: poskytují informace z historické perspektivy (např. posledních 5-10 let)
Každá klíčová struktura v datovém skladu
obsahuje časový element
ale klíč u operačních dat nemusí vždy obsahovat časový element
Neměnnost
Fyzicky oddělené uložení dat transformovaných z operačních databází
V datových skladech se data většinou nemění ani neodstraňují, jen se přidávají – manipulace s daty je tedy jednodušší.
Jen dva typy operací: vkládání dat a přístup k datům
Klasicka db vs datovy sklad slajd c.37
Zdrojová data
Produkční data
Data získaná z různých operačních DB podniku pomocí jednoznačných dotazů
Interní data
Data uložená v privátních souborech (zpravidla XLS) zaměstnanců organizace
Archivní data
Jeden ze základních předpokladů úspěšné analýzy – jde většinou o velká kvanta dat
Externí data
Data z různých zdrojů, která mohou být pro organizaci užitečná
Místo přípravy dat
Místo, kde probíhá tzv. příprava údajů – fáze ETL (mezistupeň mezi vstupními daty a datovým skladem)
Může být i součástí datového skladu
Místo speciálně k tomuto účelu určené
Uložení dat
Jde o oddělené „skladiště“ pro uložení velkého množství především historických dat
Je navrženo pro analýzu, ne pro rychlý přístup k datům
Předání informace
Poskytuje informace pro různé uživatele
Začínající uživatelé: tiskové sestavy, jednoduché dotazy
Běžní uživatelé: statistická analýza, různá zobrazení dat, předdefinované dotazy
Pokročilí uživatelé: provádí multidimenzionální analýzu, formuluje vlastní OLAP dotazy, používá exekutivní IS (data mining…)
Schéma predani informaci slajd c.47
Složka managementu a správy
Je nadřazena všem ostatním součástem datového skladu
Slouží ke koordinaci jednotlivých složek datového skladu
K běhu datového skladu používá informace uložené v metadatech
Nejdůležitější funkce
monitoring všech operací s datovým skladem
ošetření a zotavení po chybách
extrakce dat ze zdroje pro účely aktualizace datového skladu
kontrola správnosti transformace dat
zajištění správné funkce při získávání informací
zajištění bezpečnosti dat a autorizace uživatelů
Metadata
Uchovává následující „data popisující data“
informace o datových strukturách, souborech, adresách atd. (datový slovník)
informace o datech v databázi (katalog)
Jedna z klíčových částí datového skladu
Typy metadat
Operační metadata
obsahují informace o všech zdrojích dat pro datový sklad (struktura, umístění atd.)
Metadata o extrakci a transformaci
informace o tom, jaké metody byly použity při ETL fázi, různá omezení apod.
Metadata pro koncového uživatele
informace o datovém skladu a datech v něm, další obchodní a jiné informace, které může využít pro analýzu (Zlaté stránky…)
Obsah metadat
Je zde uloženo:
Popis struktury datového skladu
schéma, dimenze, hierarchie, umístění a obsah datových trhů
Operační metadata
historie (původ) dat, monitorovací informace (statistiky, chyby apod.), stav dat (archivní, aktuální)
Algoritmy používané pro sumarizaci
Mapování z operačního prostředí do datového skladu
Data týkající se činnosti systému
schéma skladu, odvozená data
Obchodní data
Fakta a dimenze
Každá datová kostka obsahuje 2 typy údajů – fakta a dimenze
FAKTA
Největší tabulka v DB, zpravidla jen jedna
Obsahuje numerické měrné jednotky obchodování
V kombinaci s tabulkami dimenzí tvoří určitá schémata
DIMENZE
logicky nebo hierarchicky uspořádané údaje
textové popisy obchodování
jsou menší a nemění se tak často
nejčastěji: časové, geografické a produktové dimenze (stromové struktury)
Schémata tabulek dimenzí
Schéma hvězdy (Star schema)
Tabulka faktů obsahuje cizí klíče do tabulky dimenzí, ty se vztahují k jejím primárním klíčům
Tabulky dimenzí jsou však nejsou normalizované, je to tedy poměrně pomalé
ARCHITEKTURA-prednaska
Získání dat - technická architektura
Zdroje dat
většinou relační DB, pro přenos do místa přípravy nutno konvertovat na dočasný soubor
Dočasné soubory
pro každý zdroj dat je jeden soubor, tyto soubory se poté slučují do jednoho
Místo přípravy dat
soubory ve formátu vhodném pro nahrávání do datového skladu
Získání dat – funkce a služby
Extrakce dat
nalezení zdrojů dat, „filtrování“ jednotlivých zdrojů
generování dočasných souborů s daty
transport souborů z různých platforem
přeformátování vstupů z vnějších zdrojů, popř. z jednotlivých databází v rámci podniku
Transformac
Vloženo: 28.04.2009
Velikost: 154,50 kB
Komentáře
Tento materiál neobsahuje žádné komentáře.
Mohlo by tě zajímat:
Skupina předmětu DS_2 - Datové sklady
Reference vyučujících předmětu DS_2 - Datové sklady
Podobné materiály
- ZPE - Základy podnikové ekonomiky - Výtah ze skript
- ZEP - Základy ekonomiky podniku - skripta výtah
- Bep1P - Ekonomika podniku 1 - výtah z přednášek
- KzpP - Základy práva - Občanský zákoník - výtah paragrafů
- I1 - Informatika 1 - Zápisky ze cvik a přednášek
- VM - Výpočetní metody - výpisky z přednášek
- KA - Knihovnické aplikace - Soubor přednášek z KA
- ZPC - Základy PC - Soubor přednášek
- AP_1 - Algoritmizace a programovací techniky - Soubor přednášek
- DS_2 - Datové sklady - Soubor přednášek co bdue na testu
- Bmak1P - Makroekonomie 1 - Makro - výpisky z přednášek a skript
Copyright 2024 unium.cz