- Stahuj zápisky z přednášek a ostatní studijní materiály
- Zapisuj si jen kvalitní vyučující (obsáhlá databáze referencí)
- Nastav si své předměty a buď stále v obraze
- Zapoj se svojí aktivitou do soutěže o ceny
- Založ si svůj profil, aby tě tví spolužáci mohli najít
- Najdi své přátele podle místa kde bydlíš nebo školy kterou studuješ
- Diskutuj ve skupinách o tématech, které tě zajímají
Studijní materiály
Zjednodušená ukázka:
Stáhnout celý tento materiálúdaje, textové popisy obchodování, nejčastěji časové, geografické (kontinent, země, kraj, město)(rok, kvartál, měsíc, týden)
vlastnosti tabulky dimenzí – unikátní primární klíč, tabulka je široká, textové atributy, nemusí být relace mezi atributy, není normalizovaná, možnost více hierarchií
Schémata tabulek dimenzí – hvězdicové schéma – tabulka faktů obsahuje cizí klíče do tabulky dimenzí, ty se vztahují k jejím primárním klíčům, snadno pochopitelné, tabulky dimenzí nejsou normalizované, je to tedy celkem pomalé; výhody: jednoduché, umožňuje optimalizaci navigace, vhodné pro použití dotazů
schéma sněhové vločky – některé dimenze jsou složeny z mnoha relačně svázaných tabulek, rychlejší zavedení údajů, nižší dotazovací výkon
model souhvězdí – slouží pro aplikace vyžadující více tabulek faktů, sdílení tabulek dimenzí více tabulkami faktů, jde spíše o spojení více hvězdic do jednoho schématu
Hyperkostky – problém: více než tři dimenze – uložení dat ve skladu není problém, to je až zobrazení výsledků OLAP analýzy
Architektura DS – tři hlavní oblasti – získání dat (zdrojová data+ místo přípravy dat), uložení dat (DS + datové trhy + uložení metadat), získání informací (kostky, OLAP, data mining)
Získání dat – zdrojová data -> extrakce dat -> místo přípravy dat -> transformace dat
Extrakce dat – přeformátovaní vstupů z vnějších zdrojů, generování dočasných souborů s daty
Transformace dat – mapování vstupních dat na data v datovém skladu, čištění dat, konverze datových typů, vyřešení chybějících hodnot
Příprava dat – záloha dat, řazení a slučování souborů, vytvoření primárních a cizích klíčů pro nahrávaná data
Uložení dat – většinou se využívá relačních databází, funkce a služby: podpora nahrávání dat do více tabulek, optimalizace procesu nahrávání dat, záloha dat a zotavení po chybě, bezpečnost dat
Získání informací – funkce a služby: poskytnutí bezpečnosti přístupu k informacím, umožnění procházení dat uživatelem, poskytnutí komplexní OLAP analýzy
ETL : hlavní cíl: centralizace údajů, aby v datovém skladu byla dostatečně kvalitní data
Hlavní úkoly – určení, které daty se mají uložit do skladu, určit zdroje dat, stanovení pravidel pro extrakci dat,
Metody přímé extrakce – liší se způsobem zachycení změn v DB od posledního nahrání – zachycení pomocí log souborů, databázových triggerů, pomocí samotných databázových aplikací
Metody odložené extrakce – nezachycují změny při jejich vzniku, ale až při nahrávání se porovnává zdrojová a cílová DB – zachycení pomocí časových razítek, zachycení pomocí porovnávání souborů
Transformace – cílem je zvýšení kvality vstupních dat, často je potřeba odstranit anomálie (přechod z DOS na WIN, překlepy, chyby)
problémy: nejednoznačnost údajů (různě uložené informace pro stejnou věc – pohlaví M, muž, Muž…), chybějící hodnoty, duplicitní hodnoty, nesjednocená terminologie, různé peněžní měny, formáty čísel a textových řetězců, chybějící datum
typické úkoly: selekce (výběr vhodných dat), rozdělování/spojování (více záznamů z různých zdrojů), konverze, sumarizace
typy transformace: revize formátu dat, dekódování polí, výpočet odvozených polí, rozdělení polí na části, sloučení informací, reduplikace, konverze jednotek
Nahrávání dat – typy: iniciální nahrávání (všechna data do prázdné
Vloženo: 28.04.2009
Velikost: 47,50 kB
Komentáře
Tento materiál neobsahuje žádné komentáře.
Mohlo by tě zajímat:
Skupina předmětu DS_2 - Datové sklady
Reference vyučujících předmětu DS_2 - Datové sklady
Podobné materiály
- DM - Diskrétní matematika - Tahák
- FP - Finance podniku - Tahák
- MA2 - Matematika 2 - Tahák
- MA2 - Matematika 2 - Tahák.doc
- MAK - Makroekonomie - Taháky ke Groligové (2)
- MAK - Makroekonomie - Taháky ke Groligové
- MIK - Mikroekonomie - tahák na teorii (2)
- MIK - Mikroekonomie - Tahák na teorii
- OOPP - Občanské, obchodní a pracovní právo - Tahák na zkoušku 38 otázek
- OOPP - Občanské, obchodní a pracovní právo - Tahák na zkoušku 38.otázek
- PS - Pravděpodobnostní statistika - Malej tahák (2)
- PS - Pravděpodobnostní statistika - Malej tahák
- PS - Pravděpodobnostní statistika - Tahák na teorii (2)
- PS - Pravděpodobnostní statistika - Tahák na teorii
- PSI - Počítačové sítě - Aktualizovaný tahák na PSI
- RPV - Řízení projektů vývoje IT/IS - Tahák
- VM - Výpočetní metody - Tahák
- ZEP - Základy ekonomiky podniku - Tahák na zápočet
- ZK - Základy komunikace - Tahák ke zkoušce
- ZM2 - Parametrické modelování - Pro/Engineer - Tahák na ZK
- ZOR - Základy optimalizace a rozhodování - Tahák na zkoušku teorie final salec
- MAK - Makroekonomie - Tahák na zkoušku (2)
- MAK - Makroekonomie - Tahák na zkoušku
- VPU - Vnitropodnikové účetnictví - Účetnictví zimní semestr tahák
- MAK - Makroekonomie - Tahák na zkoušku
- Bmik1P - Mikroekonomie 1 - tahák na cviko
- Kmik1P - Mikroekonomie 1 - tahák
- KfuP - Finanční účetnictví - tahák
- KstatP - Statistika - tahák
- BpisP - Podnikové IS - Kompletní tahák
- BpisP - Podnikové IS - tahák
Copyright 2024 unium.cz