- Stahuj zápisky z přednášek a ostatní studijní materiály
- Zapisuj si jen kvalitní vyučující (obsáhlá databáze referencí)
- Nastav si své předměty a buď stále v obraze
- Zapoj se svojí aktivitou do soutěže o ceny
- Založ si svůj profil, aby tě tví spolužáci mohli najít
- Najdi své přátele podle místa kde bydlíš nebo školy kterou studuješ
- Diskutuj ve skupinách o tématech, které tě zajímají
Studijní materiály
Zjednodušená ukázka:
Stáhnout celý tento materiálúdaje, textové popisy obchodování, nejčastěji časové, geografické (kontinent, země, kraj, město)(rok, kvartál, měsíc, týden)
vlastnosti tabulky dimenzí – unikátní primární klíč, tabulka je široká, textové atributy, nemusí být relace mezi atributy, není normalizovaná, možnost více hierarchií
Schémata tabulek dimenzí – hvězdicové schéma – tabulka faktů obsahuje cizí klíče do tabulky dimenzí, ty se vztahují k jejím primárním klíčům, snadno pochopitelné, tabulky dimenzí nejsou normalizované, je to tedy celkem pomalé; výhody: jednoduché, umožňuje optimalizaci navigace, vhodné pro použití dotazů
schéma sněhové vločky – některé dimenze jsou složeny z mnoha relačně svázaných tabulek, rychlejší zavedení údajů, nižší dotazovací výkon
model souhvězdí – slouží pro aplikace vyžadující více tabulek faktů, sdílení tabulek dimenzí více tabulkami faktů, jde spíše o spojení více hvězdic do jednoho schématu
Hyperkostky – problém: více než tři dimenze – uložení dat ve skladu není problém, to je až zobrazení výsledků OLAP analýzy
Architektura DS – tři hlavní oblasti – získání dat (zdrojová data+ místo přípravy dat), uložení dat (DS + datové trhy + uložení metadat), získání informací (kostky, OLAP, data mining)
Získání dat – zdrojová data -> extrakce dat -> místo přípravy dat -> transformace dat
Extrakce dat – přeformátovaní vstupů z vnějších zdrojů, generování dočasných souborů s daty
Transformace dat – mapování vstupních dat na data v datovém skladu, čištění dat, konverze datových typů, vyřešení chybějících hodnot
Příprava dat – záloha dat, řazení a slučování souborů, vytvoření primárních a cizích klíčů pro nahrávaná data
Uložení dat – většinou se využívá relačních databází, funkce a služby: podpora nahrávání dat do více tabulek, optimalizace procesu nahrávání dat, záloha dat a zotavení po chybě, bezpečnost dat
Získání informací – funkce a služby: poskytnutí bezpečnosti přístupu k informacím, umožnění procházení dat uživatelem, poskytnutí komplexní OLAP analýzy
ETL : hlavní cíl: centralizace údajů, aby v datovém skladu byla dostatečně kvalitní data
Hlavní úkoly – určení, které daty se mají uložit do skladu, určit zdroje dat, stanovení pravidel pro extrakci dat,
Metody přímé extrakce – liší se způsobem zachycení změn v DB od posledního nahrání – zachycení pomocí log souborů, databázových triggerů, pomocí samotných databázových aplikací
Metody odložené extrakce – nezachycují změny při jejich vzniku, ale až při nahrávání se porovnává zdrojová a cílová DB – zachycení pomocí časových razítek, zachycení pomocí porovnávání souborů
Transformace – cílem je zvýšení kvality vstupních dat, často je potřeba odstranit anomálie (přechod z DOS na WIN, překlepy, chyby)
problémy: nejednoznačnost údajů (různě uložené informace pro stejnou věc – pohlaví M, muž, Muž…), chybějící hodnoty, duplicitní hodnoty, nesjednocená terminologie, různé peněžní měny, formáty čísel a textových řetězců, chybějící datum
typické úkoly: selekce (výběr vhodných dat), rozdělování/spojování (více záznamů z různých zdrojů), konverze, sumarizace
typy transformace: revize formátu dat, dekódování polí, výpočet odvozených polí, rozdělení polí na části, sloučení informací, reduplikace, konverze jednotek
Nahrávání dat – typy: iniciální nahrávání (všechna data do prázdné
Vloženo: 28.04.2009
Velikost: 45,50 kB
Komentáře
Tento materiál neobsahuje žádné komentáře.
Mohlo by tě zajímat:
Skupina předmětu DS_2 - Datové sklady
Reference vyučujících předmětu DS_2 - Datové sklady
Podobné materiály
- ZOR - Základy optimalizace a rozhodování - Tahák na zkoušku teorie final salec
- DFM - Datové a funkční modelování - Něco málo teorie
- UI - Účetní informatika - Nějaká teorie do UI na zápočet
- UI - Účetní informatika - Teorie na zápich u Staňkový
- DBS - Databázové systémy - Zkouška teorie
- PS - Pravděpodobnostní statistika - Úkoly a teorie
- PS - Pravděpodobnostní statistika - Úkoly teorie
- VF - Veřejné finance - 3. přednáška - Kořeny a vývoj teorie veřejných financí
- VF - Veřejné finance - 6. přednáška - Základy daňové teorie
- MIK - Mikroekonomie - 7. Alternativní teorie firmy
- MIK - Mikroekonomie - 7. - Alternativní teorie firmy
- U1_1 - Základy účetnictví - teorie rezervy
- Bep1P - Ekonomika podniku 1 - teorie
- Bep1P - Ekonomika podniku 1 - teorie 2
- Bep1P - Ekonomika podniku 1 - teorie 3
- KstatP - Statistika - otázky ke zkoušce (teorie)
- BfpP - Finance podniku - Teorie ke ZK
- KfuP - Finanční účetnictví - teorie
- KstatP - Statistika - teorie
- ZK - Základy komunikace - Tahák ke zkoušce
- DFM - Datové a funkční modelování - Vše potřebné ke zkoušce
- FA - Finanční analýza a plánování - Materiál ke zkoušce (2)
- FA - Finanční analýza a plánování - Materiál ke zkoušce
- MIK - Mikroekonomie - Všechny otázky ke zkoušce z mikra (2)
- MIK - Mikroekonomie - Všechny otázky ke zkoušce z mikra
- PS - Pravděpodobnostní statistika - Vypočtený souhrn ke zkoušce 1
- PS - Pravděpodobnostní statistika - Vypočtený souhrn příkladů ke zkoušce 1
- PM - Podnikový management - 100 otázek ke zkoušce
- PM - Podnikový management - Něco málo ke zkoušce
- PPV - Právo prům. vlastnictví a inf. v podnikání - Otázky ke zkoušce z PPV
- ZEP - Základy ekonomiky podniku - Trochu infa ke zkoušce ZEP
- ZF - Základy financování - Otázky ke zkoušce
- ZPC - Základy PC - postup ke zkoušce z 12.1.06
- VPU - Vnitropodnikové účetnictví - Vypracované otázky ke zkoušce
- RPV - Řízení projektů vývoje IT/IS - Otázky ke zkoušce
- DSZ - Daňové systémy v zahraničí - Příklady ke zkoušce
- DS_2 - Datové sklady - Něco málo ke zkoušce
- MAK - Makroekonomie - Výcuc z důležitých pojmů ke zkoušce
- MA1 - Matematika 1 - Vypočítané příklady ke zkoušce
- KstatP - Statistika - příklady ke zkoušce
Copyright 2025 unium.cz


