
Hva er et datavarehus?
28.08.2022 | 2 min lesetidEmneknagg: #datavarehus
Datavarehus er velegnet for å støtte rapportering med data fra mange kilder. Datavarehus søker å organisere data på en tematisk rettet måte, slik at dataene er strukturert og egner seg for analytisk behandling. Et datavarehus brukes til å samle relevante data som trengs for ulike styringsformål.

“A warehouse is a subject-oriented, integrated, time-variant and non-volatile collection of data in support of management’s decision making process”
Bill Inmon (ofte omtalt som datavarehus-konseptets grunnlegger)
Datavarehusets formål kan i noen virksomheter ha som mål å ivareta organisasjonens totale kunnskap, uten å vurdere det analytiske behovet (Inmon-modellen). Andre ganger bygger man mer målrettede datavarehus for å kunne betjene et bestemt formål – for eksempel Kundefrafallsanalyse, Prosjektrapportering eller Lønnsomhet/ABC (Kimball-modellen). Sistnevnte omtales ofte som Data Marts.
Vanligvis inneholder datavarehuset sammenstilte data fra mange kildesystemer og en viktig oppgave er å sikre tilstrekkelig datakvalitet slik at man får et pålitelig underlag for analyser og rapporter. Datavarehus inneholder ofte både rådataene og de ferdig transformerte dataene i en felles datamodell. Fordi mange fagsystem ikke tar vare på historikk er dette ofte også datavarehusets oppgave. Skal man finne trender og bygge prognoser/scenarier er god historikk en forutsetning.
Det finnes mange typer datavarehus, både virtuelle (kun logisk definerte, der informasjonen befinner seg i respektive kilder) og fysiske. Forvirrende nok kan datavarehuset kan gjerne bygges på tradisjonelle relasjonsdatabaser eller spesialiserte datavarehusmotorer. Vi transformerer dataene i flere omganger til en form som gjør det enkelt å lage rapporter og analyser.
Datavarehus har et oppsett der vi har et ett eller flere lag med data prosessert for å lagres i en felles datamodell, og så data prosessert og lagret for ulike formål på toppen. Vi lagrer data i hvert fall dobbelt i en slik modell, både i rådatalaget og i den felles datamodellen. Dette kan gi økt kostnad, men vil kunne gi god ytelse for brukerne når data skal hentes ut.
Nedenfor oppsummerer vi noen viktige fordeler og ulemper ved å bruke et datavarehus for lagring til rapportering og analyse:
Fordeler |
---|
|
Ulemper |
---|
|