Datavarehus | Hva er et datavarehus?

28.08.2022 | 2 min lesetid
Emneknagg: #datavarehus

Datavarehus er velegnet for å støtte rapportering med data fra mange kilder. Datavarehus søker å organisere data på en tematisk rettet måte, slik at dataene er strukturert og egner seg for analytisk behandling. Et datavarehus brukes til å samle relevante data som trengs for ulike styringsformål.

I datavarehuset lagres data gjerne flere ganger
I datavarehuset lagres data gjerne flere ganger

“A warehouse is a subject-oriented, integrated, time-variant and non-volatile collection of data in support of management’s decision making process”

 

Bill Inmon (ofte omtalt som datavarehus-konseptets grunnlegger)

Datavarehuset kan bygges på ulike prinsipper

Datavarehusets formål kan i noen virksomheter ha som mål å ivareta organisasjonens totale kunnskap, uten å vurdere det analytiske behovet (Inmon-modellen). Andre ganger bygger man mer målrettede datavarehus for å kunne betjene et bestemt formål – for eksempel Kundefrafallsanalyse, Prosjektrapportering eller Lønnsomhet/ABC (Kimball-modellen). Sistnevnte omtales ofte som Data Marts.

Vanligvis inneholder datavarehuset sammenstilte data fra mange kildesystemer og en viktig oppgave er å sikre tilstrekkelig datakvalitet slik at man får et pålitelig underlag for analyser og rapporter. Datavarehus inneholder ofte både rådataene og de ferdig transformerte dataene i en felles datamodell. Fordi mange fagsystem ikke tar vare på historikk er dette ofte også datavarehusets oppgave. Skal man finne trender og bygge prognoser/scenarier er god historikk en forutsetning.

Det finnes mange typer datavarehus, både virtuelle (kun logisk definerte, der informasjonen befinner seg i respektive kilder) og fysiske. Forvirrende nok kan datavarehuset kan gjerne bygges på tradisjonelle relasjonsdatabaser eller spesialiserte datavarehusmotorer. Vi transformerer dataene i flere omganger til en form som gjør det enkelt å lage rapporter og analyser.

Datavarehus har et oppsett der vi har et ett eller flere lag med data prosessert for å lagres i en felles datamodell, og så data prosessert og lagret for ulike formål på toppen. Vi lagrer data i hvert fall dobbelt i en slik modell, både i rådatalaget og i den felles datamodellen. Dette kan gi økt kostnad, men vil kunne gi god ytelse for brukerne når data skal hentes ut.

Datavarehusets fordeler og ulemper

Nedenfor oppsummerer vi noen viktige fordeler og ulemper ved å bruke et datavarehus for lagring til rapportering og analyse:

Fordeler
  • Er en effektiv måte å levere innsikt til vanlige brukere gjennom selvbetjent analyse, rapporter og dashboard - også kjent som Business Intelligence
  • Bidra til å skape en sannhet for data gjennom en felles lagringsløsning
  • Kan bidra til å forbedre datastandardisering og datakvalitet
Ulemper
  • Relativt begrensede muligheter til å håndtere semi-strukturerte og ustrukturerte data
  • Innhenting og modellering av nye datakilder kan ta tid, og kan oppleves for analytikere og data scientists som tungrodd og tidkrevende – disse ønsker mer fleksibilitet
  • Krever modellering i stor grad up-front, som kan oppleves som en investering. Kan være kostbart å implementere og vedlikeholde


Magne Bakkeli

Magne har over 20 års erfaring som rådgiver, arkitekt og prosjektleder innen data & analytics, og forstår godt forretningsmessige og tekniske problemstillinger.