Hva er et datavarehus?

28.08.2022 | 2 min lesetid
Emneknagg: #datavarehus

Datavarehus er velegnet for å støtte rapportering med data fra mange kilder. Datavarehus søker å organisere data på en tematisk rettet måte, slik at dataene er strukturert og egner seg for analytisk behandling. Et datavarehus brukes til å samle relevante data som trengs for ulike styringsformål.

Datavarehus
Datavarehus

“A warehouse is a subject-oriented, integrated, time-variant and non-volatile collection of data in support of management’s decision making process”

 

Bill Inmon (ofte omtalt som datavarehus-konseptets grunnlegger)

Datavarehusets formål kan i noen virksomheter ha som mål å ivareta organisasjonens totale kunnskap, uten å vurdere det analytiske behovet (Inmon-modellen). Andre ganger bygger man mer målrettede datavarehus for å kunne betjene et bestemt formål – for eksempel Kundefrafallsanalyse, Prosjektrapportering eller Lønnsomhet/ABC (Kimball-modellen). Sistnevnte omtales ofte som Data Marts.

Vanligvis inneholder datavarehuset sammenstilte data fra mange kildesystemer og en viktig oppgave er å sikre tilstrekkelig datakvalitet slik at man får et pålitelig underlag for analyser og rapporter. Datavarehus inneholder ofte både rådataene og de ferdig transformerte dataene i en felles datamodell. Fordi mange fagsystem ikke tar vare på historikk er dette ofte også datavarehusets oppgave. Skal man finne trender og bygge prognoser/scenarier er god historikk en forutsetning.

Det finnes mange typer datavarehus, både virtuelle (kun logisk definerte, der informasjonen befinner seg i respektive kilder) og fysiske. Forvirrende nok kan datavarehuset kan gjerne bygges på tradisjonelle relasjonsdatabaser eller spesialiserte datavarehusmotorer. Vi transformerer dataene i flere omganger til en form som gjør det enkelt å lage rapporter og analyser.

Datavarehus har et oppsett der vi har et ett eller flere lag med data prosessert for å lagres i en felles datamodell, og så data prosessert og lagret for ulike formål på toppen. Vi lagrer data i hvert fall dobbelt i en slik modell, både i rådatalaget og i den felles datamodellen. Dette kan gi økt kostnad, men vil kunne gi god ytelse for brukerne når data skal hentes ut.

Nedenfor oppsummerer vi noen viktige fordeler og ulemper ved å bruke et datavarehus for lagring til rapportering og analyse:

Fordeler
  • Er en effektiv måte å levere innsikt til vanlige brukere gjennom selvbetjent analyse, rapporter og dashboard Business Intelligence
  • Bidra til å skape en sannhet for data gjennom en felles lagringsløsning
  • Kan bidra til å forbedre datastandardisering og datakvalitet
Ulemper
  • Relativt begrensede muligheter til å håndtere semi-strukturerte og ustrukturerte data
  • Innhenting og modellering av nye datakilder kan ta tid, og kan oppleves for analytikere og data scientists som tungrodd og tidkrevende – disse ønsker mer fleksibilitet
  • Krever modellering i stor grad up-front, som kan oppleves som en investering. Kan være kostbart å implementere og vedlikeholde


author image

Magne Bakkeli

Magne har over 20 års erfaring som rådgiver, arkitekt og prosjektleder innen data & analytics. Han er god til å navigere i både forretningsmessige og tekniske problemstillinger, og jobber like godt med konsernledelsen som IT-avdelingen.