Datavarehus | Hva er et datavarehus?

28.08.2022 | 4 min lesetid
Emneknagg: #datavarehus

Datavarehus er velegnet for å støtte rapportering med data fra mange kilder. Datavarehus søker å organisere data på en tematisk rettet måte, slik at dataene er strukturert og egner seg for analytisk behandling. Et datavarehus brukes til å samle relevante data som trengs for ulike styringsformål.

I datavarehuset lagres data gjerne flere ganger
I datavarehuset lagres data gjerne flere ganger

“A warehouse is a subject-oriented, integrated, time-variant and non-volatile collection of data in support of management’s decision making process”

 

Bill Inmon (ofte omtalt som datavarehus-konseptets grunnlegger)

Datavarehuset kan bygges på ulike prinsipper

Datavarehusets formål kan i noen virksomheter ha som mål å ivareta organisasjonens totale kunnskap, uten å vurdere det analytiske behovet (Inmon-modellen). Andre ganger bygger man mer målrettede datavarehus for å kunne betjene et bestemt formål – for eksempel Kundefrafallsanalyse, Prosjektrapportering eller Lønnsomhet/ABC (Kimball-modellen). Sistnevnte omtales ofte som Data Marts.

Vanligvis inneholder datavarehuset sammenstilte data fra mange kildesystemer og en viktig oppgave er å sikre tilstrekkelig datakvalitet slik at man får et pålitelig underlag for analyser og rapporter. Datavarehus inneholder ofte både rådataene og de ferdig transformerte dataene i en felles datamodell. Fordi mange fagsystem ikke tar vare på historikk er dette ofte også datavarehusets oppgave. Skal man finne trender og bygge prognoser/scenarier er god historikk en forutsetning.

Det finnes mange typer datavarehus, både virtuelle (kun logisk definerte, der informasjonen befinner seg i respektive kilder) og fysiske. Forvirrende nok kan datavarehuset kan gjerne bygges på tradisjonelle relasjonsdatabaser eller spesialiserte datavarehusmotorer. Vi transformerer dataene i flere omganger til en form som gjør det enkelt å lage rapporter og analyser.

Datavarehus har et oppsett der vi har et ett eller flere lag med data prosessert for å lagres i en felles datamodell, og så data prosessert og lagret for ulike formål på toppen. Vi lagrer data i hvert fall dobbelt i en slik modell, både i rådatalaget og i den felles datamodellen. Dette kan gi økt kostnad, men vil kunne gi god ytelse for brukerne når data skal hentes ut.

Vanlige use case for datavarehus

Datavarehus benyttes ofte for å støtte generering av detaljerte rapporter baserte på strukturerte data av høy kvalitet. Denne typen dataplattformer er mye brukt av ledere, forretningsanalytikere og operative brukere der det er behov for data som raskt kan gi svar på vanlige forretningsspørsmål, eller som grunnlag til faste rapporter og dashboards. Dataene er godt strukturerte, lette å forstå og enkle å ta bruk uten videre behandling. Dataene kommer gjerne fra forretningssystemer som mange bruker, som økonomi- eller CRM-systemet.

Her er noen eksempler på bruk av datavarehus i ulike bransjer:

  • Detaljhandel: Datavarehus brukes til å analysere salgstrender over tid, identifisere sesongmessige variasjoner i etterspørsel, og optimalisere lagerbeholdningen basert på forutsigbar kundeatferd.
  • Bank og finans: Datavarehus hjelper med å analysere kundeporteføljer, spore transaksjonshistorikk for å oppdage mistenkelig aktivitet, og evaluere kredittrisiko basert på historiske data.
  • Helsevesenet: Institusjoner bruker datavarehus for å analysere pasientdata, forbedre pasientomsorgen gjennom mønsteravkjenning, og optimalisere ressursallokeringen over ulike avdelinger og fasiliteter.

Hva er data marts - eller datatorg på norsk?

Når det kommer til diskusjoner om datavarehus, kan du høre begrepet data mart - eller datatorg på norsk. Et data mart er en undergruppe av et datavarehus som er fokusert på en spesifikk forretningslinje eller et spesielt emne. For eksempel bruker markedsføringsteam ofte et data mart for kundedata siden de trenger rask tilgang til standardiserte kundedata.

Data marts blir vanligvis bygget som en utvidelse av et eksisterende datavarehus, men de kan også bygges opp som en selvstendig enhet. Prosessen følger hvordan datavarehus blir til, men med et mer spesialisert sluttresultat.

Datamodellering i et datavarehus

Dataene i et datavarehus er modellerte og klare til bruk. Begrepet datamodellering i en datavarehus-setting handler om å designe hvordan data vil bli lagret, organisert og tilgjengeliggjort. Målet er å sikre at data er strukturert på en måte som muliggjør effektiv analyse og rapportering.

Datamodeller er et grunnleggende element i et datavarehus. En datamodell er en beskrivelse av hvordan data er strukturert, og i hvilken form dataene vil bli lagret. En datamodell gir et rammeverk av relasjoner mellom dataelementene, i tillegg til en veiledning for bruk av dataene.

Dimensjonstabeller og faktatabeller er sentrale begreper innen datamodellering for et datavarehus. Dimensjonstabellene kan enkelt sagt beskrives som det som gir tallene kontekst (for eksempel “Kalender” eller “Lokasjon”), mens faktatabellene inneholder er selve nøkkeltallene (for eksempel “Omsetning”).

Trenger du en Data Engineer? Våre flinke konsulenter kan hjelpe deg med datamodellering, dataflyt og data-arkitektur.

 

Datavarehusets fordeler og ulemper

Nedenfor oppsummerer vi noen viktige fordeler og ulemper ved å bruke et datavarehus for lagring til rapportering og analyse:

Fordeler
  • Er en effektiv måte å levere innsikt til vanlige brukere gjennom selvbetjent analyse, rapporter og dashboard - også kjent som Business Intelligence
  • Bidra til å skape en sannhet for data gjennom en felles lagringsløsning
  • Kan bidra til å forbedre datastandardisering og datakvalitet
Ulemper
  • Relativt begrensede muligheter til å håndtere semi-strukturerte og ustrukturerte data
  • Innhenting og modellering av nye datakilder kan ta tid, og kan oppleves for analytikere og data scientists som tungrodd og tidkrevende – disse ønsker mer fleksibilitet
  • Krever modellering i stor grad up-front, som kan oppleves som en investering. Kan være kostbart å implementere og vedlikeholde


Magne Bakkeli

Magne har over 20 års erfaring som rådgiver, arkitekt og prosjektleder innen data & analytics, og forstår godt forretningsmessige og tekniske problemstillinger.