Udvikling og drift af prædiktive modeller


Når man er færdig med at bygge et solidt datafundament, som gør det muligt at få fat i nøjagtige data på en nem måde, er man klar til at dykke ned i dataene og få nogle handlekraftige indsigter ud af sine data. Hvis man gerne vil forstå hvad det er, der driver sammenhængene, man kan se udspille sig i dataene, er det en god start med at lave noge analyse på dataene. Det næste skridt, som kommer naturligt i denne proces, er at anvende ens data til at kategorisere eller forudse hændekser inden de finder sted, noget, som man køre både ved brug af klassiske statistiske metoder og maskilæring (ML).

Person standing on top of the world

Leder du efter noget andet? Se MindGraphs andre services ved at trykke på knappen nedenfor:


Hvordan kan en prædiktiv model være nyttig? ✍️

Det at træne og anvende prædiktive modeller kan være nyttigt i en bred vifte af sammenhænge, som for eksempel at finde og rette på systematiske fejl i data, at gruppere observationer i forskellige kategorier eller at forudse visse hændelser inden de reelt er sket.

Her er nogle ting, som en prædiktiv model kan bruges til i virkeligheden:

  • Prognosticering af efetspørgsel af forskellige produkter og optimering af inventar med henblik på at reducere driftsomkostninger
  • Vurdering af sandsynligheden, at en kunde ikke vil være i stand til at fuldføre en betaling eller returnere en produkt, de har købt
  • Analyse af kundeanmendelser fra forskellige hjemmesider og/eller sociale medier for at få en forståelse af, hvordan et produkt opfattes af kunden, eller for at tage bedre marketingsbeslutninger i fremtidige kampagner
  • Analyse af jobansøgeresdata for at kunne forudse det bedste match for en stilling og/eller forbedre rekrutteringsprocessen generelt
  • Forudsigelse af, hvornår et udstyr vil gå i stykker, sådan at man kan gøre noget præventivt og mindske driftsstop
  • Prognosticering af priser på baggrund af makroøkonomiske indikatorer og beslutningstagning såsom køb og salg af aktiver på det rigtige tidspunkt
  • Genskabelse af manglende data i visse felter på baggrund af implicitte sammenhænge mellem forskellige variabler, som i sin tur kan lede til en forøget kvalitet af ens rapportering

Hvilke slags modeller findes der? ⚙️

En model er en forenklet repræsentation af virkeligheden, som er designet til at kunne forstå, analysere eller lave prognoser for, hvordan visse udviklinger kommer til at spille sig ud. Det er vigtigt at kunne differentiere mellem tre slags modeller, når det kommer til data.

Databasemodeller

Databasemodeller definerer hvordan data kan forbindes til andre data, samt hvordan man tilgå og lave udtræk fra databaser og andre digitale systemer. Datamodeller sikrer, at dataene er konsekvente og velstrukturerede, samt at de virkelig afspejler den information, som det er meningen, at de skal repræsentere. I eksemplet nedenunder kan man se hvordan en databasemodel kan blive brugt til at forbinde oplysninger om produkter, kunder og salgsordre. I dette eksempel kan man se hvordan visse kolonner anvendes til at danne forbindelser mellem de tre tabeller:

Database model linking three tables on sales, products and customers

Denne type datamodel er væsentlig når det kommer til rapportering (for eskempel i Power BI), og er et godt udgangspunkt for det at bygge prædiktive modeller.

Statistiske modeller

Disse modeller kan benyttes til både at forklare og at måle sammenhænge mellem visse variabler i dataene. Alternativt kan de også bruges til at lave prognoser for forskellige tal (for eksempel, antal salg), baseret på visse input variabler (for eksempel, antal potentielle kunder, antal konkurrerende produkter på markedet og salgspris). Statistiske modeller indebærer typisk en eller anden form for regressionsanalyse.

Maskinlærginsmodeller (ML)

Denne type modeller anvendes hovedsageligt til at lave prognoser. Bag kulisserne kan disse modeller være ret forskellige: visse af dem ligner de vildeste beslutningstræer (fx random forest, gradient boosting), mens andre er designet til at fungere på en måde, som ligner den måde, vores egne hjerner fungerer på (fx neural networks). I eksemplet nedenunder kan man se hvordan en model, som bygger på beslutingstræprincipperne, kan være i stand til at forudse hvor sandsynligt det er, et en kunde kommer til at sende en bestemt vare retur:

Database model linking three tables on sales, products and customers

Maskinlæringsmodeller trænes typisk på et datasæt, hvorefter deres præstation vurderes på et andet datasæt. Dette gøres for at sikre, at modellerne er skalerbare, og at de vil kunne anvendes på helt nye data, som modellerne aldrig har set før.

Når man taler om prædiktive modeller, kan det være, at man mener enten en statistisk eller en maskinlæringsmodel.

Hvad er forskellerne på maskinlæring og statistik? 🤖

Sammenlignet med klassiske statistiske metoder, kan maskinlæringsmodeller tilbyde en større grad af skalerbarhed såvel som muligheden for at kunne anvende modellerne på helt nye datasæt (så længe modellen har været ordentligt testet og optimeret). Til forskel fra statistiske modeller, kan maskinlæringsmodeller tage mange flere variable i betragtning, og kan tilbyde en markant bedre præstationer, når man arbejder med større datasæt.

Herunder kan du se en hurtig sammenligning mellem maskinlæring og statistik, hvor de ting, som de to metodegrupper er bedst til, er fremhævet:

Slide comparing statistics to machine learning

Klar til at bygge din første model? 🔮

Hvis du overvejer at anvende statistiske eller maskinlæringsmodeller til din fordel sådan, at du kan analysere, kategorisere eller forudse visse resultater, er du velkommen til at kontakte mig for et gratis og helt uforpligtende 30 minutters møde, hvor vi kan diskutere dine behov nærmere:


Cars driving down a windy road