Statistisk analyse og hypotesetest


De første skridt, man tager på vej mod at skabe en datadrevet kultur i en organisation, handler om at bygge et solidt datafundemanet og nogle gode rapporter, som kan belyse tendenser og sammenhænge i dataene. Hvis man dog ønsker at nå et mere avanceret niveau, skal man kunne danne sig en forståelse af hvilke faktorer står bag ved de tendenser og sammenhænge, man observerer i dataene. Dette kræver en mere sofistikeret tilgang og er et klassisk tilfælde, hvor "gammeldags" statistiske metoder kan være enormt brugbare.

Online interactive report

Leder du efter noget andet? Se MindGraphs andre services ved at trykke på knappen nedenfor:


Hvorfor skal man interessere sig i statistik i 2024? 🧮

På det seneste har der været rigtig meget snak om kunstig intelligens (AI), large language modeller (LLMs) og maskinlæring (ML), hvilket kan gøre, at statistik lyder som noget, man gjorde brug af i fortiden. Men virkeligheden er sådan, at statistiske metoder er stadgivæk meget relevante at bruge i nutidens datalandskab, som forandrer sig hele tiden, fordi statistik kan være et robust redskab, når den bliver brugt til de rigtige formål.

Anvendelsen af statistiske metoder kan være en god idé i flere forskellige sammenhænge, blandt andet:

Slide describing 4 cases of modern use of statistics

Hvad er forskellerne på statistik og maskinlæring? 🤖

Sammenlignet med mere komplekse algoritmer såsom maskinlæringsmodeller, kan statistik tilbyde nemmere og mere intuitive fortolkninger af sine resultater. Dette gør det muligt at få en dybere forståelse for hvorfor et bestemt tal er sådan, at det er (så længe man har nok meningsfulde data til sin analyse).

Herunder kan du se en hurtig sammenligning mellem statistik og maskinlæring, hvor de ting, som de to metodegrupper er bedst til, er fremhævet:

Slide comparing statistics to machine learning

Er statistik ikke alt for kompliceret? 😱

Statistik kan være et meget kompliceret stof, men de gode nyheder er, at den ikke behøver at være det! Det er korrekt, at værktøjerne, man anvender i en statistisk analyse kan indebære brugen af komplekse formler og antagelser, men i dag er man i besiddelse af moderne løsninger såsom R og Python, som gør det muligt at hurtigt og nemt udføre statistiske tests, samt fortolke deres resultater.

Det at præsentere ens resultater kan selvfølgelig være en udfordring. Hos MindGraph forstår jeg vigtigheden af at formidle statistik på en måde, som er målrettet det niveau af teknisk forståelse, som modtageren har. Herunder kan du se et eksempel fra et af mine tidligere projekter, hvor jeg anvendte flere forksellige statistiske metoder til at teste antagelser om boligmarkedet i Storkøbenhavn (rapporten er kun tilgængelig på engelsk, men MinbdGraph kan sagtens også formidle på dansk, som du kan se i bloggen):

Example of presenting linear regression results in layman terms

Klar til at bruge statistik på dine data? 👓

Hvis du overvejer at anvende statistiske metoder på dine data for at måle vigtige effekter eller teste forskellige hypoteser og antagelser, er du velkommen til at kontakte mig for et gratis og helt uforpligtende 30 minutters møde, hvor vi kan diskutere dine behov nærmere:


Cars driving down a windy road