Metoder for beregning av usikkerhet

Emnet gir en grunnleggende introduksjon til matematisk statistikk og numeriske metoder for estimering av usikkerhet.

Beregning av usikkerhet er en helt sentral del av enhver statistisk analyse, og konsepter slik som standardavvik og konfidensintervall er verktøy som brukes til å kvantifisere usikkerheten knyttet til estimering og prediksjon. Tradisjonelle statistiske metoder for kvantifisering av usikkerhet utnytter typisk en antatt struktur i data (for eksempel normalfordeling) til å utlede teoretiske formler for usikkerhet. For mer realistiske tilfeller eller komplekse modeller blir en slik analytisk tilnærming svært tidkrevende eller nærmest umulig. Det er derfor ikke uvanlig at usikkerhetsestimater uteblir eller at det gjøres forenklinger som innfører systematiske feil. 
 
Dette kurset gir en grunnleggende introduksjon til matematisk statistikk med fokus på numeriske metoder for beregning av usikkerhet. I tillegg til en generell introduksjon til matematisk statistikk, vil vi introdusere et enkelt og enhetlig rammeverk som bruker resamplingsteknikker for å estimere usikkerhet. Hovedfokus er på bootstrapping, en statistisk metode hvor man bruker tilgjengelige data for å beregne usikkerhet. Bootstrapping er i seg selv en generell metode som kan anvendes på en rekke problemer for å beregne usikkerhet i både statistikk og maskinlæring.

Dag 1: Usikkerhet, statistikk og simulering

Kurset starter med en generell introduksjon til matematisk statistikk og statistisk inferens. Med statistisk inferens mener vi prosessen med å trekke konklusjoner eller slutninger om virkeligheten fra data. I tillegg til gjennomgang av grunnleggende teori, vil vi også diskuterer hvordan introduksjonen av datamaskiner og simulering gradvis har endret tilnærming og metoder innen statistisk analyse og maskinlæring. I siste undervisningstime vil vi jobbe med en blanding av teoretiske og praktiske kode oppgaver knyttet til dagens tema.

Dag 2: Data, usikkerhet og bootstraping

Vi ser på noen konkrete datasett og metoder for utforskende dataanalyse. Vi vil også gjennomgå nødvendig teori, slik som store talls lov og egenskaper knyttet til den empiriske foredlings funksjonen, før vi introduserer bootstraping som en generell metode for estimering av usikkerhet. I siste undervisningstime vil vi jobbe med praktiske kode oppgaver knyttet til dagens tema.

Dag 3: Bootstrapping

I siste del av kurset ser vi på noen konkrete anvendelser av bootstrapping. Vi skal, for eksempel, se hvordan vi kan bruke bootstrapping til å lage mer nøyaktige konfidensintervaller, og vi vil diskutere hvordan bootstrapping kan anvendes mer generelt til å beregne usikkerhet for ulike modeller innen statistikk og maskinlæring. I siste undervisningstime vil vi jobbe med praktiske kode oppgaver knyttet til dagens tema.

Forkunnskaper

Dette emnet har anbefalte forkunnskapskrav i matematikk, statistikk og programmering. Det forutsettes for eksempel at deltakerne kjenner til et programmeringsspråk slik som R eller Python og at man har studert matematikk og noe statistikk på universitetsnivå tidligere. Man bør ha god kjennskap temaene som dekkes i oppfriskningskurset i matematikk. Hvis det er lenge siden du har vært borti disse temaene, anbefales det sterk å ta oppfriskningskurset i matematikk

Foreleser

Gudmund Hermansen er førsteamanuensis II i statistikk og data science ved Universitetet i Oslo (UiO). Han har doktorgrad i statistikk fra UiO, og også en periode som postdoktor samme sted. I tillegg har han jobbet som forsker på Norsk Regnesentral (NR) og førsteamanuensis i statistikk og data science på Handelshøyskolen BI. For tiden jobber han mest innen kvantitativ finans, i et nyoppstartet selskap med navn Abelee, hvor han leder en data-science-gruppe.

Hermansens forskning omhandler teoretiske metoder innen tidsrekker, modellvalg og Bayesiansk statistikk. Han har også jobbet med ulike statistiske anvendelser relatert til hjerneforskning sammen med GliaLab på Institutt for medisinske basalfag, og statistiske problemstillinger knyttet til eskalering i konflikt og borgerkrig sammen med PRIO (Institutt for fredsforskning). Gudmund har undervisningserfaring innen diverse grunnleggende emner i statistikk og data science ved UiO og BI.

Påmelding og datoer

Emnet arrangeres neste gang høsten 2022.

  • Påmeldingsfrist: 31. oktober 2022.
  • Dag én og to: 21.–22. november 2022.
  • Dag tre: 28. november 2022.
  • 4 undervisningstimer per dag, dagtid.
  • Innlevering av eksamen: 8. desember 2022.

Meld deg på og se formelle detaljer om emnet (emnebeskrivelse)

Les mer om programmet

Publisert 27. okt. 2021 14:13 - Sist endret 11. juni 2022 00:28