Metoder for beregning av usikkerhet

Kurset gir en grunnleggende introduksjon til numeriske metoder for kvantifisering og estimering av usikkerhet.

Beregning av usikkerhet er en helt sentral del av enhver statistisk analyse, og konsepter slik som standardavvik og konfidensintervall er verktøy som brukes til å kvantifisere usikkerheten knyttet til estimering og prediksjon.

Tradisjonelle statistiske metoder for kvantifisering av usikkerhet utnytter typisk en antatt struktur i data (for eksempel normalfordeling) til å utlede teoretiske formler for usikkerhet. For mer komplekse tilfeller blir en slik analytisk tilnærming svært tidkrevende eller nærmest umulig. Det er derfor ikke uvanlig at usikkerhetsestimater uteblir eller at det gjøres forenklinger som innfører systematiske feil. I dette kurset introduserer vi et enkelt og enhetlig rammeverk som bruker resamplingsteknikker for å estimere usikkerhet. Hovedfokus vil være på bootstrapping – dette er en statistisk metode, eller prosedyre, hvor man bruker tilgjengelige data for å kvantifisere og estimere egenskaper knyttet til usikkerhet, og er en metode som kan benyttes i nesten enhver sammenheng.

Dag 1: Data, algoritmer og usikkerhet

Kurset starter med en generell introduksjon til statistisk inferens. Med statistisk inferens mener vi prosessen med å trekke konklusjoner eller slutninger om virkeligheten fra data. Vi gir en kort introduksjon til tradisjonelle metoder for modellering og estimering av usikkerhet, og diskuterer hvordan introduksjonen av datamaskiner gradvis har endret tilnærming og også metoder innen statistisk analyse. Vi introduserer videre resampling, med fokus på bootstrapping, som en generell teknikk for kvantifisering og estimering av usikkerhet. Dette vil bli illustrert i flere dataeksempler, og vi sammenlikner resamplingsteknikker med tradisjonelle metoder i enkle situasjoner.

Dag 2: Introduksjon til metoder for kvantifisering av usikkerhet

I andre del av kurset ser vi på hvordan bootstrapping kan brukes mer generelt. Vi illustrerer og diskutert dette i noen standardmodeller, slik som regresjon, og vi vil også se på hvordan bootstrapping kan brukes til kvantifisering og estimering av usikkerhet i prediksjon. I tillegg vil vi gjennomgå noen grunnleggende teoretiske egenskaper og se på motivasjonen som ligger bak slike resamplingsteknikker.

Dag 3: Kvantifisering av usikkerhet i generelle modeller og modellvalg

I siste del av kurset ser vi på hvordan resampling og bootstrapping kan anvendes i generelle statistiske modeller, og også innen maskinlæring, for å kvantifisere usikkerhet. Vi vil diskutere styrker, svakheter og begrensninger, og se på noen utvidelser og korreksjoner, for eksempel hvordan bruke bootstrapping i store datasett. Til slutt skal vi se hvordan bruk av flere modeller og det å kun velge den «beste» modellen kan lede til uriktige usikkerhetsestimater, og hvordan bootstrapping kan brukes som en metode for å analysere og korrigere dette.

Foreleser

Gudmund Hermansen er førsteamanuensis II i statistikk og data science ved Universitetet i Oslo (UiO). Han har doktorgrad i statistikk fra UiO, og også en periode som postdoktor samme sted. I tillegg har han jobbet som forsker på Norsk Regnesentral (NR) og førsteamanuensis i statistikk og data science på Handelshøyskolen BI. For tiden jobber han mest innen kvantitativ finans, i et nyoppstartet selskap med navn Abelee, hvor han leder en data-science-gruppe.

Hermansens forskning omhandler teoretiske metoder innen tidsrekker, modellvalg og Bayesiansk statistikk. Han har også jobbet med ulike statistiske anvendelser relatert til hjerneforskning sammen med GliaLab på Institutt for medisinske basalfag, og statistiske problemstillinger knyttet til eskalering i konflikt og borgerkrig sammen med PRIO (Institutt for fredsforskning). Gudmund har undervisningserfaring innen diverse grunnleggende emner i statistikk og data science ved UiO og BI.

Påmelding og kursdatoer

Kurset arrangeres første gang våren 2022.

  • Dag én og to: 21.–22. mars
  • Dag tre: 1. april
  • 4 undervisningstimer per dag, dagtid
  • Innlevering av eksamen: uke 16, 2022

Meld deg på og se formelle detaljer om kurset (emnebeskrivelse)

Les mer om programmet

Publisert 27. okt. 2021 14:13 - Sist endret 23. nov. 2021 08:15