Disputas: Gudmund Horn Hermansen

M. Sc. Gudmund Horn Hermansen ved Matematisk institutt vil forsvare sin avhandling for graden ph.d.: Model selection and Bayesian nonparametrics for time series and non-standard regression models

 

Gudmund Horn Hermansen

Tid og sted for prøveforelesning 

26. september 2014 kl. 10.15,  Aud. 5 Vilhelm Bjerknes' hus.

Bedømmelseskomité

  • Professor Sonia Petrone, University of Bocconi
  • Professor Dag Tjøstheim, Universitetet i Bergen
  • Professor Ørnulf Borgan, Universitetet i Oslo

Leder av disputas

Instituttleder Arne Huseby, Matematisk institutt, Universitet i Oslo

Veiledere

  • Professor Nils Lid Hjort, Matematisk institutt, Universitet i Oslo
  • Professor Arnoldo Frigessi, Institutt for medisinske basalfag, Universitet i Oslo

Sammendrag

Statistisk modellvalg er en viktig komponent og også ofte en integrert del av statistisk dataanalyse og modellering. Som statistiske modellbyggere har vi normalt flere kandidatmodeller for å beskrive de underliggende mekanismene eller signalet i observerte data. Det er derfor ofte utfordrende å velge hvilken, eller hvilke, modell(er) som gir en tilstrekkelig beskrivelse av de relevante egenskapene og derfor er god(e) kandidat(er) for den endelige analysen og rapportering.

Det er allerede en rik litteratur på statistisk modellvalg og modellvalidering som strekker seg fra visuell inspeksjon til ‘goodness of fit’ og andre typer tester. Av disse er de såkalte modellinformsajonskriteriene, slik som Akaikes informasjonskriterie (AIC) og det Bayesianske informasjonskriteriet (BIC), blant de mer populære metodene. Disse er normalt lett tilgjenglig og reduserer et komplisert modellvalgs spørsmål til sammenligning av informasjonstall fra hver modell. Dette har ført til utstrakt og noen ganger også ukritisk bruk av slike metoder. I avhandlingen jobber vi med den underliggende rasjonelle motivasjonen for å bruke AIC i tidsrekke og i regresjons modeller med hopp diskontinuteter. Dette leder til ny innsikt og nye kriterier, og krever tidvis bruk av ikke-standard metodikk.

En statistisk modell er som oftest i praksis konstruert med et konkret og klart definert mål, eller anvendelse, for øye, f.eks. en modell for å undersøke effekten av en spesielt interessant forklaringsvariabel (effekten av røyking hos gravide), eller for å predikere fremtidige temperaturendringer i en tidsrekkemodell. Det at statistiske modeller konstrueres med et underliggende fokus, eller mål, har motivert ulike former for fokusert inferense og tilsvarende fokuserte modellvalgs prosedyrer. I avhandlingen videreutvikler vi det fokusert modellinformsajonskriteriteriet (FIC) og utleder dette for en stor klasse tidsrekkeprosesser. Dette resulterer i blant annet nye utgaver av det orginale kriteriet, slik som en betinget FIC.

Ikke-parametrisk metodikk blir av mange sett på som et verktøy som gjør det mulig å unngå modellvalgssteget i dataanalyse. Dette er høy-dimensionale modeller som normalt er svært adaptive og som innenfor passende generelle rammer kan representere nesten enhver lav-dimensional og parametrisk statistisk modell; noe som gjøre valg av modell overflødig. I situasjoner hvor enkle modeller er gode nok, vil disse normalt gi høyere presisjon enn ikke-parametriske metodikk. En annen utfordring er at slike metoder kan kollapse om data er ujevnt representert. Det siste kan i noen tilfeller løses ved å inntrodusere en prior og et Bayesiansk rammeverk. Ikke-parametrisk Bayesiansk modellering er i seg selv en spennende klasse modeller, som er gjenstand for en voksende interesse og som etterhvert også har mange anvendelses områder. Vi introduserer en ny familie slike modeller. Disse er bygd opp om, og motivert ut fra, det vi har valgt å kalle en ‘stykkvis konstant prior’ konstruksjon. Dette resulterer i et generelt og robust rammeverk hvor vi verifisere gode asymptotiske egenskaper, som er et viktig verktøy for å forsikre seg mot anomalitet i modellene.

For mer informasjon

Kontakt Matematisk institutt.

Publisert 12. sep. 2014 15:29 - Sist endret 16. sep. 2014 12:15