Om prosjektet
Statistikk er vitenskapen om å nå frem til beslutninger under usikkerhet, og er en gjennomgripende suksesshistorie. Fagets språk og metoder har vært under utvikling i omtrent hundre år, og er i bruk innenfor alle områder der data samles inn. I brede penselstrøk har statistikkfaget fire hovedakser:
- parametri (sannsynlighetsmodeller med få parametre, som den berømte gaussfordelingen)
- ikkeparametri (modeller med få antagelser)
- vurdering av og valg mellom modeller
- sammenkopling av informasjon fra ulike kilder.
Men i vår tid står nye utfordringer i kø. Nye teknologier leder til andre og mer komplekse, høydimensjonale og voluminøse typer data enn tidligere. Samfunnets behov for å omsette strømmen av uryddig informasjon til konkret, relevant og tolkbar kunnskap er økende. Prosjektet handler blant annet om å bryte barrierer mellom aksene (1) og (2), delvis via videreutvikling av akse (3). Metodene skal så spisses og anvendes innenfor retning (4), optimal sammenkopling og utnyttelse av tildels meget forskjellige kilder for kunnskap og informasjon. Hvordan kan helsedata på individnivå, med alt fra blodtrykk til gener, knyttes sammen med sykehus- og befolkningsregistre, via sannsynlighetsteoretiske smittemodeller, samt et par millioner Facebook-meldinger om forkjølelse, hvis siktemålet er å bestemme en vaksinepolitikk?
Prosjektet er finansiert av Norges forskningsråd.