Bokmelding: Confidence, Likelihood, Probability: Statistical Inference With Confidence Distributions (Schweder og Hjort, CUP, 2016)

Siden vi har eller har hatt Nils Lid Hjort som veileder (Céline og Gudmund) eller biveileder (Emil) er vi selvfølgelig fullstendig inhabile når vi nå har tatt på oss jobben med å gi en omtale av boken Confidence, Likelihood, Probability (CLP) av Tore Schweder og Nils Lid Hjort. Men sånn må det vel være i et lite miljø, og heldigvis er man ikke alltid enig med sin veileder.

Confidence, Likelihood, Probability: Tore Schweder and Nils Lid Hjort, Cambridge University Press, 2016 (500 pages)

[Denne FocuStat-bloggposten fra november 2017 er en mildt revidert og utvidet versjon av den bokanmeldelsen av CLP som stod i Tilfeldig Gang, juni 2017, med tillatelse fra deres redaksjon.]

Sjokk leder noen ganger til nye idéer, skriver Schweder og Hjort i CLP-bokens første setning. Denne idéen –  som forfatterne medgir ikke er så ny, men som lenge har befunnet seg på historiens skraphaug –  er å tillate sannsynlighetsfordelinger over parameterrommet, og det helt uten en priorfordeling. Posteriors uten priors, altså. Slike fordelinger kaller Schweder og Hjort konfidensfordelinger, eller CDer.

En konfidensfordeling er en utvalgsavhengig fordelingfunksjon over parameterrommet. Overfladisk kan den forstås som en slags frekventistisk posteriorfordeling. Fordelingen uttrykker graden av konfidens man knytter til ulike deler av parameterrommet, gitt modell og data, uten at man behøver å spesifisere en priorfordeling. I likhet med posteriorfordelinger i bayesiansk statistikk gir også konfidensrammeverket en attraktiv grafisk fremstilling av inferens om en parameter av spesiell interesse, \(\theta\) – for eksempel en lokasjonsparameter, en regresjonskoeffisient, eller sannsynligheten for å overskride en kritisk terskelverdi. Slutninger om $\theta$ kan presenteres ved konfidensfordelingsfunksjonen $C(\theta)$, eller ved konfidenstettheten (slik vi er vant til å se posteriorfordelingen), men Schweder og Hjorts foretrukne grafiske fremstilling er konfidenskurven, definert som ${\rm cc}(θ) = |1 − 2\,C(\theta)|$.

Figuren nedenfor gir eksempler på slike konfidenskurver. Konfidenskurven peker på et naturlig punktestimat for $\theta$ (som her er antall knølhval, i et visst område av Nord-Atlanteren), og man kan lese av konfidensintervaller på alle nivåer. Slike konfidenskurver gjør det enkelt å registrere eventuell asymmetri, punktmasser i null, avgjøre tosidige tester, og så videre.

En kumulativ fordelingsfunksjon $C(\theta)$ som alltid gir konfidensintervaller med korrekt dekningsgrad, er per definisjon en CD. Denne definisjonen innebærer at konfidenskurver kan konstrueres med utgangspunkt i fundamentalt ulike metoder og paradigmer, også bayesianske. Boken fokuserer likevel på såkalte frekventistiske metoder, og utvikler blant annet en generell oppskrift for konstruksjon av konfidenskurver basert på klassisk likelihoodteori.

Figuren: Tre konfidensfordelinger, for $N$, antallet knøhval (her tellet i antall tusen) i et visst område av Nord-Atlanteren. De to prikkete blå kurver svarer til to forskjellige statistiske undersøkelser (hvorav en var relativet lett, og den andre betydelig vanskeligere, statistisk sett). Den røde i midten er fusjonen av disse, der informasjonen i de to undersøkelsene kombineres på optimalt vis; se Cunen og Hjort (2016). Alle konfidensintervaller lar seg lese ut av plottet (f.eks. 95% intervaller, som antydet ved den horisontale 0.95-linjen). Et slikt plott, med de separate konfidenskurver, sammen med den fusjonerte, kalles et konfigram (eller configram, da, på engelsk).

I en bok hvis prosjekt er å blåse nytt liv i en idé som lenge kun har blitt viet en setning eller to i statistiske lærebøker, er det ikke overraskende at det i CLP er gitt en del plass til noen svært grunnleggende ting i vårt fag, slik som hva en sannsynlighet er (kapittel 2, 6 og 15). Schweder og Hjort vil at vi skal tenke på konfidensfordelinger som uttrykk for såkalte epistemiske sannsynligheter. Dersom vi hevder å være 95 prosent sikre på at den ukjente men faste størrelsen $\theta$ ligger et sted mellom 1.7 og 2.3, er det et eksempel på en epistemisk sannsynlighetsytring. I motsetning til det vi har lært på skolen, vil altså Schweder og Hjort ha oss til å akseptere at $P(1.7 \le \theta \le 2.3) = 0.95$ er meningsfullt, selv når vi ikke betrakter $\theta$ som en tilfeldig variabel (CLP s. 418).

De epistemiske sannsynlighetene skiller seg fra det som i CLP-boken kalles aleatoriske sannsynligheter. Dette er sannsynligheter som skyldes faktiske tilfeldigheter i verden, og ikke bare vår usikkerhet knyttet til ting i verden. Konfidensfordelingene er uttrykk for epistemiske sannsynligheter, eller som Schweder og Hjort skriver, så uttrykker de det «et rasjonelt vesen tror om verden i lys av modellen og data» (CLP s. xiv, vår oversettelse). Men i motsetning til en bayesiansk posteriorfordeling hevder Schweder og Hjort at konfidensfordelingene er objektive, fordi de ikke krever en subjektiv priorfordeling, men kun baserer seg på den aleatoriske datagenererende prosessen.

For mange bayesianere vil dette skillet mellom to forskjellige tolkninger av sannsynlighet være velkjent. Eksempelvis skriver Gelman og Robert (2013) at «priorfordelinger ikke prøver å fange en bortgjemt sannhet, men må forstås som uttrykk for statistikerens usikkerhet knyttet til parametere». For bayesianere av denne skolen er altså parameteren $\theta$ en fast men ukjent størrelse, priorfordelingen $\pi(\theta)$ er epistemisk, mens $f (y\,|\,\theta)$ er aleatorisk. For å fortsette med exphil-begrepene, kan man si at man som bayesianer ikke er tvunget til å betrakte $\theta$ som en tilfeldig variabel, ontologisk sett, kun matematisk. Schweder og Hjort sin påstand om at bayesianeren «kun har én form for sannsynlighet, og derfor ikke noe annet valg enn å betrakte parameteren som en tilfeldig variabel» (CLP s. 17, vår oversettelse), er derfor en forenkling. Det stemmer at bayesianeren kun har én form for sannsynlighetslære, den som bygger på Kolmogorovs aksiomer, men det betyr ikke at bayesianeren er tvunget til én tolkning av hva sannsynlighet er.

Mens bayesianere à la Gelman og Robert har én sannsynlighetslære og to tolkninger av sannsynlighet, er konfidensialisten tvunget til å ha to sannsynlighetslærer; den vi kjenner for det aleatoriske og noe annet for det epistemiske. Dette fordi konfidensfordelingene bryter med Kolmogorovs aksiomer. «En aksiomatisk teori for epistemisk sannsynlighet ville virkelig vært fint å ha!», som Schweder og Hjort skriver (s. xvii, vår oversettelse). En slik aksiomatisk teori for epistemisk sannsynlighet ville mest sannsynlig ta utgangspunkt i noe kriterier for hvordan et rasjonelt vesen bør handle, deretter utvikle en sannsynlighetslære som ikke bryter med disse kriteriene. Spørsmålet vil da være om konfidensfordelingene er i tråd med denne sannsynlighetlæren. Prosjekter der man starter med noen prinsipper for rasjonalitet og utleder en sannsynlighetslære fra disse har blitt gjennomført av blant annet Savage (1972) og Bernardo og Smith (1994). De har endt opp med Kolmogorovs aksiomer minus tellbar additivitet.

Uansett om man kjøper konfidensfordelingene eller ikke, er CLP-boken proppfull av materiale som vil interessere enhver statistikkstudent. Kapittel 2 gir en utmerket innføring likelihoodteori, første ordens large sample-teori, suffisiens og likelihood-prinsippet, pivoter og profilerte likelihooder, med mer. Kapittel 7 tar blant annet for seg andreordens-tilnærminger og Bartlett-korreksjoner, mens kapittel 5 inneholder flere klassiske optimalitetsresultater, generalisert til konfidensfordelinger. Disse kapitlene, sammen med et meget oversiktlig og godt appendiks om large sample-teori, utgjør et inferens og asymptotikk-kurs i seg selv. Særlig er appendikset kjærkomment for studenter som er for unge til å ha hatt Nils' lille grønne på pensum.

Hjorts lille grønne (1980), på pensum for «alle» statistikkstudenter ved UiO en tyve års tid, og CLP (2016).

Naturlig nok blir en tilstrekkelig stor del av CLP-boken (da kanskje spesielt kapitlene 3, 4 og 8, og til en viss grad også kapittel 7 og 12) også brukt til å utvikle konfidensfordelingsmetodikk for mange kjente parametriske modeller. I det første kapittelet som utelukkende handler om konfidensfordelinger (kapittel 3) motiveres og utledes konfidensinferens for flere lav-dimensjonale parametriske modeller, lineære regresjonsmodeller og andre likelihood-baserte modeller for uavhengige og identisk fordelte observasjoner. Kapittel 4 tar for seg mer komplekse modeller, slik som modeller i overlevelsesanalyse, modeller med tilfeldige effekter, konfidensinferens i Markovkjeder, modeller for tidsrekker, og avhengige observasjoner. Generell konfidensinferens for den eksponensielle familien og generaliserte lineære modeller er tema for kapittel 8, og konfidensfordelingsmetodikk i sammenheng med prediksjon blir introdusert i kapittel 12.

Sims (t.v.) møter motstand i CLP.


CLP-boken fremstår generelt som overskuddspreget, og er tettpakket med gode, motiverende, interessante eksempler og illustrasjoner. I tillegg til aktiv bruk av ekte data (i motsetning til simulerte data) som fint motiverer idéer, konsepter og teknikker underveis, har CLP-boken et eget kapittel (kapittel 14) som presenterer og analyserer syv historier, om blant annet olympisk urettferdighet på 1000 meter skøyter, hvalbestand, økonomi (Schweder og Hjort utfordrer Christopher A. Sims, mottager av Sveriges riksbanks pris i ekonomisk vetenskap till Alfred Nobels minne) og en optimal konfidensløsning av Rosiglitazone-saken, en kjent og omdiskutert meta-analyse av $2\times2$-tabeller, der spørsmålet er hvorvidt en viss diabetesmedisin gav økt risiko for hjerteinfarkt.

I CLP-boken beveger Schweder og Hjort seg også utenfor den parametriske komfortsonen og over i ikke- og semiparametriske modeller (kapittel 11). Interessant i denne sammenheng er at konfidensfordelingsrammeverket åpner for enhetlige metoder for å kombinere statistisk inferens fra svært ulike kilder. Meta-analyse basert på konfidensfordelinger, som blir diskutert i kapittel 13, men også i 10 og 14, viser blant annet at noen kjente meta-analyse-metoder faller ut av CD-rammeverket, samtidig som CD-rammeverket også gir nye muligheter. For eksempel tillater den vide definisjonen av en CD å kombinere informasjon fra studier der helt ulike statistiske metoder og paradigmer er anvendt, som for eksempel parametriske og ikkeparametriske, så vel som bayesianske og frekventistiske.

Konfidensfordelinger og relaterte fidusiale rammeverk opplever en økende internasjonal interesse, noe CLP-boken også vitner om. Efron (1998) har spådd at Fishers arbeider innenfor fidusiale metoder kan bli umåtelig innflytelsesrike i det 21. århundret. Konfidensmetoder er relatert til Fishers (1930) fidusiale argumenter. Disse argumentene –  som har vært tilnærmet glemt i lang tid og blitt omtalt som hans største feilgrep – opplever nå en renessanse. En kortfattet introduksjon til CDer er å finne i oppsummeringsartikkelen til Xie og Singh (2013), og i den tilhørende diskusjonen. Journalen Statistical Planning and Inference har i 2017 et spesialnummer om CDer og relaterte temaer, og med Nils og Tore som gjesteredaktører. Innen CD-feltet samles forskere på en årlig BFF-konferanse, Bayesian, Frequentist, Fiducial, eller Best Friends Forever. Årets BFF-konferanse fant sted på Harvard med mange prominente statistikere blant foredragsholderne, blant annet Sir David Cox, Andrew Gelman og Jim Berger, sammen med lokale helter som Gunnar Taraldsen og Nils Lid Hjort. Fundamentale filosofiske spørsmål i statistikk stod sentralt på årets møte, men også praktiske anvendelser. Ikke nok med det, konfidensfordelingene ser ut til å ha sneket seg inn i maskinlæringsverdenen. Nylig tvitret John Myles White (Data Scientist ved Facebook), "I wish I had seen a confidence curve earlier ...".

Referanser:

Bernardo, J. og Smith, A. (1994). Bayesian Theory. Wiley, New York.

Cunen, C. og Hjort, N.L. (2016). ). Combining information across diverse sources: The II-CC-FF paradigm. Proceedings from the Joint Statistical Meeting 2016, the American Statistical Association, 138-153.

Efron, B. (1998). R.A. Fisher in the 21st century [with discussion and a rejoinder]. Statistical Science, 13, 95-122.

Fisher, R. A. (1930). Inverse probability. Proceedings of the Cambridge Philosophical Society, 26, 528-535.

Gelman, A. og Robert, C. P. (2013). "Not only defended but also applied": The perceived absurdity of Bayesian inference. The American Statistician, 67, 1-5.

Hjort, N.L. og Schweder, T. (2017). Confidence distributions and related themes. General introduction to the special issue of Journal of Statistical Planning and Inference, on confidence distributions and related themes.

Savage, L. J. (1972). The Foundations of Statistics. Dover Publications.

Xie, M. og Singh, K. (2013). Confidence distribution, the frequentist distribution estimator of a parameter: A review [with discussion and a rejoinder]. International Statistical Review, 81, 3-39.

Tags: speedskating, Confidence, Likelihood, Probability, confidence curve, whales By Gudmund Hermansen, Emil Aas Stoltenberg, Céline Cunen
Published Nov. 22, 2017 8:05 PM - Last modified Nov. 22, 2017 8:05 PM
Add comment

Log in to comment

Not UiO or Feide account?
Create a WebID account to comment