To liv: kvinnene i Lillestrøm som ble født på samme dag og døde på samme dag

14. desember 1912 fødes to jentebarn på hver sin side av jordkloden. 101 år og 11 måneder senere slutter hjertene deres å slå – med to timers mellomrom, på Lillestrøm. Hvor urimelig usannsynlig er en slik hendelse (og hva slags dramatiske, lange liv har de to levet)? På oppfordring fra journalister i A-magasinet har vi regnet på sannsynligheter relatert til denne hendelsen.

Khuu Ngan og Borghild Kronsel Kristiansen [foto: A-magasinet, oktober 2015]

A-magasinet har laget en større sak om disse to liv, med i alt 32 sider som eget bilag til utgaven av 23.10 2015. Historiens fire deler er Tidlig voksen (1912-1940), Verden brenner (1940-1977), Flukten (1977), To liv på Romerike (1977-2014). Dramatikken og fortellingenes uoppløselige episke element (1912-2014) overlater vi denne gang til A-magasinet, men vi har altså regnet på visse sannsynlighetsmessige sider av saken. Martin og David får anledning til å oppsummere noen små biter av dette på web-tv (de må til og med viske vekk noen av formlene til Martins og Nils' neste artikkel). Under følger flere detaljer.

Den opprinnelige forespørselen fra journalist Helle Aarnes var å beregne «sannsynligheten for at to kvinner ble født samme dag og døde samme dag (14. desember 1912 – 13. november 2014)». Skal man være pinlig nøyaktig så har slike utsagn, formulert som hendelser i fortiden, ikke noen sannsynlighet – det som beskrives har enten inntruffet (som er tilfellet her) eller ikke. Man kan imidlertid regne på sannsynligheten for at noe tilsvarende har skjedd med andre, eller skal kunne skje i fremtiden. Dette kan gjøres ved å tenke seg et lotteri, der man trekker fødselstidspunkt og dødstidspunkt med sannsynligheter svarende til frekvenser for de fødsler og levealdre man har observert opp gjennom historien.

For å gi et sannsynlighetssvar må spørsmålet om «to kvinner fødes samme dag og dør samme dag» presiseres. Svaret vi får avhenger sterkt av hva slags betingelser man legger til grunn – skal vi i beregningen ta med alle kinesiske kvinner født i løpet av de siste fem hundre år, eller bare dem fra de siste hundre år; skal vi sammenligne med Lillestrøm, eller med hele Norges befolkning; er spørsmålene kun interessante når vi snakker om kvinner som har rukket å bli voksne? Siden svaret altså avhenger av disse betingelsene og restriksjonene (det statistikere definerer som populasjonen), vil vi her ta for oss et par ulike scenarier. Vi vil også basere oss på årlige levetidsdata for Norge, og følgelig begrense oss til å se på den norske populasjonen. Vi ser altså bort fra at den ene kvinnen kom fra Kina og at begge døde i akkurat Lillestrøm.

For dette sannsynlighetslotteriet vi lager oss, starter vi med å se på

P1 = sannsynligheten for at to norske kvinner, begge født en eller annen gang i tyveårsperioden 1.1 1902 og 31.12 1921, faktisk blir født nøyaktig samme dag, og så dør nøyaktig samme dag, en gang etter fylte 70 år.

Via statistiske beregninger, der vi skisserer hovedmetoden nederst i denne bloggposten, finner vi
P1 = 0.000,000,6 %, eller 6*10^(-9); det vil si, sjekker vi 1 milliard slike par med kvinner, vil vi forvente å finne 6 slike par kvinner.

Denne sannsynligheten er i «utrolig liten»-kategorien. Hovedgrunnen til dette er imidlertid at svaret gjelder for «et bestemt par kvinner om gangen». Det kan være mer informativt å se på hvor sannsynlig det er å finne minst ett par med kvinner, med lik fødselsdag og lik dødsdag, i en representativ populasjon. Vi ser derfor på

P2 = sannsynligheten for at minst ett par kvinner i en populasjon like stor som antall kvinner som ble født i Norge mellom 1.1 1902 og 31.12 1921 (i underkant av 610 000) faktisk blir født nøyaktig samme dag, blir minst 70 år, for så å dø nøyaktig samme dag.

Vi får P2 ≈ 100 %! Faktisk vil vi forvente å finne 1200 slike kvinnepar, samt hele 3 tripler med kvinner som har samme fødselsdag og dødsdag. Det har dermed helt klart vært en stor mengde slike par med kvinner i Norge.

Et aspekt med de to kvinnene i A-magasinets historie er at de ikke bare var gamle (over 70 år), men at de ble nær sagt utrolig gamle (101 år). Vi kan regne på tilsvarende sannsynligheter som P1 og P2, men med den modifikasjon at kvinnene skal leve til de blir minst 100 år. Da får vi for det første en analog, men enda lavere, sannsynlighet P1' = 0.000,000,000,005, eller 5*10^(-12); sjekker vi en billion slike par av kvinner, hvilket kan ta tid, forventer vi å finne 5 slike par. For det andre finner vi en analog sannsynlighet P2' ≈ 89 % for at det i en populasjon på størrelse med antall kvinner født i Norge mellom 1.1 1902 og 31.12 1921 skal være minst ett par som er født på samme dag, for så begge å bli mer enn 100 år, og endelig dø på samme dag. Vi vil forvente å finne omtrent to slike kvinnepar i en slik populasjon. Selv om vi altså tar høyde for de to kvinnenes svært høye alder, så er sannsynligheten for at man skal kunne finne to slike kvinner fortsatt høy – og man har trolig hatt en håndfull slike tilfeller i Norge.

Fenomenet vi har sett her er analogt med «alle lottomillionærene i Verdal», også relatert til de små talls lov – det er veldig usannsynlig at svært mange vinnende lottokuponger kjøpes der, men det er slettes ikke usannsynlig at en eller annen kommune på tilsvarende eller mindre størrelse skal få så mange lottomillionærer. Tilsvarende er det liten tvil om at det er svært usannsynlig at hendelsen med sammenfallende fødsel og død for de to kvinnene skulle inntreffe – for akkurat disse to kvinnene, eller to tilfeldig utpekte «tilsvarende» kvinner. At man blant alle som ble født innenfor en tyveårsperiode rundt 1912 skal finne to «slike kvinner» er imidlertid svært sannsynlig. Hver dag og hver time skjer det en lang rekke svært «usannsynlige» hendelser – å gjette at en spesifikk slik hendelse skal inntreffe akkurat når det skjer, eller dagen før, er imidlertid en helt annen sak.

La oss kort skissere hvordan vi har beregnet disse sannsynlighetene. Grunnformelen er

\(P_2=\sum_{x,y}\{a(x)b(y|x)c\}^2\)

der a(x), b(y|x), c er sannsynligheter, henholdsvis for at et individ i populasjonen vi ser på er født i år x; for at et individ dør i år y, gitt at vedkommende er født i år x; og for at et individ dør på en bestemt dag i løpet av et år, gitt at vedkommende dør det året. Vi har satt c = 1/365.2425 (alle dager like sannsynlige), mens vi har beregnet oss frem til tall for a(x) og b(y|x) basert på data i den interessante og informative The Human Mortalilty Database.

P2, og de andre sannsynlighetsaspektene knyttet til disse hendelsene, er blitt beregnet ved hjelp av stokastisk simulering. Mer konkret simulerte vi «livsløpene» til 610 000 kvinner, og sjekket så hvorvidt noen av disse ble født og døde samme dag. Takket være de store talls lov kunne vi slik beregne sannsynlighetene, ved å gjenta prosessen et høyt antall ganger.

La oss til slutt nevne at vi selvsagt kunne lagt inn flere aspekter eller begrensninger i våre beregninger, for eksempel at kvinnene skulle komme fra eller dø i akkurat Lillestrøm, eller at den ene kvinnen skulle være født i Kina – dette ville gjort sannsynlighetene enda lavere, og forsterket «Verdal-fenomenet».

Tags: To liv, Verden brenner, Law of Small Numbers, China, Lillestrøm By Martin Jullum (PhD-stipendiat), David Ruiz Baños (PhD i statistikk fra september 2015), Nils Lid Hjort (professor)
Published Oct. 22, 2015 5:52 PM

Aftenposten holder fortsatt denne saken varm, flere måneder etter at den stod første gang (og der bloggposten over altså ble publisert samtidig). I mars 2016 fortelles det at historien er oversatt til engelsk, kinesisk og farsi.

Nils Lid Hjort - Mar. 4, 2016 8:06 AM
Add comment

Log in to comment

Not UiO or Feide account?
Create a WebID account to comment