Shared cM project v4 er ute


Innlegget er en forenkelt og fornorsket utgave av «Introducing the updated shared cM tool, av Jonny Perl«

Den nye fjerde utgave av Shared cM Project er lansert, med nye verktøy

Siden 2015 har Blaine Bettinger hatt en nettdugnad hvor han har samlet inn data om delt DNA mengde av kjente relasjoner. Noe som har hjulpet mange å forstå hvordan man er i slekt med ett ukjent DNA treff. Leah Larkin har også bidratt med sannsynligheter, noe som også brukes i «What are the Odds» (omtalt hos meg som Hva er Oddsen)

Oppdatert versjon – Shared cM project

Siste versjon baserer seg på 60.000 kjente slektskap, noe som er en økning på 147% fra versjon 3. Dette gir økt nøyaktighet og flere detaljer. Verktøy er veldig likt som før men med følgende endringer:

Oppdaterte tallverdier

Tallene har ikke endret seg i stor grad, men noen er endret fordi tallgrunnlaget er forbedret. Blaine forklarer dette på sitt nettsted

Grand tante/onkel smed veid snitt, og forventet intervall

Histogramm er ett klikk unna

Du kan nå klikk på relasjoner, etthvert slektskap i blandt sannsynlighetene for å se histogram i ett nytt vindu. Histogrammer er grafer over over tallene bak. Disse kan gi deg bedre forståelse som:

  • Foreldre/barn bare noen få har registret delt DNA mengde under 3000cM
  • Minste verdi er derfor endret ned til 2376
  • Noen kan være det som kalles uteliggere, disse kan skyldes inntastingsfeil.
  • Histogrammet viser at majoriteten av data ligger mellom 3300 og 3900
Hvordan lese data: (Graf er for slektskap – Forelder). Tallverdier på x akse er gruppert, og fungerer som kurver. Tallverdier over søyler er antall registereringer i hver kurv

Om datagrunnlaget

Relasjonene

Blaine Bettinger har gjennomgått datagrunnlaget sitt og fjernet opplagte feil og uteliggere han har beskrevet dette i en rapport. Histogrammene er tatt derfra

Sannsynlighetene

Sannsynligheter er gruppert etter hvor sannsynlige de er og soteret fra høy til lav sannsynlighet.

Sannsynligheter for 1240 cM

Datagrunnlaget for disse sannsynlighetene kom fra en helt annen kilde Figur 5.2 Ancestrys fagartikkel om sammenligning (White paper on Matching). Figur viser hvor sannsynlig en spesifikk mendge delt DNA samsvarer med gitte slektskap, basert på Ancestry’s simuleringer. Noe Leah Larkin forklarer i sin blogg. Leah bearbeidet dataene videre

Disse omarbeidede data gir oss svaret på hvor sannsynlig ett 1240 cM treff er for ulike grupper. Den første gruppen Oldeforeldre, Gandtante/ grandonkel, Halv- tante/ onkel, søskenbarn, Halv niese/ nevø, Grand niese/ nevø, oldebarn har ca 74% sjanse, og netse gruppe har ca 26% sjanse (Besteforelder, Tante/ onkel, halvsøsken, niese/ nevø, Barnebarn)

Uenigheter

Siden det er to ulike datakilder og dermed ulike måter å se på disse, vil det ikke komme overaskende for noen at simulerte data og data fra nettdugnaden ikke alltid enes. Eksempelvis 400cM kan være en søskenbarn med lavt anslag av delt DNA basert på nettdugnaden, men simulerte verdier gir dette 0% sannsynlighet.

Når dette inntreffer vil verktøyet si ifra at dette er utenfor forventet sannsynlighet:

  • Nedenfor ser vi at for 150cM kan det være mnge slektskap som er mulig (positivt anslag 17-0,5%) Har merket disse med gult nedenfor
  • 1C1R – (barn av ett søskenbarn) har tilnærmet 0% sannsynlighet, men fordi omfavnes innefor de grenseverdier som er mulig er de listet opp som en mulighet.
† – Gitt 99% konfidensintervall havner enkelte slekskap utenfor hva som er sannsynlig

Advarsler

De samme advarslene finnes som før, men nå er de plassert i en blå boks på høyresiden. (Disse vises ikke på mobilversjon)

Flere slektskap og endogami

Hverken shared cM project, simuleringer, nettdugnader kan håndtere flere slektskap mellom testedes aner med påfølgende anesammenfall eller edogami. Har du dette vil ikke dette verktøy være treffsikkert nok.

Gjennomsnittlige verdier vist i boksene er bare bestemt av slektskap som er kjent. For mer fjerne slektskap er det større sannsylighet at du ikke vil DNA med fjerns slektninger enn at du gjør det. Les mer om dette

Veidsnitt og intervall for seksmenning

Eksempelvis, veid gjennomsnitt for en seksmenning er 25cM. Men vi deler bare DNA med 30% av våre seksmenninger (red: min artikkel: Hvorfor alle slektninger ikke er dine DNA slektninger )

  • Forventet intervall for seksmenning er 0 til 117cM
  • 25cM er ett veid snitt for relasjonen. Dette betyr ikke at det er det du vil dele med dine seksmenninger

En kommentar om “Shared cM project v4 er ute

Kommentarer er stengt.