Informacija

Ukupan broj mutacija na različitim granama genskog stabla je neovisan ili ne?

Ukupan broj mutacija na različitim granama genskog stabla je neovisan ili ne?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Čitao sam Tajimin rad iz 1989. o njegovom testu neutralnosti.

Tajima, Fumio. "Statistička metoda za testiranje hipoteze o neutralnoj mutaciji polimorfizmom DNA." Genetika 123.3 (1989): 585-595.

Evo pitanja: Pretpostavimo da imamo tri sekvence označene s $C,D,E$, a njihova genealogija slijedi ${{CD}E}$ (tj. $C$ i $D$ se prvo spajaju prije nego što se spajaju s $E$). Neka je $B$ najnoviji zajednički predak $C$ i $D$.

Sada, neka je slučajna varijabla $k_{ij}$ broj nukleotidnih razlika između sekvence $i$ i sekvence $j$, tada Tajima pokazuje da $k_{BC}$ i $k_{BD}$ imaju različitu nulu kovarijanca.

Ali nisu li mutacije u grani $BC$ neovisne o mutacijama u grani $BD$? Mislio sam da su ukupan broj mutacija u marki $BC$ i $BD$ dvije nezavisne identično raspoređene varijable, pa su $k_{BC}$ i $k_{BD}$ neovisni, zašto onda imaju ne- nulta kovarijansa?

=============Ažuriranje==============

Sada imam neke osnovne ideje, ali nisam razradio potpuni odgovor.

Tajimina definicija $k_{ij}$ nije neovisna o veličini uzorka, niti o fiksnom vremenu spajanja. (Vidi njegov rad iz 1983.: Tajima, Fumio. "Evolucijski odnos sekvenci DNK u konačnim populacijama." Genetics 105.2 (1983.): 437-460.)

Na primjer, u uzorku veličine 3, ako odaberete 2 osobe i uvjetujete da se dvije osobe prvo spoje, slijedi njihovo vrijeme spajanja: egin{align*} mathbb{P}(t=T)=p( T)=frac{3}{2N}e^{-frac{3}{2N}T} end{align*} Sada kondicioniramo na fiksno vrijeme spajanja $t$, broj mutacija ispod beskonačnih mjesta model u svakoj grani od $B$ do $C$ ili od $B$ do $D$ slijedit će poissonovu distribuciju s parametrom $mu t$, gdje je $mu$ stopa mutacije po sekvenci po generaciji. Neka ova poissonova slučajna varijabla bude $xi_t$ u grani $BC$ i $eta_t$ u grani $BD$. Zatim egin{align*} k_{BC}=sum_{t=0}^{infty}xi_tp(t) k_{BD}=sum_{t=0}^{infty}eta_tp (t) end{align*} Ako uzmemo u obzir samo djelomični zbroj gornjeg niza, egin{align*} k_{BC}^{(n)}=sum_{t=0}^{n} xi_tp(t) k_{BD}^{(m)}=sum_{t=0}^{n}eta_tp(t) end{align*} zatim $k_{BC}^{(n) }$ i $k_{BD}^{(n)}$ očito imaju nultu kovarijansu, jer su $xi_t$ i $eta_t$ neovisne poissonove varijable, stoga egin{align*} mathbb{E}(k_ {BC}^{(n)}k_{BD}^{(n)})&=mathbb{E}(sum_{t=0}^{n}xi_tp(t)sum_{t=0 }^{n}eta_tp(t))=sum_{i=0}^{n}sum_{j=0}^np(i)p(j)mathbb{E}(xi_ieta_j) =sum_{i=0}^{n}sum_{j=0}^np(i)p(j)mathbb{E}xi_imathbb{E}eta_j &=mathbb{E }k_{BC}^{(n)}mathbb{E}k_{BD}^{(n)}, end{align*} tako da je njihova kovarijansa nula.

Ali kao $n o+infty$, upitno je kako $k_{BC}^{(n)}k_{BD}^{(n)}$ konvergira u $k_{BC}k_{BD}$. Neće jednoliko konvergirati na $k_{BC}k_{BD}$ jer u protivnom možemo prvo izračunati očekivanje, a zatim uzeti granicu, što nam daje nultu kovarijansu. Tajima nam nije eksplicitno pokazao kako je izračunao kovarijansu zbrajajući tri beskonačna niza (7. redak, str. 448, rad iz 1983.). Pokušao sam izravno raditi na toj seriji, ali nisam uspio u posljednjem iznosu. Njegov rezultat je točan, no nadam se da netko može dati neki nagovještaj zašto postoji inherentna korelacija između ovih naizgled neovisnih slučajnih varijabli.

=======Ažuriranje: objavljeno je jednostavno objašnjenje===============


Evo jednostavnog odgovora na moje pitanje. Razlog zašto dva broja ukupnih mutacija akumuliranih u dvije divergentne grane nisu neovisni jedna o drugoj je taj što doživljavaju istu količinu vremena spajanja.

Dok procesi stacionarne Poissonove mutacije su neovisni jedan od drugog, sve dok se događaju u različitim granama genealogije, vjerojatno će proizvesti sličan broj mutacija ako se dva takva procesa dogode zajedno za isto vrijeme. Dakle, nenulti dio kovarijance između $k_{BC}$ i $k_{BD}$ nije od samih procesa mutacije, već od zajedničkog vremena spajanja $T$.