
We are searching data for your request:
Upon completion, a link will appear to access the found materials.
Što je neutralna genetska diferencijacija? Vjerojatno je to mjera udaljenosti između organizama u smislu njihove genetike, ali na što se odnosi 'neutralno'?
Neutralna genetska varijacija je varijacija koja nema utjecaja na kondiciju. Predlažem da pročitate više o neutralnoj teoriji na wikipediji.
Neutralna genetska diferencijacija je način da se govori o neutralnoj genetskoj varijaciji koja slijedi neki povijesni obrazac, na primjer dvije populacije izolirane jedna od druge na duže vrijeme pokazat će neutralnu genetsku diferencijaciju čak i ako su pojedinačno u Hardy-Weinbergovoj ravnoteži. Drugim riječima, dvije populacije će imati donekle različite frekvencije alela jedna od druge bez razloga povezanog s prirodnom selekcijom, već radije zbog slučajnog uzorkovanja i genetskog pomaka tijekom vremena.
Općenito se smatra da je većina genetskih varijacija neutralna ili gotovo neutralna. Na primjer, većina ljudskog genoma je beskorisna DNK ili genomski paraziti kao što su transpozoni. Gotovo sve genetske varijacije koje se događaju u tim regijama nisu važne za ljudsku kondiciju, drugim riječima one su "neutralne".
Raznovrsne reference
Odrasli organizmi sastoje se od niza različitih tipova stanica. Stanice su organizirane u tkiva, od kojih svako obično sadrži mali broj tipova stanica i posvećeno je specifičnoj fiziološkoj funkciji. Na primjer, epitelno tkivo koje oblaže tanko crijevo...
…abnormalnosti razvoja ili diferencijacije tkiva. Uključuju tumore pojedinačnih ili mješovitih tipova tkiva, koji potencijalno zahvaćaju bilo koji dio tijela, uz rizik od maligne transformacije. Većina je sporadična, ali neke se dominantno nasljeđuju. Kod mnogih displazija mutacije gena su nejednake i zahtijevaju gubitak normalnog…
…životinje, ali također omogućuju diferencijaciju pluripotentnih matičnih stanica (stanice koje imaju potencijal postati bilo koja od mnogih različitih vrsta stanica). Drugim riječima, epigenetske promjene omogućuju stanicama koje sve dijele istu DNK i koje su u konačnici izvedene iz jednog oplođenog jajašca da postanu specijalizirane - na primjer, kao jetra...
Pojava u
Diferencijacija je jednostavno proces postajanja drugačijim. Ako se, u vezi s biološkim razvojem, morfogeneza odvoji kao komponenta za zasebno razmatranje, postoje dvije različite vrste diferencijacije. U prvom tipu, dio sustava u razvoju promijenit će se u…
Diferencijacija embrionalnih tkiva odvija se brzo tijekom ranog tijeka razvoja, a velik dio onoga što će postati strukture kože odraslih – uključujući žlijezde i dodatke – polaže se prije rođenja životinje, često u latentnoj fazi, da bi se kasnije nastavio razvoj.
…oblik je oblik stanične diferencijacije, pojam u općenitijem smislu odnosi se na promjenu funkcije, obično popraćenu specijalizacijom i gubitkom sposobnosti za daljnju diobu. Biokemijska diferencijacija često uključuje promjenu karaktera staničnih organela - kao kada je generalizirani potencijal...
U organizmu u razvoju diferencijacija podrazumijeva povećanje strukturne i funkcionalne složenosti. Jedna vrsta diferencijacije tiče se promjena u bruto obliku i organizaciji. Takve aktivnosti, povezane s oblikovanjem tijela i njegovih sastavnih dijelova u formu i uzorak, obuhvaćaju procese zvane morfogeneza. Procesi morfogeneze su relativno jednostavni...
Teorija o
…dublje razumijevanje biološke diferencijacije, posebno čimbenika koji kontroliraju diferencijaciju. Presudan za te studije bio je razvoj u kasnom 20. stoljeću metoda kulture tkiva koje su omogućile rast embrionalnih matičnih stanica sisavaca – i konačno ljudskih embrionalnih matičnih stanica – na pločama za kulturu.
…u biologiju tumačenje da se nediferencirani materijali postupno specijaliziraju, na uredan način, u strukture odraslih. Iako je sada prihvaćen epigenetski proces koji karakterizira opću prirodu razvoja i biljaka i životinja, mnoga pitanja ostaju riješena. Francuski liječnik Marie François Xavier Bichat izjavio je…
Sadržaj
Charles Darwin komentirao je ideju neutralne mutacije u svom radu, pretpostavljajući da mutacije koje ne daju prednost ili nedostatak mogu fluktuirati ili postati fiksne odvojeno od prirodne selekcije. „Varijacije koje nisu ni korisne ni štetne ne bi bile pod utjecajem prirodne selekcije, te bi ostale ili fluktuirajući element, kao što možda vidimo u određenim polimorfnim vrstama, ili bi na kraju postale fiksne, zahvaljujući prirodi organizma i prirodi Uvjeti." Dok se Darwinu naširoko pripisuje uvođenje ideje prirodne selekcije koja je bila u fokusu njegovih studija, on je također vidio mogućnost promjena koje nisu koristile ili štetile organizmu. [1]
Darwinov pogled na promjenu uglavnom potaknut osobinama koje daju prednost bio je široko prihvaćen sve do 1960-ih. [2] Dok je 1968. istraživao mutacije koje proizvode nukleotidne zamjene, Motoo Kimura je otkrio da je stopa supstitucije bila toliko visoka da bi, ako bi svaka mutacija poboljšala kondiciju, jaz između najprikladnijeg i tipičnog genotipa bio nevjerojatno velik. Međutim, Kimura je objasnio ovu brzu stopu mutacije sugerirajući da je većina mutacija neutralna, odnosno da je imala mali ili nikakav učinak na kondiciju organizma. Kimura je razvio matematičke modele ponašanja neutralnih mutacija podložnih slučajnom genetskom pomaku u biološkim populacijama. Ova teorija je postala poznata kao neutralna teorija molekularne evolucije. [3]
Kako je tehnologija omogućila bolju analizu genomskih podataka, istraživanja su nastavljena u ovom području. Dok prirodna selekcija može potaknuti prilagodbu na promjenjivu okolinu, neutralna mutacija može potaknuti divergenciju vrsta zbog gotovo slučajnog genetskog pomaka. [2]
Neutralna mutacija postala je dio neutralne teorije molekularne evolucije, predložene 1960-ih. Ova teorija sugerira da su neutralne mutacije odgovorne za veliki dio promjena slijeda DNK u vrsti. Na primjer, goveđi i ljudski inzulin, iako se razlikuju u slijedu aminokiselina, još uvijek mogu obavljati istu funkciju. Stoga se pokazalo da su zamjene aminokiselina između vrsta neutralne ili ne utječu na funkciju proteina. Neutralna mutacija i neutralna teorija molekularne evolucije nisu odvojene od prirodne selekcije, već pridonose Darwinovim izvornim razmišljanjima. Mutacije mogu dati prednost, stvoriti nedostatak ili učiniti nikakvu mjerljivu razliku u opstanku organizma. [4]
Brojna opažanja povezana s neutralnom mutacijom predviđena su u neutralnoj teoriji, uključujući: aminokiseline sa sličnim biokemijskim svojstvima trebale bi se supstituirati češće nego biokemijski različite aminokiseline, zamjene sinonimnih baza trebale bi se promatrati češće od nesinonimnih supstitucija introni bi se trebali razvijati istom brzinom kao sinonimne mutacije u kodiranju egzona i pseudogena također bi se trebale razvijati sličnom brzinom. Ova su predviđanja potvrđena uvođenjem dodatnih genetskih podataka od uvođenja teorije. [2]
Sinonimna mutacija baza Uredi
Kada se netočan nukleotid ubaci tijekom replikacije ili transkripcije kodirajuće regije, to može utjecati na konačnu translaciju sekvence u aminokiseline. Budući da se više kodona koristi za iste aminokiseline, promjena u jednoj bazi može i dalje dovesti do translacije iste aminokiseline. Taj se fenomen naziva degeneracija i omogućuje razne kombinacije kodona koje dovode do stvaranja iste aminokiseline. Na primjer, kodovi TCT, TCC, TCA, TCG, AGT i AGC kodiraju sve za aminokiselinu serin. To se može objasniti konceptom titranja. Francis Crick je predložio ovu teoriju kako bi objasnio zašto specifične molekule tRNA mogu prepoznati više kodona. Područje tRNA koje prepoznaje kodon nazvan antikodon može vezati više izmjenjivih baza na svom 5' kraju zbog svoje prostorne slobode. Peta baza koja se zove inozin također može biti supstituirana na tRNA i može se vezati s A, U ili C. Ova fleksibilnost omogućuje promjene baza u kodonima što dovodi do translacije iste aminokiseline. [5] Promjena baze u kodonu bez promjene prevedene aminokiseline naziva se sinonimna mutacija. Budući da prevedena aminokiselina ostaje ista, sinonimna mutacija se tradicionalno smatra neutralnom mutacijom. [6] Neka istraživanja sugeriraju da postoji pristranost u odabiru supstitucije baze kod sinonimnih mutacija. To bi moglo biti posljedica selektivnog pritiska za poboljšanje učinkovitosti translacije povezane s najdostupnijim tRNA ili jednostavno mutacijske pristranosti. [7] Ako ove mutacije utječu na brzinu translacije ili sposobnost organizma da proizvodi proteine, one zapravo mogu utjecati na kondiciju zahvaćenog organizma. [6]
Biokemijska svojstva aminokiselina | Nepolarni | polarni | Osnovni, temeljni | Kisela | Završetak: stop kodon |
1 baza | 2. baza | 3 baza | |||||||
---|---|---|---|---|---|---|---|---|---|
T | C | A | G | ||||||
T | TTT | (Phe/F) Fenilalanin | TCT | (Ser/S) Serin | TAT | (Tyr/Y) Tirozin | TGT | (Cys/C) Cistein | T |
TTC | TCC | TAC | TGC | C | |||||
TTA | (Leu/L) Leucin | TCA | TAA | Zaustavi (Oker) [B] | TGA | Zaustavi (Opal) [B] | A | ||
TTG [A] | TCG | OZNAČITI | Zaustavi (jantar) [B] | TGG | (Trp/W) Triptofan | G | |||
C | CTT | CCT | (Pro/P) Prolin | MAČKA | (His/H) Histidin | CGT | (Arg/R) Arginin | T | |
CTC | CCC | CAC | CGC | C | |||||
CTA | CCA | CAA | (Gln/Q) Glutamin | CGA | A | ||||
CTG [A] | CCG | CAG | CGG | G | |||||
A | ATT | (Ile/I) Izoleucin | DJELUJTE | (Thr/T) Treonin | AAT | (Asn/N) Asparagin | AGT | (Ser/S) Serin | T |
ATC | ACC | AAC | AGC | C | |||||
ATA | ACA | AAA | (Lys/K) Lizin | AGA | (Arg/R) Arginin | A | |||
ATG [A] | (Met/M) Metionin | ACG | AAG | AGG | G | ||||
G | GTT | (Val/V) Valin | GCT | (Ala/A) Alanin | GAT | (Asp/D) Asparaginska kiselina | GGT | (Gly/G) Glicin | T |
GTC | GCC | GAC | GGC | C | |||||
GTA | GCA | GAA | (Glu/E) Glutaminska kiselina | GGA | A | ||||
GTG | GCG | GEG | GGG | G |
Zamjena neutralne aminokiseline Uredi
Dok zamjena baze u nekodirajućem području genoma može napraviti malu razliku i smatra se neutralnom, zamjene baza u ili oko gena mogu utjecati na organizam. Neke zamjene baza dovode do sinonimnih mutacija i bez razlike u aminokiselini prevedenoj kao što je gore navedeno. Međutim, supstitucija baze također može promijeniti genetski kod tako da se prevede druga aminokiselina. Ova vrsta zamjene obično ima negativan učinak na protein koji se formira i bit će eliminiran iz populacije kroz pročišćavajuću selekciju. Međutim, ako promjena ima pozitivan utjecaj, mutacija može postati sve češća u populaciji dok ne postane fiksni genetski dio te populacije. Organizmi koji se mijenjaju putem ove dvije opcije čine klasični pogled na prirodnu selekciju. Treća mogućnost je da zamjena aminokiselina čini malu ili nikakvu pozitivnu ili negativnu razliku na zahvaćeni protein. [12] Proteini pokazuju određenu toleranciju na promjene u strukturi aminokiselina. To donekle ovisi o tome gdje se u proteinu odvija supstitucija. Ako se dogodi u važnom strukturnom području ili na aktivnom mjestu, jedna zamjena aminokiselina može inaktivirati ili bitno promijeniti funkcionalnost proteina. Zamjene u drugim područjima mogu biti gotovo neutralne i nasumično se mijenjati tijekom vremena. [13]
Neutralne mutacije se mjere u populacijskoj i evolucijskoj genetici često promatranjem varijacija u populacijama. One su povijesno mjerene gel elektroforezom kako bi se odredile frekvencije alozima. [14] Statističke analize ovih podataka koriste se za usporedbu varijacija s predviđenim vrijednostima na temelju veličine populacije, stopa mutacija i efektivne veličine populacije. Rana zapažanja koja su ukazivala na veću heterozigotnost od očekivane i ukupnu varijaciju unutar proučavanih izoforma proteina, dovela su do argumenata o ulozi selekcije u održavanju ove varijacije u odnosu na postojanje varijacije kroz učinke neutralnih mutacija koje nastaju i njihovu nasumične distribucije zbog genetskog pomaka. [15] [16] [17] Akumulacija podataka na temelju uočenog polimorfizma dovelo je do formiranja neutralne teorije evolucije. [15] Prema neutralnoj teoriji evolucije, stopa fiksacije u populaciji neutralne mutacije bit će izravno povezana sa brzinom formiranja neutralnog alela. [18]
U Kimurinim izvornim proračunima, mutacije s |2 Ns|<1 ili |s|≤1/(2N) definirani su kao neutralni. [15] [17] U ovoj jednadžbi, N je efektivna veličina populacije i kvantitativno je mjerenje idealne veličine populacije koja pretpostavlja takve konstante kao što su jednaki omjeri spolova i bez emigracije, migracije, mutacije ili selekcije. [19] Konzervativno, često se pretpostavlja da je efektivna veličina populacije otprilike jedna petina ukupne veličine populacije. [20] s je koeficijent selekcije i vrijednost je između 0 i 1. To je mjerenje doprinosa genotipa sljedećoj generaciji gdje bi vrijednost 1 bila u potpunosti odabrana protiv i ne bi dala nikakav doprinos, a 0 uopće nije odabrana protiv. [21] Ova definicija neutralne mutacije kritizirana je zbog činjenice da vrlo velike efektivne veličine populacije mogu učiniti da mutacije s malim koeficijentima selekcije izgledaju neutralne. Osim toga, mutacije s visokim koeficijentima selekcije mogu izgledati neutralne u vrlo malim populacijama. [17] Provjerljiva hipoteza Kimure i drugih pokazala je da je polimorfizam unutar vrsta otprilike onaj koji bi se očekivao u neutralnom evolucijskom modelu. [17] [22] [23]
Za mnoge pristupe molekularne biologije, za razliku od matematičke genetike, općenito se pretpostavlja da su neutralne mutacije one mutacije koje ne uzrokuju značajan učinak na funkciju gena. Ovo pojednostavljenje eliminira učinak manjih alelnih razlika u sposobnosti i izbjegava probleme kada odabir ima samo manji učinak. [17]
Rani uvjerljivi dokazi ove definicije neutralne mutacije pokazali su se kroz niže stope mutacija u funkcionalno važnim dijelovima gena kao što je citokrom c u odnosu na manje važne dijelove [24] i funkcionalno zamjenjivu prirodu citokroma c sisavaca u in vitro studijama. [25] Nefunkcionalni pseudogeni pružaju više dokaza za ulogu neutralnih mutacija u evoluciji. Pokazalo se da su stope mutacija u globinskim pseudogenima sisavaca mnogo veće od stopa u funkcionalnim genima. [26] [27] Prema neodarvinističkoj evoluciji, takve bi mutacije rijetko trebale postojati jer su ove sekvence nefunkcionalne i pozitivna selekcija ne bi mogla djelovati. [17]
McDonald-Kreitmanov test [28] korišten je za proučavanje selekcije tijekom dugih razdoblja evolucijskog vremena. Ovo je statistički test koji uspoređuje polimorfizam u neutralnim i funkcionalnim mjestima i procjenjuje na koji je dio supstitucija djelovao pozitivnom selekcijom. [29] Test često koristi sinonimne zamjene u genima koji kodiraju proteine kao neutralnu komponentu, međutim, pokazalo se da su sinonimne mutacije u mnogim slučajevima pod pročišćavajućom selekcijom. [30] [31]
Molekularni satovi se mogu koristiti za procjenu količine vremena od divergencije dviju vrsta i za postavljanje evolucijskih događaja u vrijeme. [32] Pauling i Zuckerkandl, predložili su ideju o molekularnom satu 1962. na temelju opažanja da se proces nasumične mutacije događa približno konstantnom brzinom. Pokazalo se da pojedinačni proteini imaju linearne stope promjena aminokiselina tijekom evolucijskog vremena. [33] Unatoč kontroverzi nekih biologa koji tvrde da se morfološka evolucija neće odvijati konstantnom brzinom, pokazalo se da se mnoge promjene aminokiselina akumuliraju na konstantan način. Kimura i Ohta objasnili su ove stope kao dio okvira neutralne teorije. Smatralo se da su te mutacije neutralne jer bi pozitivna selekcija trebala biti rijetka, a štetne mutacije trebale bi se brzo eliminirati iz populacije. [34] Prema ovom mišljenju, na nakupljanje tih neutralnih mutacija trebala bi utjecati samo stopa mutacija. Stoga bi stopa neutralne mutacije u pojedinačnim organizmima trebala odgovarati stopi molekularne evolucije u vrstama tijekom evolucijskog vremena. Na stopu neutralne mutacije utječe količina neutralnih mjesta u sekvenci proteina ili DNA u odnosu na količinu mutacije na mjestima koja su funkcionalno ograničena. Kvantifikacijom tih neutralnih mutacija u proteinu i/ili DNK i njihovom usporedbom između vrsta ili drugih interesnih skupina, mogu se odrediti stope divergencije. [32] [35]
Molekularni satovi izazvali su kontroverze zbog datuma koje izvode za događaje kao što su eksplozivna zračenja viđena nakon izumiranja poput eksplozije u kambriju i zračenja sisavaca i ptica. Dvostruke razlike postoje u datumima izvedenim iz molekularnih satova i fosilnih zapisa. Dok neki paleontolozi tvrde da su molekularni satovi sustavno netočni, drugi pripisuju odstupanja nedostatku čvrstih fosilnih podataka i pristranosti u uzorkovanju. [36] Iako nisu bez postojanosti i neslaganja s fosilnim zapisom, podaci iz molekularnih satova pokazali su kako evolucijom dominiraju mehanizmi neutralnog modela i da je manje pod utjecajem prirodne selekcije. [32]
Uvod u razvoj računala
Sanjeev Kumar, Peter J. Bentley, u O rastu, obliku i računalima, 2003.
Diferencijacija stanica
Diferencijacija stanica, četvrti proces, postupni je proces kojim stanice dobivaju različite strukture i funkcije jedna od druge, što rezultira pojavom različitih tipova stanica, na primjer, neurona ili stanica kože. Diferencijacija se u osnovi odnosi na različite proteine koje stanice sadrže.Ako je stanica postala terminalno diferencirana, ona nastavlja proizvoditi te proteine zbog promjene u ekspresiji gena koja uzrokuje stabilan obrazac aktivnosti gena, inače se stanica može nastaviti diferencirati tijekom uzastopnih staničnih dioba. Dakle, na diferencijaciju utječu najmanje sljedeća dva procesa:
stanična signalizacija – međustanična komunikacija i
asimetrična podjela – dioba koja rezultira asimetričnom raspodjelom čimbenika (proteina) u matičnoj stanici, zbog čega roditeljske i kćeri stanice stječu različite razvojne sudbine. Također djeluje kao mehanizam za razbijanje simetrije (Turing, 1952 Wolpert, 1998 Stewart, Poglavlje 10 ovog svezaka).
Pokazati/sakriti riječi koje treba znati
Diferencijacija: kada stanica odabere određeni genetski određen put koji uzrokuje da obavlja samo nekoliko specijaliziranih zadataka. više
DNK (deoksiribonukleinska kiselina): molekularne upute koje vode kako se sva živa bića razvijaju i funkcioniraju. više
Jaje: ženska gameta, koja čuva sve dijelove stanice nakon spajanja sa spermijem.
gameta: specijalizirane stanice koje se nalaze u vašim reproduktivnim organima koje imaju upola manju količinu DNK od somatskih stanica. Ove stanice se ujedinjuju u oplođeno jaje. više
Gen: regija DNK koja daje upute stanici kako izgraditi protein(e). Kao čovjek, obično dobivate set uputa od svoje mame, a drugi set od tate. više
Jezgra: gdje DNK ostaje u stanici, množina je jezgre.
Organizam: živo biće koje može biti malo poput bakterija ili veliko poput slona.
Somatske stanice: stanice u vašem tijelu, osim gameta. Soma je latinski za tijelo.
Sperma: muška spolna stanica, koja samo prenosi svoj DNK na jaje. više
Sažetak
Ein Vergleich der neutralen genetischen Differenzierung und genetischen Diversität zwischen ziehenden und sesshaften Populationen des Indianergoldhähnchens ( Regulus satrapa )
Viele Tierarten ziehen saisonbedingt zwischen Brut- und Nichtbrutgebieten. Diese jährlichen Wanderungen können wesentliche Auswirkungen auf die genetische Struktur der Population haben. Wir genotypisierten 281 Individuen aus elf Populationen anhand sieben verschiedener Mikrosatelliten-Loci, um die Muster der neutralen genetischen Differenzierung und der genetischen Diversität zwischen ziehenden und sespogshaften des BrutRegulus satrapa), einer weitverbreiteten nordamerikanischen Singvogelart, zu vergleichen. Davon ausgehend, dass das Zugverhalten den Genfluss verstärkt, trafen wir die Vorhersage, dass sesshafte Populationen eine größere genetische Differenzierung und geringere genetische Diversität als ziehende Populationen a. Das Ausmaß der genetischen Differenzierung und der genetischen Diversität zwischen ziehenden und sesshaften Populationen war vergleichbar. Die größte Differenzierung wurde beim Paarvergleich zwischen der Population in der Provinz Ontario und allen westlichen Populationen festgestellt. Distanzbasierte Redundanz-Modelle und Redundanz-Modelle zeigten, dass die Muster der neutralen genetischen Differenzierung und der neutralen genetischen Diversität einem „Isolation-durch-Distanz“ Modell (eng. izolation-by-distance model) niži model. Generell scheint es so, dass die genetischen Muster mit der eiszeitlichen Geschichte im Pleistozän zusammenhängen, wie es bereits in einer vorherigen Studie vermutet wurde.
Priznanja
Zahvaljujemo J. Lyonsu, S. Barribeauu, E. Sternbergu i A. Mongueu na raspravi i tehničkoj podršci tijekom početnih faza ovog projekta M. Maudsley, B. Ballister, D. Cook, R. Rarick, E. Osburn, R. Bartel, E. Rendon, D. Frey i R. Obregon za pomoć s terenskim zbirkama i laboratoriju De Roode i L. Morran za korisne komentare na prethodnu verziju rukopisa.
Izjava o financiranju
A.A.P. je podržan od strane NIH-a za obuku br. 5T32AI055404-10 (L. Real, PI) J.C.d.R. je podržan od strane NSF grantova br. DEB-1019746 i DEB-1257160 J.F.H. je podržao Fundación Migres M.R.K. je podržan od strane NSF granta br. DEB-1316037 i S.A. je podržao NSF br. potpora br. DEB-0643831 .
Materijali i metode
Mjerenje genetske diferencijacije među populacijama
FSV je mjera genetske diferencijacije populacije koja kvantificira udio varijance u učestalosti alela među populacijama u odnosu na ukupnu varijansu (zbroj varijance unutar pojedinaca, unutar populacija i između populacija). Nekoliko procjenitelja FSV su predloženi tijekom godina (pregledano u Weir i Hill 2002, Holsinger i Weir 2009).
Postoji značajna rasprava o definicijama FSV. Neki istraživači smatraju FSV biti parametar modela (npr., Balding i Nichols 1995 Nicholson et al. 2002. Holsinger et al. 2002), dok drugi smatraju da je to statistika (npr., Reynolds et al. 1983 Weir i Cockerham 1984 Hudson et al. 1992.). Čak i pri razmatranju FSV kao parametar, dosta se raspravlja o tome kojem modelu je to parametar i kako ga treba procijeniti (Marchini i Cardon 2002, Balding 2003). Cilj ovog članka nije uspoređivati ove pristupe koji se razlikuju i po onome što procjenjuju i po načinu funkcioniranja postupka procjene. Ostajemo agnostici u pogledu rasprave o tumačenju i definiciji FSV, iako koristimo riječ "procjenitelj" u cijelom. Umjesto toga, pokazujemo kako se neki od najčešće primjenjivanih procjenitelja FSV može se modificirati u prisutnosti podataka niske i srednje pokrivenosti kako bi se točnije odražavalo ono što je izvornik FSV procjenitelji su trebali uhvatiti tj., cilj će biti izvesti procjene primjenjive na NGS podatke koji daju rezultate slične onima koji bi bili dobiveni od izvornog procjenitelja na temelju potpunih podataka o genotipu bez ikakvih pogrešaka. Kao napomena, drugi procjenitelji, koji se ovdje ne razmatraju, potencijalno bi se mogli modificirati na sličan način.
Metoda procjene trenutaka:
Počinjemo s razmatranjem najjednostavnijih metoda za procjenu momenata FSV. Oni se ne oslanjaju ni na kakve pretpostavke o obliku distribucije uzorkovanja, osim na momente koji se koriste za procjenu parametara, a lako ih je implementirati kroz jednostavne algebarske izraze. Iz tih razloga popularni su i često korišteni procjenitelji po metodi trenutaka.
Naš prvi cilj je proširiti metodu trenutaka FSV procjenitelja koji je predložio Reynolds et al. (1983), budući da je ovo jedan od najpopularnijih i najmotiviranih procjenitelja FSV, kako bi se uzela u obzir nesigurnost genotipizacije. Pretpostavljajući bialelni SNP, s nereferentnim alelom na procijenjenim frekvencijama od , , i za populaciju i, j, i objedinjena, genetska varijacija između i unutar populacija na mjestu s je, redom, (1) i (2) gdje je ni i nj su broj uzorkovanih pojedinaca po populaciji, , i . Tablica 1 opisuje nomenklaturu korištenu u ovom rukopisu.
Procjena od FSV za jedno mjesto je tada (3) dok je za a mjesto od m web stranice jesu
Procjena najveće vjerojatnosti:
ML metode za procjenu FSV zahtijevaju specifikaciju distribucije vjerojatnosti uzorkovanja. Nakon što je ova distribucija definirana, može se maksimizirati funkcija vjerojatnosti kako bi se dobili ML procjenitelji za parametre distribucije. ML procjene FSV bili su vrlo popularni, posebno za otkrivanje znakova adaptivne prirodne selekcije među populacijama (npr., Beaumont i Balding 2004 Riebler et al. 2008 Foll i Gaggiotti 2008).
Pretpostavljajući bialelno mjesto s s beta-distribuiranim frekvencijama alela, vjerojatnost učestalosti alela uzorka u populaciji i može se izraziti kao beta-binomna distribucija s parametrima 2ni (veličina uzorka), FSV, i stranc,s, učestalost alela populacije predaka. Ova parametrizacija pretpostavlja divergenciju od zajedničke populacije predaka i da je naknadna divergencija dobro modelirana beta-distribucijom. Granična distribucija uzorka u populaciji i je tada dan prema (Balding i Nichols 1995, Balding 2003) (5) gdje je k je broj nereferentnog (ili izvedenog) alela, B je Beta-funkcija, (6) i
Funkcija pune vjerojatnosti proizvod je ove distribucije uzorka za sve populacije, budući da su populacije neovisne o stranc,s. Za dvije populacije i i j, imamo (8) gdje su indeksi na n i ukazuju na identitet stanovništva. Numerički maksimiziramo jednadžbu 8 koristeći Broyden–Fletcher–Goldfarb–Shanno (BFGS) algoritam (Fletcher 1987 Press et al. 2007).
Kvantificiranje genetske diferencijacije populacije nazivanjem genotipova
Naivna strategija za procjenu učestalosti alela uzorka i FSV je prvo pozvati genotipove na svakom mjestu, a zatim jednostavno prebrojati pojavu nereferentnih ili izvedenih alela među svim pojedincima.
Prvo smo procijenili točnost nekoliko strategija pozivanja genotipova (Pomoćne informacije, datoteka S1). Ove metode uključuju pristupe temeljene na izravnom broju očitanih baza, na vjerojatnostima genotipa i na posteriornim vjerojatnostima genotipa. Jedan obećavajući pristup je korištenje Bayesovih metoda za dodjeljivanje pojedinačnih genotipova izračunavanjem posteriornih vjerojatnosti genotipa P(G|x) iz vjerojatnosti genotipa i specifičnog prethodnog P(G) na genotip G. Za izračun se koristi Bayesov teorem P(G|x), posteriorna vjerojatnost genotipa G s obzirom na promatrane podatke x (1000 Genomes Project Consortium 2010). Prethodni se može definirati korištenjem stranih podataka, kao što su referentni slijed, sekvence u bazi podataka, procjena učestalosti alela i/ili koeficijenti inbreedinga, itd. (npr., 1000 Genomes Project Consortium 2010 Li 2011 Nielsen et al. 2012).
Rezultati pokazuju da pozivanje genotipova iz posteriornih vjerojatnosti genotipa osigurava najstabilniju i najtočniju točnost pozivanja genotipa i SNP-a u gotovo svim testiranim eksperimentalnim scenarijima (Tablica S1, Tablica S2 i Tablica S3). Usvojili smo ovu strategiju za nazivanje genotipova tijekom ostatka studije. Konkretno, izbrojali smo nereferentne alele iz ovih nazvanih genotipova kako bismo zaključili učestalost alela i izračunali metodu za procjenu trenutaka za FSV, koje smo označili (jednadžbe 10 i 11). Usvojili smo ovu strategiju pozivanja genotipa kako bismo izračunali ML procjenu FSV, (jednadžbe 5 i 8).
Alternativna strategija za računalstvo FSV je potpuno izbjeći pozivanje genotipa tako da se zaključak temelji izravno na posteriornim vjerojatnostima (npr., Yi et al. 2010 Nielsen et al. 2012.). Takve metode opisujemo u sljedećim odjeljcima.
Kvantificiranje genetske diferencijacije populacije bez nazivanja genotipova
Ovdje predlažemo korištenje Bayesovog vjerojatnosnog okvira za procjenu FSV iz posteriornih vjerojatnosti učestalosti alela uzorka svake populacije na svakom mjestu bez pozivanja specifičnih genotipova. U našim aplikacijama izračunavamo procjenu maksimalne vjerojatnosti frekvencijskog spektra mjesta na temelju vjerojatnosti genotipa, kao što je prethodno predložio Nielsen et al. (2012). Koristeći ovu ML procjenu SFS-a kao prethodnog u empirijskom Bayesovom pristupu, procjenjujemo posteriornu vjerojatnost za sve moguće frekvencije alela na svakom mjestu (Nielsen et al. 2012).
Metoda procjene trenutaka:
Neka je posteriorna vjerojatnost da je mjesto u populaciji i je izveo učestalost alela uzorka u uzorku od ni diploidne osobe, s obzirom na očitane podatke Y(i,s). Ova se vjerojatnost može izračunati iz vjerojatnosti genotipa korištenjem algoritma u Nielsenu et al. (2012). Označavanje alela s obzirom na izvedeni alel je proizvoljno i bilo koje drugo označavanje alela moglo je biti odabrano ako identifikacija stanja predaka i izvedenog stanja nije moguća.
Iz ovih količina izračunavamo posteriorno očekivanje genetske varijance između i unutar populacija (vidi jednadžbe 1 i 2) na mjestu s kao (10) i (11) gdje su i genetske varijance od Reynoldsa et al. (1983) formula, s k- i z-izvedeni aleli u populacijama i i j, odnosno, i Ys su podaci o sekvenciranju na mjestu s. Ukupna očekivana varijanca, E[cs|Ys], na svakom mjestu, je tada E[cs|Ys] = E[as|Ys] + E[bs|Ys].
Procjena od FSV za jedno mjesto dan je omjerom E[as|Ys] do E[cs|Ys] (jednadžba 3). Međutim, budući da dvije komponente varijance nisu neovisne i ovaj izračun uključuje očekivanje omjera, aproksimiramo ga pomoću delta metode (Rice 2008 Rice i Papadopoulos 2009) kako bismo dobili sljedeću procjenu FSV na mjestu s, (12) gdje je 〈cu〉 je uth središnji trenutak od cs i 〈a, cu〉 je mješoviti središnji moment, koji se može izračunati kao (13) i (14) gdje je ukupna genetska varijanca iz Reynoldsa et al. (1983) formula, s k- i z-izvedeni aleli u populacijama i i j, odnosno. U računske svrhe koristimo samo prve središnje i mješovite središnje momente.
može se izračunati korištenjem najveće vjerojatnosti slično metodi koja se koristi za izračunavanje za jednu populaciju (Nielsen et al. 2012.). Međutim, ovaj izračun možda neće biti poželjan zbog velike varijance povezane s procjenom tolikog broja parametara.
Alternativni pristup je izračunavanje procjene dvodimenzionalnog frekvencijskog spektra mjesta (2D-SFS), kao (15) gdje su i granične vjerojatnosti promatranja k i z nereferentni aleli u populaciji i i j, odnosno na mjestu s, kako je predstavljeno u Nielsenu et al. (2012).
se zatim koristi kao prethodni za izračunavanje posteriorne vjerojatnosti količina od interesa. Na primjer, očekivanje genetske varijance između populacija (vidi jednadžbu 10) može se izračunati kao (16) Konačno, metoda za procjenu trenutaka za FSV nad m mjesta zadana je jednadžbom 4. Kada analiziramo više mjesta, ne dodajemo faktor korekcije omjeru E[a|x] do E[c|x] na svakom mjestu jer će za veliki broj stranica pogreška uvedena uzimanjem omjera dvaju neovisnih očekivanja biti minimalna. Također smo testirali izvedbu drugih metoda za procjenu FSV iz podataka sekvenciranja izvedenih iz očekivanja učestalosti alela uzorka (datoteka S1).
Ove metode se mogu proširiti na definicije koje nisu u paru FSV (Weir 1996). Ove formulacije zahtijevaju procjenu zajedničkog SFS-a među svim populacijama, što se može procijeniti na sličan način kao u jednadžbi 15.
Procjena maksimalne vjerojatnosti:
Također proširujemo postupak za ML procjenu FSV i stranc pod beta-binomskom distribucijom (Balding i Nichols 1995 Balding 2003) (jednadžba 8) na slučaj nepoznatih genotipova. Ove procjene, koje nazivamo FST.ML, dobivaju se maksimiziranjem funkcije vjerojatnosti (17) gdje je Y(i,s) i Y(j,s) su promatrani očitani podaci na mjestu s za stanovništvo i i j, odnosno i i su opet granične vjerojatnosti učestalosti alela uzorka za populaciju i i j, izračunato kao u Nielsenu et al. (2012).
Analiza glavnih komponenti
Pristup sličan onom koji se koristi za ispravljanje procjena FSV može se koristiti u PCA. Sada standardna metoda za izračun PCA u populacijskoj genetici temelji se na Pattersonu et al. (2006). Za n pojedinci i m mjesta normalizirana kovarijacijska matrica C izračunava se kao (18) gdje je izvedena frekvencija alela na mjestu s (označavanje je opet proizvoljno) i G(w,s) je broj izvedenih alela za pojedinca w na mjestu s (G ∈ <0, 1, 2>u diploidnom slučaju). Nazivnik je umetnut kako bi se uračunao genetski drift i normalizira standardizirane frekvencije alela da imaju istu varijancu (Patterson et al. 2006.). Međutim, mogu se odabrati i druge normalizacije. Dekompozicija svojstvenog vektora C zatim se izračunava.
Osim toga, C matrica je ponderirana vjerojatnošću da je svaka stranica promjenjiva. To je motivirano činjenicom da, pri niskoj do srednje pokrivenosti sekvenciranjem, mjesta koja imaju malu vjerojatnost da će biti varijabilna u uzorku mogu imati mali, ali nezanemarljiv doprinos matrici C. Budući da su nekoliko redova veličine nepromjenjiviji od varijabilnih mjesta, to može imati dubok učinak na analize, čak i kada se ponderiraju s vjerojatnostima genotipa. Umjesto korištenja proizvoljnog diskretnog pozivanja SNP-a, ili manje frekvencije alela, graničnika, predlažemo mjesta ponderiranja prema njihovoj vjerojatnosti promjenjivosti.
Mi, dakle, procjenjujemo matricu C Što se tiče w ≠ y) (19) gdje je vjerojatnost mjesta s biti varijabilan, Pvar,s, izračunava se kao (20) Naglašavamo da ovaj pristup ne pruža oblik Bayesove PCA analize. Umjesto toga, to je modifikacija Pattersona et al. (2006.) pristup za PCA analizu u kontekstu genetike populacije, modificiran kako bi uključio nesigurnost u pozive genotipova korištenjem odgovarajućeg ponderiranja različitih genotipova koristeći njihove posteriorne vjerojatnosti.
Također primjećujemo da (21) za nepovezane osobe pod HWE uz pretpostavku poznatih frekvencija alela i HWE-izvedenu prethodnu vrijednost za vjerojatnosti genotipa. To pokazuje da se zapravo očekuje da će funkcija kovarijance za nepovezane pojedince biti nula pomoću ovog procjenitelja, što je neophodno i poželjno svojstvo da bi metoda dobro funkcionirala. Dokaz jednadžbe 21 je dat u dodatak. Kao što tvrdimo, rezultirajući PCA uvelike je poboljšan u odnosu na naivne metode koje koriste pozivanje genotipa u svim istraženim scenarijima.
Ovaj pristup bi se mogao proširiti na različite strategije za izvođenje PCA iz matrice posteriornih vjerojatnosti genotipa, na primjer, ML metode koje uzimaju u obzir doprinose buke svake varijable (Wentzell et al. 1997) ili Bayesove metode koje koriste vanjske informacije o podacima (Nounou et al. 2002).
Simulacija podataka sekvenciranja za više populacija
Proveli smo simulacije kako bismo usporedili učinkovitost ovih metoda za procjenu genetske diferencijacije populacije, kao i za kvantificiranje genotipizacije i točnosti pozivanja SNP-a, u širokom rasponu eksperimentalnih uvjeta. Kao iu prethodnim studijama (Kim et al. 2010., 2011.), radi računalne učinkovitosti simulirali smo podatke sekvenciranja umjesto sirovih očitavanja sekvenciranja.Tretirali smo mjesta kao neovisna jedno o drugom i simulirali genotipove za svakog pojedinca uz pretpostavku HWE i specifične učestalosti alela populacije. Točnije, ponovili smo sljedeći postupak za svako mjesto.
Prvo, za svako mjesto, nacrtali smo frekvenciju alela predaka stranc iz distribucije u [5 × 10 −3 , 1 − (5 × 10 −3 )] s gustoćom proporcionalnom 1/x. Ova raspodjela je očekivana distribucija frekvencije alela prema standardnom modelu neutralnih beskonačnih mjesta, skraćena na granicama koje odgovaraju veličini populacije od 200 jedinki (vidi, npr., Ewens 2004). Zatim smo simulirali učestalosti alela za dvije populacije koristeći Balding-Nicholsov model (Balding i Nichols 1995.) sa srednjom vrijednosti jednakom stranc, kao iu prethodnim studijama (Pritchard i Donnelly 2001 Price et al. 2006.). Simulirali smo dva neovisna uzorka, uvjetno uključena FSV i stranc, iz ove distribucije kako bi se dobile frekvencije alela za dvije populacije (vidi jednadžbu 5). Iz ovih frekvencija populacijskih alela dodijelili smo genotipove prema HWE za svakog pojedinca.
Kako bismo simulirali podatke iz tri populacije, prvo smo izvukli frekvencije populacijskih alela iz Balding-Nicholsovog modela za dvije populacije kao što je gore opisano. Zatim smo dodijelili prvu frekvenciju alela populaciji 1 i upotrijebili drugu frekvenciju alela kao učestalost alela predaka za populacije 2 i 3. Zatim smo iz Balding-Nicholsovog modela izvukli dvije frekvencije alela populacije za različitu vrijednost FSV i dodijelio ove frekvencije alela populacijama 2 i 3.
Za simulaciju NGS podataka, broj čitanja na svakom lokusu za svakog pojedinca simuliran je iz Poissonove distribucije kao u Kim et al. (2010., 2011.). Dodatno, greške su nasumično unesene jednoliko među nukleotide u stopi od 0,0075. Ova vrijednost je usporediva sa stopama pogrešaka pronađenim u prethodnim studijama (1000 Genomes Project Consortium 2010 Li et al. 2010 Yi et al. 2010.). Vjerojatnost da je mjesto polimorfno, Pvar, varirao je od 0,02 do 1.