Informacija

Log-transformacija i GWAS

Log-transformacija i GWAS


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Prije izvođenja bilo kakve GWAS (genomske asocijacijske studije) potrebno je provjeriti normalnost fenotipske distribucije. Ako se fenotip normalno distribuira samo nakon što je log-transformiran, koje fenotipske podatke moram koristiti dok radim GWAS? Netransformirani ili log-transformirani?


Da, koristite fenotip transformiran u log. ako želite koristiti normalno distribuiran izraz pogreške, a to će se dogoditi samo ako je fenotip log-transformiran, tada morate log-transformirati fenotip.

Fenotip bi trebao biti distribuiran na isti način kao i termin pogreške u vašem regresijskom modelu GWAS-a.

$pheno = eta_1 X_D + eta_2 X_A +epsilon$

$epsilon = mathcal{N}(x | mu,sigma)$

Slijedeći središnji granični teorem, većina fenotipova je normalno raspoređena. Međutim, postoje slučajevi u kojima je Bernoullijeva distribucija točna i treba koristiti regresiju logističkog stila.


Naglasci

Tehnike MF-a zaključuju niskodimenzionalnu strukturu iz visokodimenzionalnih podataka omike kako bi se omogućila vizualizacija i zaključivanje složenih bioloških procesa (CBP).

Različiti MF primijenjeni na iste podatke naučit će različite čimbenike. Istraživačka analiza podataka trebala bi koristiti više MF-ova, dok bi specifično biološko pitanje trebalo koristiti specifičan MF prilagođen tom problemu.

MF uče dva skupa niskodimenzionalnih reprezentacija (u svakom matričnom faktoru) iz visokodimenzionalnih podataka: jedan koji definira molekularne odnose (amplituda) i drugi koji definira odnose na razini uzorka (uzorak).

Funkcionalni putovi vođeni podacima, biomarkeri i epistatičke interakcije mogu se naučiti iz amplitudne matrice.

Grupiranje, otkrivanje podtipova, u silikonu mikrodisekcija i analiza vremenskog toka omogućeni su analizom matrice uzoraka.

MF omogućuje multi-omičke analize i analize podataka jedne ćelije.

Omics podaci sadrže signale iz molekularnih, fizičkih i kinetičkih međustaničnih interakcija koje kontroliraju biološke sustave. Tehnike faktorizacije matrice (MF) mogu otkriti niskodimenzionalnu strukturu iz visokodimenzionalnih podataka koji odražavaju te interakcije. Ove tehnike mogu otkriti nova biološka znanja iz različitih omičnih podataka visoke propusnosti u aplikacijama u rasponu od otkrivanja puta do analize vremenskog toka. Pregledavamo primjere primjene MF-a za analize na razini sustava. Raspravljamo o prikladnoj primjeni ovih metoda, njihovim ograničenjima i usredotočujemo se na analizu rezultata kako bi se olakšala optimalna biološka interpretacija. Zaključak o biološki relevantnim značajkama s MF-om omogućuje otkrivanje iz podataka velike propusnosti izvan granica trenutnog biološkog znanja – odgovarajući na pitanja iz visokodimenzionalnih podataka koja još nismo ni pomislili postaviti.


IZVORNI ISTRAŽIVAČKI članak

  • 1 Odjel za staničnu biologiju, 2011. Kolaborativni inovacijski centar Tianjina za medicinsku epigenetiku, Tianjin Key Laboratory of Medical Epigenetics, Tianjin Medical University, Tianjin, Kina
  • 2 Centar za primijenjenu genomiku, Children’s Hospital of Philadelphia, Philadelphia, PA, Sjedinjene Američke Države
  • 3 Division of Human Genetics, Children’s Hospital of Philadelphia, Philadelphia, PA, Sjedinjene Američke Države
  • 4 Odjel za pedijatriju, Medicinski fakultet Perelman, University of Pennsylvania, Philadelphia, PA, Sjedinjene Američke Države

Juvenilni idiopatski artritis (JIA) najčešća je kronična reumatska bolest među djecom koja može uzrokovati teški invaliditet. Genomske studije otkrile su značajan broj lokusa rizika za JIA, međutim, mehanizam kako ti lokusi utječu na razvoj JIA nije u potpunosti shvaćen. Neutrofili su važan tip stanica uključen u autoimune bolesti. Kako bismo bolje razumjeli biološku funkciju genetskih lokusa u neutrofilima tijekom razvoja JIA-e, uzeli smo integrirani multi-omički pristup za identifikaciju ciljnih gena na lokusima rizika JIA u neutrofilima i konstruirali mrežu interakcije protein-protein putem pristupa strojnog učenja. Identificirali smo gene koji će vjerojatno biti ciljani geni za lokuse rizika JIA u neutrofilima koji bi mogli doprinijeti razvoju JIA.


Reference

Pickrell, J.K. i sur. Razumijevanje mehanizama koji su u osnovi varijacije ekspresije ljudskih gena uz sekvenciranje RNA. Priroda 464, 768–772 (2010).

GTEx konzorcij. Projekt Genotype-Tissue Expression (GTEx). Nat. Genet. 45, 580–585 (2013).

Gamazon, E.R. i sur. Metoda povezivanja temeljena na genima za mapiranje svojstava pomoću podataka referentnog transkriptoma. Nat. Genet. 47, 1091–1098 (2015).

Li, X. i sur. Utjecaj rijetkih varijacija na ekspresiju gena u tkivima. Priroda 550, 239–243 (2017).

Edwards, S. L., Beesley, J., French, J. D. & Dunning, A. M. Beyond GWASs: osvjetljavanje mračnog puta od asocijacije do funkcije. Am. J. Hum. Genet. 93, 779–797 (2013).

Segal, E., Raveh-Sadka, T., Schroeder, M., Unnerstall, U. & Gaul, U. Predviđanje ekspresijskih obrazaca iz regulatornog slijeda u Drosophila segmentacija. Priroda 451, 535–540 (2008).

Beer, M. A. & Tavazoie, S. Predviđanje ekspresije gena iz sekvence. stanica 117, 185–198 (2004).

Yuan, Y., Guo, L., Shen, L. & Liu, J. S. Predviđanje ekspresije gena iz sekvence: ponovno ispitivanje. PLoS računala. Biol. 3, e243 (2007).

Bussemaker, H. J., Li, H. & Siggia, E. D. Detekcija regulatornih elemenata korištenjem korelacije s ekspresijom. Nat. Genet. 27, 167–171 (2001).

Kreimer, A. i sur. Predviđanje ekspresije gena u masovnim paralelnim reporterskim testovima: komparativna studija. Pjevušiti. Mutat. 38, 1240–1250 (2017).

Zhou, J. & amp Troyanskaya, O. G. Predviđanje učinaka nekodirajućih varijanti s modelom sekvence temeljenog na dubokom učenju. Nat. Metode 12, 931–934 (2015).

Aguet, F. i sur. Lokalni genetski učinci na ekspresiju gena u 44 ljudska tkiva. Priroda 550, 204–213 (2017).

Battle, A., Brown, C. D., Engelhardt, B. E. & Montgomery, S. B. Genetski učinci na ekspresiju gena u ljudskim tkivima. Priroda 550, 204–213 (2017).

Westra, H.-J. et al. Sustavna identifikacija trans eQTL-ova kao navodnih pokretača poznatih asocijacija bolesti. Nat. Genet. 45, 1238–1243 (2013).

Ramasamy, A. i sur. Genetska varijabilnost u regulaciji ekspresije gena u deset regija ljudskog mozga. Nat. Neurosci. 17, 1418–1428 (2014).

Fairfax, B.P. i sur. Genetika ekspresije gena u primarnim imunološkim stanicama identificira glavne regulatore specifične za stanični tip i uloge HLA alela. Nat. Genet. 44, 502–510 (2012).

Tewhey, R. i sur. Izravna identifikacija stotina varijanti koje moduliraju ekspresiju pomoću multipleksiranog reporterskog testa. stanica 165, 1519–1529 (2016).

MacArthur, J. i sur. Novi NHGRI-EBI Katalog objavljenih studija povezanosti na razini genoma (GWAS Catalog). Nukleinske kiseline Res. 45, D896–D901 (2017).

Germain, M. i sur. Genetika venske tromboze: uvidi iz nove studije povezanosti na razini cijelog genoma. PLoS One 6, e25581 (2011).

Tang, W. i sur. Studija o povezanosti genoma za vensku tromboemboliju: proširene skupine za istraživanje srca i starenja u konzorciju genomske epidemiologije (CHARGE). Genet. Epidemiol. 37, 512–521 (2013).

Plagnol, V. i sur. Analiza povezanosti na razini genoma pozitivnosti autoantitijela u slučajevima dijabetesa tipa 1. PLoS Genet. 7, e1002216 (2011).

Chu, X. i sur. Studija povezanosti na razini genoma identificira dva nova lokusa rizika za Gravesovu bolest. Nat. Genet. 43, 897–901 (2011).

Sawcer, S. i sur. Genetski rizik i primarna uloga stanično posredovanih imunoloških mehanizama u multiploj sklerozi. Priroda 476, 214–219 (2011).

Graham, R. R. i sur. Genetske varijante u blizini TNFAIP3 na 6q23 povezani su sa sistemskim eritematoznim lupusom. Nat. Genet. 40, 1059–1061 (2008).

Bentham, J. i sur. Analize genetske povezanosti impliciraju aberantnu regulaciju gena urođene i adaptivne imunosti u patogenezi sistemskog eritematoznog lupusa. Nat. Genet. 47, 1457–1464 (2015).

Lee, Y.-C. et al. Dva nova lokusa osjetljivosti na Kawasakijevu bolest identificirana analizom povezanosti na razini genoma. Nat. Genet. 44, 522–525 (2012).

Xi, H. i sur. Analiza pretjerano zastupljenih motiva u promotorima ljudske jezgre otkriva dvostruke regulatorne uloge YY1. Genom Res. 17, 798–806 (2007).

Stenson, P.D. i sur. Baza podataka o mutaciji ljudskih gena: ažuriranje iz 2008. Genom Med. 1, 13 (2009).

Nagaizumi, K. i sur. Dvije dvostruko heterozigotne mutacije u F7 gen pokazuju različite manifestacije. Br. J. Haematol. 119, 1052–1058 (2002).

Feldmann, J. i sur. Munc13-4 je bitan za fuziju citolitičkih granula i mutiran je u obliku obiteljske hemofagocitne limfohistiocitoze (FHL3). stanica 115, 461–473 (2003).

Ng, Y.-S., Wardemann, H., Chelnis, J., Cunningham-Rundles, C. & Meffre, E. Brutonova tirozin kinaza neophodna je za toleranciju ljudskih B stanica. J. Exp. Med. 200, 927–934 (2004).

Yamagata, K. i sur. Mutacije u genu hepatocitnog nuklearnog faktora-4α u dijabetesu mladih s početkom zrelosti (MODY1). Priroda 384, 458–460 (1996).

Servitja, J.-M. et al. Hnf-1α (MODY3) kontrolira tkivno specifične transkripcijske programe i ima suprotne učinke na rast stanica u otočićima gušterače i jetri. Mol. stanica. Biol. 29, 2945–2959 (2009).

Huang, F.W. i sur. Vrlo rekurentno TERT promotorske mutacije u ljudskom melanomu. Znanost 339, 957–959 (2013).

Vinagre, J. i sur. Učestalost od TERT promotorske mutacije u ljudskim karcinomima. Nat. komun. 4, 2185 (2013).

Pasaniuc, B. & amp Price, A. L. Seciranje genetike složenih svojstava korištenjem statistike sumarnih asocijacija. Nat. velečasni Genet. 18, 117–127 (2017).

Parkes, M. i sur. Varijante sekvence u genu za autofagiju IRGM i višestruki drugi replicirajući lokusi doprinose osjetljivosti na Crohnovu bolest. Nat. Genet. 39, 830–832 (2007).

Wellcome Trust Konzorcij za kontrolu slučajeva. Studija povezanosti u cijelom genomu 14.000 slučajeva sedam uobičajenih bolesti i 3.000 zajedničkih kontrola. Priroda 447, 661–678 (2007).

Barrett, J.C. i sur. Povezanost u cijelom genomu definira više od 30 različitih lokusa osjetljivosti na Crohnovu bolest. Nat. Genet. 40, 955–962 (2008).

Franke, A. i sur. Meta-analiza u cijelom genomu povećava na 71 broj potvrđenih lokusa osjetljivosti na Crohnovu bolest. Nat. Genet. 42, 1118–1125 (2010).

Josins, L. i sur. Interakcije domaćin-mikrob oblikovale su genetsku arhitekturu upalne bolesti crijeva. Priroda 491, 119–124 (2012).

Liu, J. Z. i sur. Analize povezivanja identificiraju 38 lokusa osjetljivosti na upalnu bolest crijeva i ističu zajednički genetski rizik među populacijama. Nat. Genet. 47, 979–986 (2015).

Kirino, Y. i sur. Analiza povezanosti na razini genoma identificira nove lokuse osjetljivosti na Behçetovu bolest i epistazu između HLA-B*51 i ERAP1. Nat. Genet. 45, 202–207 (2013).

Jiang, D.K. i sur. Genetske varijante u pet novih lokusa uključujući CFB i CD40 predisponira na kronični hepatitis B. Hepatologija 62, 118–128 (2015).

de Souza, N. Projekt ENCODE. Nat. Metode 9, 1046 (2012).

Bernstein, B.E. i sur. NIH Roadmap Epigenomics Mapping Consortium. Nat. Biotechnol. 28, 1045–1048 (2010).

Chen, T. & Guestrin, C. XGBoost. u Zbornik radova 22. međunarodne konferencije ACM SIGKDD o otkrivanju znanja i rudarenju podataka, 785–794 (ACM, San Francisco, 2016.).

Bühlmann, P. Pojačavanje za visokodimenzionalne linearne modele. Ann. stat. 34, 559–583 (2006).

Konzorcij projekta 1000 Genomes. Globalna referenca za ljudske genetske varijacije. Priroda 526, 68–74 (2015).

Efron, B. Veličina, snaga i stopa lažnih otkrića. Ann. stat. 35, 1351–1377 (2007).

Kircher, M. i sur. Opći okvir za procjenu relativne patogenosti ljudskih genetskih varijanti. Nat. Genet. 46, 310–315 (2014).

Gonzàlez-Porta, M., Frankish, A., Rung, J., Harrow, J. & Brazma, A. Analiza transkriptoma ljudskih tkiva i staničnih linija otkriva jedan dominantni transkript po genu. Genom Biol. 14, R70 (2013).

Uhlen, M. i sur. Karta ljudskog proteoma na bazi tkiva. Znanost 347, 1260419–1260419 (2015).

Forrest, A.R.R. i sur. Atlas ekspresije sisavaca na razini promotora. Priroda 507, 462–470 (2014).


Priznanja

Zahvaljujemo M. Picciottu, C. Pittengeru i A. Cheu na kritičkom čitanju rukopisa. Zahvaljujemo R. Terwilligeru na tehničkoj pomoći. Zahvaljujemo obiteljima koje su donirale ovo istraživanje. Ovaj rad je podržan sredstvima i korištenjem objekata u VA Connecticut Health Care System, West Haven, CT, Central Texas Veterans Health Care System, Temple, TX, Durham VA Healthcare System, Durham, NC, VA San Diego Healthcare System, La Jolla, CA, VA Boston Healthcare System, Boston, MA, SAD, i Nacionalni centar za PTSP, Ministarstvo za pitanja veterana SAD-a. Istraživanje o kojem se ovdje izvješćuje podržalo je Odjel za pitanja veterana, Uprava za zdravstvo veterana, VISN1 Career Development Award i nagrada za mlade istraživače Zaklade za istraživanje mozga i ponašanja M.J.G. a NIMH dodjeljuje MH093897 i MH105910 R.S.D. Ovdje izraženi stavovi su stavovi autora i ne odražavaju nužno stav ili politiku Ministarstva za pitanja veterana (VA) ili američke vlade.


Materijali i metode

Sakupljanje parazita i prilagodba kulture

Plasmodium falciparum Uzorci zaražene krvi prikupljeni su tijekom godina 2004.-2011. od febrilnih pacijenata koji su pohađali lokalne klinike smještene uz granicu Kine i Mijanmara. Jednostavan P. falciparum malarija je identificirana mikroskopom. Studiju su odobrili institucionalni odbori za reviziju Penn State University, Kunming Medical University i Department of Health of Kachin, a informirani pristanak dobiven je od svih odraslih sudionika i od roditelja/skrbnika djece. Prikupljanje i obrada uzoraka venske krvi provedeni su u skladu sa smjernicama odgovarajuće tehnologije u zdravstvu (PATH). Ukupno 94 izolata parazita (2 2004., 8 2007. 15 2008. 58 2009. 8 2010. i 4 2011.), za koje je utvrđeno da su monoklonske infekcije genotipizacijom tri polimorfna markera antigena msp1, msp2 i protein bogat glutamatom, preuzeti su iz arhive parazita prilagođenih kulturi i korišteni za in vitro test lijekova i genotipizacija. Rutinske kulture parazita održavane su u crvenim krvnim stanicama tipa O + u kompletnom mediju dopunjenom 6% humanog AB seruma u atmosferi od 90% N2/5% O2/5% CO2.

In vitro test lijekova i IC50 izračun

Standardni fluorescentni test na bazi SYBR Green I korišten je za procjenu osjetljivosti parazita na 10 antimalarijskih lijekova: DHA, AS, AM, PND, LMF, PPQ, MQ, CQ, QN i SP (S:P = 20:1, w/ w), od kojih su CQ i SP služili kao interne kontrole za provjeru valjanosti analize. DHA, AS, AM, MQ, CQ, QN i SP kupljeni su od Sigme (St. Louis, MO, SAD), dok su PND, LMF i PPQ nabavljeni od Kunming Pharmaceutical Co. (Kunming, Yunnan, Kina). Osnovna otopina AM otopljena je u dimetil sulfoksidu (DMSO), a SP u 40% DMSO. Ostali su pripremljeni kako je prethodno opisano 10 . In vitro kulture su sinkronizirane s dva kruga tretmana s 5% D-sorbitolom, a paraziti u prstenastom stadiju analizirani su na osjetljivost na lijek u mikrotitarskim pločama s 96 jažica na 1% hematokrita i 0,5% parazitemije. Testirana su tri biološka ponavljanja za svaki izolat i svaka koncentracija lijeka je ponovljena dvaput. Kako bi se smanjile varijacije između ploča, standardni laboratorijski klon 3D7 je uvijek bio uključen kao referenca. RSA je provedena za mjerenje osjetljivosti parazita u prstenastom stadiju na DHA prema INV10 Standardnoj operacijskoj proceduri 10 . IC50 mjereno je korištenjem modela nelinearne regresije u GraphPad Prism 5 (GraphPad Software, Inc. La Jolla, CA, SAD). Normalna raspodjela vrijednosti testa testirana je Shapiro-Wilkovim testom. Geometrijska sredina IC-a50 i 95% interval pouzdanosti izračunati su za normalno raspoređene podatke. Medijan i interkvartilni raspon izračunati su ako podaci nisu bili normalno raspoređeni. Korelacija između testova na lijekove procijenjena je Spearmanovim koeficijentima korelacije u R. Student t-test je primijenjen za istraživanje potencijalno značajnih razlika u srednjim vrijednostima testa između terenskih izolata i 3D7.

SNP niz i imputacija podataka

Genomska DNA parazita ekstrahirana je iz kultiviranih izolata pomoću Wizard® Genomic DNA Purification Kit (Promega, WI, SAD). Genomska DNK je genotipizirana korištenjem Affymetrix SNP niza visoke gustoće koji omogućuje ispitivanje više od 17 000 SNP-ova izvedeno u RML Genomics Unit, Research Technologies Branch, NIAID. BRLMM-P algoritam je korišten za pozivanje SNP-ova kao što je prethodno objavljeno 32 . Genotipovi su prebačeni u proračunsku tablicu za daljnje analize. SNP-ovi unutar var, rifin i stevor geni su isključeni radi smanjenja artefakata zbog dupliciranih sekvenci. SNP-ovi sa stopama poziva ispod 90% također su uklonjeni. SNP podaci su zatim imputirani korištenjem softvera BEAGLE v3.3.2 33 . Ovaj skup podataka dodatno je filtriran kako bi se uklonili višealelni i niskofrekventni SNP-ovi s MAF-om od <2% pomoću PLINK-a 1.9.

Mjerenje LD i određivanje strukture populacije

LD u paru u cijelom genomu izmjeren je pomoću PLINK 1.9, postavljajući zastavu -ld-window-r 2 na 0 da uključuje sve parove SNP-ova. Postavka ove zastavice na 0,3 korištena je za mjerenje SNP parova s ​​R2 > 0,3. Vrijednosti LD-a su nacrtane korištenjem R softverskog paketa. Strukturu populacije istraživao je PCA na temelju matrice odnosa standardizirane varijance koristeći PLINK 1.9.

Fenotipovi su transformirani prirodnim logaritmom i inverzno-normalnom transformacijom temeljenom na rangu. Kako bi se uračunale nule u RSA rezultatima, 0,5% je dodano svim vrijednostima za log-transformaciju. GWAS je proveden korištenjem više programskih paketa, GEMMA, PLINK 1.9, linearne regresije i neparametarske regresije u R. Osim toga, na analizu je primijenjen i novorazvijeni WarpedLMM koji procjenjuje optimalnu transformaciju fenotipova. Za PLINK, R i WarpedLMM, prve tri glavne komponente kao kovarijate primijenjene su za korekciju inflacije i smanjenje utjecaja strukture stanovništva. GEMMA procjenjuje genetsku povezanost prema genotipovima i automatski prilagođava inflaciju. P vrijednosti su dobivene iz svakog modela, a prag nakon Bonferronijeve korekcije (0,05/broj analiziranih SNP-ova) korišten je za procjenu značaja za cijeli genom. Q-Q grafikoni za P vrijednosti su korištene za procjenu robusnosti različitih modela u minimiziranju inflacije zbog stratifikacije stanovništva. Genomski faktor inflacije lambda (λ) izračunat je za svaki fenotip osjetljivosti na lijek pomoću R paketa snpStats. Planovi na Manhattanu generirani su modificiranim skriptama iz R paketa CMplot.

Analiza raznolikosti SNP-a

Genetska raznolikost na lokusima rezistencije procijenjena je prosječnom heterozigotnošću. Izračunali smo očekivanu heterozigotnost pomoću jednadžbe , gdje je On je očekivana heterozigotnost, n je veličina uzorka i pi je frekvencija ith alel. Vrijednosti heterozigotnosti prosječne su po genu, a ako je postojao samo jedan SNP u genu ili nije bilo napomene za jedan SNP, grupiran je u susjedni gen unutar 10 kb.

Nedavni odabir smjera

Pozitivnu selekciju na lokusima rezistencije ispitao je EHH u R paketu rehh 60, metoda koja detektira prijenos proširenog haplotipa bez rekombinacije. SNP-ovi na S220A in pfcrt, C59R in pfdhfr i T38N u pfatg18 služili su kao žarišni SNP-ovi u EHH analizi. iHS, koji je također implementiran u rehh, korišten je za identificiranje dalekosežne selekcije u cijelom genomu. iHS je standardizirani logaritamski omjer integrirane homozigotnosti proširenog haplotipa za alele predaka i izvedene alele u jezgri SNP, s velikim pozitivnim vrijednostima koje ukazuju na duge haplotipove koji nose alel predaka i velikim negativnim vrijednostima koje ukazuju na duge haplotipove koji nose izvedeni alel. I ekstremno pozitivni i negativni iHS rezultati su potencijalno zanimljivi, budući da se aleli predaka mogu stopirati s odabranim mjestom s visokim pozitivnim rezultatom 45 . Stoga smo koristili apsolutne vrijednosti iHS-a za snimanje neobično dugih haplotipova koji okružuju obje vrste alela.


4 Analiza povezanosti na razini genoma

4.1 Analiza asocijacije tipiziranih jednonukleotidnih polimorfizama (korak 7)

Analiza povezanosti obično uključuje regresiju svakog SNP-a zasebno na danu osobinu, prilagođenu kliničkim, demografskim i okolišnim čimbenicima na razini pacijenta. Pretpostavljeni temeljni genetski model povezivanja za svaki SNP (npr. dominantan, recesivan ili aditivni) utjecat će na rezultirajuće nalaze, međutim, zbog velikog broja SNP-ova i općenito neobilježenih odnosa s ishodom, obično se odabire samo jedan aditivni model. . U ovom slučaju i kao što je ilustrirano u priloženom kodu, svaki SNP je predstavljen kao odgovarajući broj sporednih alela (0, 1 ili 2). Značajno je da je kodiranje SNP varijabli temeljeno na alternativnim modelima (npr. dominantni ili recesivni) jednostavno, a opisana analiza povezanosti nastavlja se identično 26, 27 . U praksi, Bonferonnijevim ispravljenim pragom značajnosti za cijeli genom od 5 × 10 -8 koristi se za kontrolu stope pogreške u obitelji. Ova se granica temelji na istraživanju, koje sugerira približno milijun neovisnih SNP-ova u cijelom genomu (npr. 28), pa se obično primjenjuje bez obzira na stvarni broj tipiziranih ili imputiranih SNP-ova koji se istražuju.

U našem okruženju, dva genotipizirana SNP-a u regiji gena za protein za prijenos kolesterila (CETP), rs1532625 i rs247617, upućuju na povezanost (str < 5×10 −6 ) s dotičnim str-vrijednosti 8,92 × 10 −8 i 1,25 × 10 −7 . CETP je dobro okarakteriziran gen koji je prethodno bio povezan s HDL-C (npr. 26). Više informacija o ovim SNP-ovima i procesu postanalitičkog ispitivanja dano je u koracima 9 i 10 kasnije.

4.2 Analiza povezivanja imputiranih podataka (korak 8)

U ovoj fazi mapiramo 70 imputiranih SNP-ova u CETP regiju, od kojih je 16 značajno na pragu sugestivnog povezivanja od 5 × 10 -6 .


SM je dizajnirao studiju. SM, HN i DI su nadgledali studiju. TVH, JDB, HN, DH i SM izvršili su terensko ispitivanje i generirali podatke. DFC, SDM, JA, HS, DH i SM analizirali su podatke. SM, DFC i SDM napisali su rukopis uz doprinose drugih autora.

Autori zahvaljuju Alexu de Vliegheru i njegovom timu s Flandrskog istraživačkog instituta za poljoprivredu, ribarstvo i hranu (ILVO) za upravljanje terenskim pokusima, članovima raznih laboratorija u VIB-UGent Centru za biologiju biljnih sustava za pomoć pri berbi, Karlu Kremlingu za savjete o analizi podataka panela o raznolikosti, Ethalinda Cannon za uvelike olakšavanje dohvaćanja podataka iz MaizeGDB-a i tri anonimna recenzenta za vrlo korisne komentare. Sredstva za generiranje RNA-seq i metabolomskih podataka te financiranje rada DH i TVH osigurala je Syngenta Crop Protection, LLC. SDM je član Research Foundation-Flanders (FWO, grant 1146319N).


Jeroen van Rooij i Pooja R. Mandaviya dali su jednak doprinos kao prvi autori.

Peter A. C. ’t Hoen, Bas Heijmans i Joyce B. J. van Meurs dali su jednak doprinos kao i posljednji autori.

Pripadnosti

Odjel za internu medicinu, Erasmus Medical Center, Rotterdam, Nizozemska

Jeroen van Rooij, Pooja R. Mandaviya i Joyce B. J. van Meurs

Centar za sistemsku biologiju u Maastrichtu (MaCSBio), Sveučilište u Maastrichtu, Maastricht, Nizozemska

Fakultet medicinskih znanosti Sveučilišta u Groningenu, Groningen, Nizozemska

Studijska grupa Generation R, Odjel za epidemiologiju, Erasmus Medical Center, Rotterdam, Nizozemska

Studijska grupa Generation R, Odjel za pedijatriju, Erasmus Medical Center, Rotterdam, Nizozemska

Odjel za biološku psihologiju, Vrije Universiteit Amsterdam, Amsterdam, Nizozemska

Odjel za psihijatriju, VU University Medical Center, Amsterdam, Nizozemska

Odjel za genetiku, Sveučilište u Groningenu, Groningen, Nizozemska

Odjel za ljudsku genetiku, Leiden University Medical Center, Leiden, Nizozemska

Centar za molekularnu i biomolekularnu informatiku, Radboud Institute for Molecular Life Sciences, Radboud University Medical Center Nijmegen, Nijmegen, Nizozemska

Molekularna epidemiologija, Odjel za znanosti o biomedicinskim podacima, Medicinski centar Sveučilišta u Leidenu, Leiden, Nizozemska


Rezultati

Analize asocijacija na cijelom genomu

Kako bismo otkrili nove lokuse koji daju osjetljivost na perzistentnu HBV infekciju, proveli smo dvostupanjski GWAS (dopunska slika 1). U fazi otkrića GWAS-a, koristili smo genotipove od 12 027 jedinki pomoću različitih platformi za genotipizaciju koje osiguravaju pokrivenost cijelog genoma (Tablica 1 i Dodatna bilješka) 12,13,14,15. Uz raspoloživu plazmu/serum ovih ispitanika, odredili smo tko su od njih PI (slučajevi) ili SR (kontrole) probirom na površinski antigen hepatitisa B (HBsAg) i antitijela protiv HBsAg (anti-HBs) i jezgreni antigen hepatitisa B (anti-HBc). Ukupno, 1.251 slučaj i 1.057 kontrola bio je uključen u GWAS stadiju, od kojih su svi kineskog porijekla regrutirani iz provincija Guangxi, Guangdong i Jiangsu (Tablica 1, Dodatna tablica 1a i Dodatna bilješka). U fazi replikacije, uključena su četiri nezavisna skupa uzoraka kineskog podrijetla koji su regrutirani iz provincija Jiangsu, Guangxi, Guangdong i Peking (dodatna bilješka). Uz iste kriterije za uključivanje i isključenje uzorka kao i one korištene u fazi otkrivanja GWAS-a, faza replikacije se u potpunosti sastojala od 3.905 slučajeva i 3.356 kontrola (Tablica 1 i Dodatna tablica 1a) 16,17.

Kako bismo proširili pokrivenost na genomsku regiju u stadiju GWAS, koristili smo genotipove autosomnih SNP-ova koji su prošli stroge provjere kvalitete kako bismo imputirali genotipove SNP-a na kromosomima za sve subjekte (odjeljak Metode i Dodatna tablica 2). Izveli smo tri kruga imputacije koristeći podatke iz faze II projekta HapMap, faze III projekta HapMap i projekta 1000 genoma kao referenci i generirali genotipove od 2 177 782, 1 059 015 i 4 494 311 SNP-ova, odnosno 4,494,311 SNP-ova (tablica). Kako bismo procijenili točnost genotipizacije i imputacije, ponovno smo sekvencirali ∼ 127-Kb genomsku regiju na 1p36.22 u 274 ispitanika slučajno odabranih iz GWAS faze (dodatna napomena). Izvrsna podudarnost između genotipizacije niza i sekvenciranja uočena je kod ovih osoba (98,6% P<2,2 × 10 -16, Kappa test Dodatna tablica 4). Također je uočena visoka konzistentnost između imputacije i sekvenciranja (Pearsonova korelacija r=0.94, P<2,2 × 10 −16 Dodatna slika 2a). Štoviše, primijetili smo da su SNP-ovi visoke kvalitete imputacije (imputacija r 2 >0,8) pokazali su veću konzistentnost između imputacije i sekvenciranja od onih s niskom kvalitetom imputacije (Pearsonova korelacija r=0,95 i 0,86, redom Dodatna slika 2b,c).

Nakon što smo pokazali valjanost genotipizacije niza i podataka imputacije u GWAS fazi, zatim smo proveli analize povezanosti genotip-fenotip koristeći necijelobrojne brojeve alela u modelu logističke regresije, s prilagodbom za dob, spol i korekciju na temelju glavnih komponenti za stratifikaciju populacije. (Odjeljak o metodama i dopunska slika 3). Kvantil-kvantilni grafikon pokazao je dobro podudaranje između distribucija promatranih P vrijednosti i one očekivane slučajno (faktor inflacije λ=1,05 Dodatna slika 4), što ukazuje na minimalnu ukupnu inflaciju statističkih rezultata za cijeli genom.

Replicirano je nekoliko ranije prijavljenih SNP-ova

Nedavni GWASs identificirali su brojne SNP-ove koji su značajno povezani s rizikom od trajne HBV infekcije. U ovoj studiji potvrdili smo genetske učinke HLA-DP (indeks rs9277535, P=3,8 × 10 −6 i rs3077, P=2.3 × 10 −3 ), HLA-DQ (rs2856718, P=1,8 × 10 −3 i rs7453920, P=5.5 × 10 −6 ), CFB (rs12614, P=4,0 × 10 −3 ) i CD40 (rs1883832, P=6,9 × 10 −3 ) (Dopunska tablica 5), ​​koji su identificirani u prethodnim GWAS-ovima (ref. 6, 7, 10). Međutim, ostala četiri SNP-a (rs652888, rs1419881, rs3130542 i rs4821116) u ili blizu EHMT2, TCF19, HLA-C i UBE2L3 loci 8,9 nisu uspjeli biti replicirani u ovoj studiji (svi P>0,05 Dodatna tablica 5). Malo je vjerojatno da će ovi rezultati biti uzrokovani pogreškom imputacije, budući da su ova četiri SNP-a ili izravno genotipizirana ili imputirana s visokom kvalitetom imputacije (imputacija r 2 >0,96). Također smo pregledali prethodne studije povezivanja trajne HBV infekcije temeljene na genima. Pored SNP-a u HLA-DP i HLA-DQ, SNP-ovi u genu za mikroRNA MIR219A1 na 6p21.32 (ref. 18) također se repliciraju (P=2,6 × 10 −6 i 1,3 × 10 −6 za rs421446 i rs107822, odnosno Dodatna tablica 6). Međutim, drugi prethodno prijavljeni SNP-ovi nisu pokazali nikakve dosljedne povezanosti u ovoj studiji (dopunska tablica 6). Ove nedosljedne veze između naše studije i prethodnih studija mogu biti posljedica različitog dizajna studije ili rasne raznolikosti.

Da bi se dalje istražile veze između HLA klasičnih alela i perzistentne HBV infekcije, izveli smo HLA genotipizacija alela u silikonu na temelju poznatih SNP genotipova (dodatna napomena) korištenjem R paketa HIBAG (ref. 19). Četiri prethodno identificirana alela (HLA-DPB1*201, HLA-DQA1*301, HLA-DQB*301 i HLA-DQB*302) replicirani su u ovoj studiji (svi P<5 × 10 −3 Dodatna tablica 7) (ref. 9). Osim toga, novo smo identificirali alel HLA-DPB1*501 (P=4,0 × 10 -4), koji je bio u umjerenoj neravnoteži veze (LD) s prethodno identificiranim SNP-ovima rs3077 (r 2 =0,30) i rs9277535 (r 2 =0,56) (Dopunska tablica 7).

Nedavni GWAS su također identificirali nekoliko SNP-ova koji su povezani s fenotipovima jetre povezanim s HBV-om. Među tim SNP-ovima nekoliko je u HLA-DP i HLA-DQ koji su bili značajno povezani s odgovorom na cjepivo protiv hepatitisa B ili HBV povezan s HCC-om također su pokazali sugestivne povezanosti s perzistentnom HBV infekcijom (dopunska tablica 8), odražavajući zajedničke genetske čimbenike rizika među fenotipovima povezanim s HBV. Međutim, svi ostali SNP-ovi nisu pokazali povezanost s trajnom HBV infekcijom u našim GWAS podacima (dodatna tablica 8), što sugerira da su molekularni mehanizmi među tim fenotipovima uvelike različiti.

Identificiran je novi lokus osjetljivosti na 8p21.3

Pored prethodno prijavljenih SNP-ova u HLA-DP, HLA-DQ i MIR219A1, sedamdeset i dva lokusa pokazala su značajnu povezanost s P≤1 × 10 −4 u fazi otkrića GWAS u ovoj studiji. Zatim smo odabrali sva ova najbolja 72 signala za replikaciju (odjeljak s dodatnim podacima 1 i dopunskom tablicom 9 metoda) u neovisnom skupu uzoraka (faza replikacije 1, populacija Jiangsu). Od ova 72 testirana SNP-a, 6 SNP-a pokazalo je značajne povezanosti u istom smjeru kao što je uočeno u GWAS stadiju (Dodatni podaci 1). Ovih 6 SNP-a dodatno je genotipizirano u drugom skupu uzoraka (faza replikacije 2, populacija Guangxi), a repliciran je samo rs7000921 na 8p21.3 (dodatni podaci 1). Dosljedno, rs7000921 pokazao je dokaz povezanosti u fazi replikacije 3 (populacija Guangdonga) i stadiju 4 (dopunski podaci o populaciji u Pekingu 1). U kombiniranim analizama, rs7000921 (omjer izgleda (OR)=0,78, Pmeta=3,2 × 10 -12 ) dosegnuo je genomski značaj za povezanost s perzistentnom HBV infekcijom (slika 1a, tablica 2 i dodatna slika 5). Nije uočen dokaz heterogenosti za vrijednosti OR za rs7000921 među svim tim skupovima uzoraka (Pheterogenost=0,29 Tablica 2).

(a) Rezultati genetske povezanosti prikazani su za SNP-ove u regiji 1-Mb uzvodno ili nizvodno od indeksa SNP rs7000921. Genomske pozicije temelje se na NCBI Build 36. U meta-analizi, the P vrijednost rs7000921 prikazana je kao ljubičasti dijamanti, s njihovim početnim P vrijednost u fazi GWAS prikazana kao ljubičaste točkice. LD vrijednosti (r 2 ) do rs7000921 za ostale SNP-ove označene su bojom markera. Crvena označava r 2 ≥0,8, narančasta 0,6≤r 2 <0,8, zeleno 0,4≤r 2 <0,6, svijetloplava 0,2≤r 2 <0.4 i plava r 2 <0.2. Procijenjene stope rekombinacije (iz faze II projekta HapMap) prikazane su svijetloplavom bojom. Geni unutar regije koja okružuje rs7000921 su označeni, a položaji transkripata prikazani su strelicama. (b,c) Razine ekspresije mRNA obližnjih gena u ispitanika s različitim genotipovima rs7000921 (CC, CT i TT) su prikazani. Razine ekspresije mRNA su transformirane log2. Razine ekspresije svakog gena normalizirane su na srednju razinu homozigota za glavni alel rs7000921 (TT genotip) u 31 (b) ili 88 (c) uzorci tkiva ljudske jetre. Među 31 uzorkom jetre, jedan uzorak nije bio genotipiziran za rs7000921, stoga su analize ograničene samo na preostalih 30 uzoraka. Među 88 uzoraka jetre, tri ispitanika su smatrana izvanrednim (njihove razine mRNA od INTS10>mean+3 s.d. ili <mean −3 s.d.), stoga su analize ograničene u preostalih 85 uzoraka. P vrijednosti su izvedene iz analize linearne regresije i smatrale su se značajnima kada su ispod 0,05 nakon Bonferronijeve korekcije množenjem broja usporedbi. Trake grešaka označavaju s.e.m.

Nadalje smo istražili učinak rs7000921 na trajnu HBV infekciju koristeći stratifikaciju prema spolu i dobi. U združenim uzorcima slučaj-kontrola nismo pronašli značajne varijacije učinaka u podskupinama stratificiranim prema dobi ili spolu za rs7000921 (Pheterogenost=0.088 and 0.26, respectively Supplementary Table 10). The interaction effects between rs7000921 and viral factors (for example, HBV genotypes and mutations, and viral load) were not assessed because these data were not fully available in our samples. Therefore, the possibility that the association signals detected by rs7000921 reflect some other aspects of disease biology related to persistent HBV infection risk cannot be completely ruled out.

INTS10 was identified as the causative gene at 8p21.3

The SNP rs7000921 is located at intergenic region on chromosome 8p21.3. Six genes (CSGALNACT1, INST10, LPL, SLC18A1, ATP6V1B2 i LZTS1) are located within 1 Mb from this SNP (Fig. 1a). To identify potentially causative gene(s) at 8p21.3, we performed eQTL analyses based on liver tissues from 31 patients with persistent HBV infection (Methods section). We found that the protective minor allele C of rs7000921 was significantly associated with elevated transcript levels of INST10 (P=6.8 × 10 −3 Fig. 1b and Supplementary Data 2). This liver eQTL finding was then replicated in an independent sample set of 88 human liver tissues (P=3.1 × 10 −3 Fig. 1c, Supplementary Data 2 and Methods section) 20,21 . In these two sample sets, the expression of INST10 in protective allele carriers (TC ili CC of rs7000921) showing 22–31% elevation compared with that in risk allele carriers (TT Fig. 1b,c). The associations remained significant even after Bonferroni correction for multiple comparisons. When these two sample sets were pooled together, we achieved a more significant eQTL signal (Fisher’s combined P=2.5 × 10 −4 ). No significant eQTL signals were found between the rs7000921 and the other five genes at 8p21.3. Taken together, these results suggest a potential role for INTS10 in persistent HBV infection. However, the allele-specific changes of INST10 expression in liver tissues were not seen in lymphocytes of HapMap populations, suggesting that the underlying regulatory mechanism is tissue-specific.

To investigate candidate causative variants, we performed functional annotation for the genetic variants that are tagged by the index SNP rs7000921 (r 2 >0.7) on the basis of publically available data sets or tools (Supplementary Note and Supplementary Table 11). All the SNPs highly correlated with rs7000921 are located at intergenic regions, of which rs11991803 (r 2 =0.739) and rs4922214 (r 2 =0.729) are in conserved regions predicted to have high regulatory potential scores (Supplementary Table 11). The eQTL analyses of rs11991803 and rs4922214 showed genotype-specific expression of INST10, similar to the results of rs7000921 (Supplementary Fig. 6). We further checked the data from the Encyclopedia of DNA Elements (ENCODE) database, and found that the rs11991803 was within a transcriptional repressor CCCTC-binding factor–binding site detected in multiple cell types including the human hepatoma cell line HepG2, suggesting that this variant might be involved in gene regulation (Supplementary Fig. 7). Taken together, these observations suggest that the causative variants at 8p21.3 may have long-range action in the regulation of INTS10 expression in certain cell types and merit further investigation in the future.

INTS10 suppresses HBV replication

INTS10 is a subunit of the integrator complex, which can interact with RNA polymerase II to mediate 3′ end processing of small nuclear RNAs U1 and U2, the core components of spliceosome 22,23,24 . In addition, the integrator complex mediates transcriptional initiation, pause release and transcriptional termination at diverse classes of gene targets, including host small nuclear RNAs and coding genes and viral microRNAs 25,26,27 . INTS10 is expressed in a wide range of tissue types including in liver tissues, according to the RNA-Seq Atlas database 28 . However, the specific roles of INTS10 in diseases, for example, in persistent HBV infection, remain unclear.

To investigate whether the INTS10 plays a role on HBV replication, we used in vitro cell culture assay systems. The immortalized human hepatocyte cell line L02 was transfected with pAAV-HBV1.2 vectors, together with either pLV-EGFP-INTS10 or pLV-EGFP control vectors (Fig. 2a). Compared with the cells expressing control vectors, the significantly decreased levels of HBV markers, including replicative intermediates of HBV DNAs, HBV RNAs, HBsAg and hepatitis B e antigen (HBeAg), were observed in cells stably expressing exogenous INTS10 (all P<0.01 Fig. 2b–e and Supplementary Table 12). Consistent with these findings, knockdown by two independent siRNAs targeting INTS10 led to significantly elevated levels of HBV DNAs, HBV RNAs, HBsAg and HBeAg (all P<0.05 Fig. 2a,f–i). The antiviral activity of INTS10 against HBV is not limited to the L02 cells. INTS10 can also efficiently reduce the HBV markers in human hepatoma cell line HepG2.2.15 which constitutively produces HBV (Fig. 2j–r), and in human hepatoma cell line HepG2 which was co-transfected with the pAAV-HBV1.2 vectors (Supplementary Fig. 8). Taken together, these results suggest that INST10 plays a role in suppressing HBV replication in vitro.

(a) Protein levels of INTS10 in cellular lysates of L02 cells. L02 cells ( ∼ 2 × 10 5 ) were transfected with pAAV-HBV1.2 vectors, together with pLV-EGFP-INTS10 vector (INTS10) or pLV-EGFP control vector(Vector) (up) or with INTS10-specific siRNAs (Si-INTS10#1 and Si-INTS10#2) or non-targeting scrambled siRNA (Si-Ctrl) (down). (b,c) Levels of HBV DNAs (b), 3.5 Kb pregenomic RNAs (pgRNAs) and 2.4/2.1 Kb Pre-S/S RNAs (c) in L02 cells with INTS10 overexpression. (d,e) Levels of HBsAg (d) and HBeAg (e) in supernatants of L02 cells with INTS10 overexpression. (f,g) Levels of HBV DNAs (f), pgRNAs and Pre-S/S RNAs (g) in L02 cells with INTS10 knockdown. (h,i) Levels of HBsAg (h) and HBeAg (i) in supernatants of L02 cells with INTS10 knockdown. (j) Protein levels of INTS10 in cellular lysates of HepG2.2.15 cells. HepG2.2.15 cells ( ∼ 2 × 10 5 ) were transfected with INTS10 or control vectors (up), or with INTS10-specific or control siRNAs(down). (k,l) Levels of HBV DNAs (k), pgRNAs and Pre-S/S RNAs (l) in HepG2.2.15 cells with INTS10 overexpression. (m,n) Levels of HBsAg (m) and HBeAg (n) in supernatants of HepG2.2.15 cells with INTS10 overexpression. (o,str) Levels of HBV DNAs (o), pgRNAs and Pre-S/S RNAs (str) in HepG2.2.15 cells with INTS10 knockdown. (q,r) Levels of HBsAg (q) and HBeAg (r) in supernatants of HepG2.2.15 cells with INTS10 knockdown. All the supernatants and cells were collected 72 h post-transfection. Protein levels of INTS10 were examined by western blot analyses. HBV DNA levels in cells were measured by Southern blot analysis (left) and quantitative real-time PCR (qRT-PCR right). The pgRNAs and Pre-S/S RNAs of HBV in cells were measured by northern blot analysis with 18S ribosome RNA (rRNA) indicating RNA loading in each lane (left), and qRT-PCR normalized to human β-actin gene ACTB (pravo). The levels of HBsAg and HBeAg in supernatants were measured by enzyme-linked immunosorbent assays (ELISA). Error bars indicate s.d. P values were determined using two-tailed unpaired t-test. *P<0,05, **P<0.01 and ***P<0,001. rcDNA, relaxed circular DNA dsDNA, double-stranded DNA ssDNA, single-stranded DNA.

INTS10 suppresses HBV replication via IRF3-dependent manner

We then sought to explore the underlying mechanisms by which INTS10 suppresses HBV replication by analysing mRNA expression profiles of liver tissues from 31 HBV carriers (Supplementary Note). Comparing samples with high INTS10 expression to samples with low INTS10 expression, we identified 402 differentially expressed genes (false discovery rate P value<0.01 and fold change>1.2 Supplementary Data 3a) in determining biological pathways that are altered after INTS10 dysregulation. Intriguingly, we observed significant enrichment and activation of the spliceosome (Pnominal=1.5 × 10 −5 , ranks the first) and the retinoic acid-inducible gene-I-like receptor (RLR) signalling pathway (Pnominal=1.8 × 10 −3 , ranks the second Supplementary Data 3b) in samples with high INTS10 izraz. Given the important roles of integrator complex in spliceosome, the enrichment of term spliceosome may reflect the intrinsic physiologic function of INTS10. Notably, however, the RLR members such as retinoic acid-inducible gene-I (RIG-I) and melanoma differentiation-associated gene 5 (MDA5) have been shown to sense the HBV and activate innate immune signalling in hepatocytes to suppress virus replication 29,30,31 . To determine whether the RLR signalling pathway was regulated by INTS10 in other independent samples, we performed similar analyses in two data sets from the Gene Expression Omnibus (GEO) database (accession number GSE25097 and GSE22058), which contain 289 and 96 liver tissues, respectively (Supplementary Data 3c,d). Again, the term spliceosome ranked the first in both data sets (Pnominal=1.0 × 10 −8 and 2.6 × 10 −3 , respectively), and the RLR-related pathway ranked the third (Pnominal=2.6 × 10 −2 ) and ninth (Pnominal=0.20), respectively (Supplementary Data 3b). Taken together, these results suggest that INST10 may be involved in inhibition of HBV replication through the RLR pathway.

Binding of RLRs to virus-derived nucleic acids activates the downstream signalling pathways in a manner dependent on the adaptor protein mitochondrial antiviral signalling protein (also known as IPS-1, VISA or Cardif), leading to the activation of the IRF3 and NF-κB and the subsequent production of type I interferons (IFNs, including IFN-α and IFN-β) and type III IFNs (that is, IFN-λ, including IFNL1 (also known as IL29), IFNL2 (IL28A) and IFNL3 (IL28B)) and inflammatory cytokines 32 . Thus, we examined whether the HepG2.2.15 cells transfected with the INTS10 expression plasmid could activate the IRF3 and NF-κB. We found that overexpression of INTS10 could increase IRF3 phosphorylation (p-IRF3), whereas the NF-κB could not be activated (Fig. 3a). Consistent with these findings, knockdown of INTS10 by siRNAs led to significantly decreased levels of p-IRF3, whereas not influencing the activity of NF-κB (Fig. 3b). Furthermore, we found that overexpression of INTS10 could potently activate IFN-stimulated response element (ISRE) in reporter assays (P<0.01 Fig. 3c) and elevate mRNA levels of type III IFNs (IFNL1 i IFNL2/3 P<0.05 Fig. 3d and Supplementary Table 12), but not influence the type I IFNs. Consistent with these findings, knockdown of INTS10 significantly reduced the activity of ISRE reporter and mRNA levels of IFNLN1 i IFNLN2/3 (Fig. 3e,f). To ensure that these observations could be applied to other types of hepatocytes, we then did the same experiments in L02 and HepG2 cells co-transfected with HBV1.2 vectors and obtained identical results (Supplementary Figs 9 and 10). Next, we investigated whether the IRF3 pathway is required for the INTS10-elicited immunity against HBV infection. Indeed, we found that the activation of ISRE reporter, elevation of mRNA levels of type III IFNs and the reduction of HBV markers by enforced INTS10 expression were weakened when cells were transfected with siRNAs targeting IRF3 (Fig. 3g–m and Supplementary Fig. 11). Accordingly, in the liver tissues of patients persistently infected with HBV, we observed that the protein levels of INTS10 were positively correlated with those of p-IRF3 (ρ=0.38, P=0.015), but not p-p65 (Fig. 4a–c and Supplementary Table 13). Taken together, these results suggest that INTS10 suppresses HBV replication in an IRF3-dependent manner.

(a,b) Levels of phosphorylated (p-) or total proteins in lysates of HepG2.2.15 cells measured by western blot analyses, with GAPDH or Tubulin indicating protein loading in each lane. The cells were transfected with pLV-EGFP-INTS10 vector (INTS10) or pLV-EGFP control vector (Vector) (a), or with INTS10-specific siRNAs (Si-INTS10#1 and Si-INTS10#2) or non-targeting scrambled siRNA controls (Si-Ctrl) (b). (c) Luciferase activity of ISRE reporter plasmids 48 h after co-transfection into cells with INTS10 or control vectors. RLU, relative luciferase units. (d) The mRNA levels of IFNL1 i IFNL2/3 measured by quantitative real-time PCR (qRT-PCR) normalized to human β-actin gene ACTB in cells transfected with INTS10 or control vectors. (e) Luciferase activity of ISRE reporter plasmids 48 h after co-transfection into cells with INTS10-specific or control siRNAs. (f) The mRNA levels of IFNL1 i IFNL2/3 measured by qRT-PCR normalized to ACTB in cells transfected INTS10-specific or control siRNAs. (g) Luciferase activity of ISRE reporter plasmids 48 h after co-transfection into cells with INTS10 or control vectors and an IRF3-specific siRNA (Si-IRF3#1) or non-targeting scrambled siRNA controls (Si-Ctrl). (h) Levels of INTS10 and IRF3 measured by western blot analyses, with GAPDH indicating protein loading in each lane. (i) The mRNA levels of IFNL1 (lijevo) i IFNL2/3 (right) measured by qRT-PCR normalized to ACTB in cells co-transfected with INTS10 or control vectors and IRF3-specific or control siRNAs. (j,k) Levels of HBV DNAs (j), 3.5 Kb pregenomic RNAs (pgRNAs) and 2.4/2.1 Kb Pre-S/S RNAs (k) in cells co-transfected with INTS10 or control vectors andIRF3-specific or control siRNAs measured by qRT-PCR normalized to ACTB. (l,m) Levels of HBsAg (l) and HBeAg (m) in supernatants of cells co-transfected with INTS10 or control vectors and IRF3-specific or control siRNAs measured by enzyme-linked immunosorbent assays (ELISA). All histograms show mean values from three independent experiments error bars indicate s.d. P values were determined using two-tailed unpaired t-test. *P<0,05, **P<0.01 and ***P<0,001.

(a) Representative images from the liver tissues by immunohistochemistry staining are shown for INTS10, p-p65 and p-IRF3, respectively. The scale bar represents 50 μm. (b,c) The correlation of protein levels between INTS10 and p-IRF3 (b), or between INTS10 and p-p65 (c). Protein levels of INTS10, p-p65 and p-IRF3 were measured in the non-tumour liver tissues of patients with HBV-related HCC by immunohistochemistry staining (n=40). The size of the circle is proportional to the number of samples. A Spearman’s test was used, and the correlation coefficiency (ρ) and the two-tailed P values are shown. (d) The concentration of the plasma INTS10 in persistently HBV infected subjects (PIs) and spontaneously recovered subjects (SRs). The plasma INTS10 levels were measured by enzyme-linked immunosorbent assays (ELISA) in 216 PIs and 80 SRs. Horizontal bars indicate the mean value of each subset. The significance was calculated using two-tailed unpaired t test. (e) Correlation between the plasma INTS10 and HBV DNA load in PIs with positive HBeAg (left) and PIs with negative HBeAg (right). The plasma INTS10 and HBV DNA load were log10 transformed. The correlation coefficiency (r) and the two-tailed P values were then evaluated by Pearson’s test. P values were considered to be significant when below 0.05.

INTS10 correlates with the persistence of HBV infection

To further validate the roles of INTS10 in facilitating HBV clearance, we investigated the plasma INTS10 from subjects persistently infected HBV or those spontaneously recovered from HBV infection. Consistent with the eQTL result in liver tissues, we observed elevated INTS10 protein levels in the plasma of rs7000921 C allele carriers (P=0.020, unpaired t-test Supplementary Fig. 12). Furthermore, the levels of plasma INTS10 in 216 PIs were significantly lower than those in 80 SRs (P=2.0 × 10 −19 , fold change=2.0 Fig. 4d and Supplementary Table 1b). In addition, we found significantly negative correlation between the INTS10 levels and HBV DNA load in the plasma of PIs with positive HBeAg (Pearson correlation coefficient r=−0.41, P=2.5 × 10 −3 ) and those with negative HBeAg (r=−0.17, P=0.028 Fig. 4e). Taken together, these results further support our genetic and functional findings, indicating that insufficiency of INTS10 may contribute to the persistence of HBV infection.


Financiranje

The National Institutes of Health (grant numbers R01 EB022574, R01 LM011360, U01 AG024904, R01 AG19771, P30 AG10133, R01 CA129769, UL1 TR001108 and K01 AG049050) Department of Defense (grant numbers W81XWH-14-2-0151, W81XWH-13-1-0259 and W81XWH-12-2-0012) and National Collegiate Athletic Association (grant number 14132004), as well as by the Indiana University Network Science Institute (IUNI), the Alzheimer’s Association, the Indiana Clinical and Translational Science Institute and the Indiana University/IU Health Strategic Neuroscience Research Initiative (in part).

Jingwen Yan is an assistant professor in the Department of BioHealth Informatics, School of Informatics and Computing, Indiana University Purdue University Indianapolis, USA.

Shannon L. Risacher is an assistant professor in the Department of Radiology and Imaging Sciences, Indiana University School of Medicine, USA.

Li Shen is an associate professor in the Department of Radiology and Imaging Sciences, Indiana University School of Medicine, USA.

Andrew J. Saykin is a professor in the Department of Radiology and Imaging Sciences, Indiana University School of Medicine, USA.


Gledaj video: 10. Genome Wide Association Study (Srpanj 2022).


Komentari:

  1. Douzragore

    watch everyone

  2. Thanh

    Really even when I wasn't aware of it before

  3. Goltizil

    Po mom mišljenju niste u pravu. uvjeren sam. Piši mi na PM pa ćemo razgovarati.



Napišite poruku