Būdingos būklės specifinių genų bendrojo išraiškos modeliai vėžiu

Smegenų plovimas (7/7) - Prigimtis ar auklėjimas (Liepa 2019).

Anonim

Clemsono universiteto profesorius, absolventas, buvęs IT darbuotojas ir du mokiniai, pristatė kompiuterinę programinę įrangą, kuri gali rūšiuoti genus, kad geriau suprastų, kaip jie sąveikauja dėl ligos. Rugpjūtį paskelbta žurnale " Scientific Reports ", programinė įranga padės mokslininkams išnagrinėti sudėtingus požymius, kuriuos kontroliuoja daugybė genų.

Žinomas kaip "Knowledge Independent Network Construction" (KINC), programinės įrangos paketas yra daugelio metų mokslinių tyrimų, kuriuos atliko genetikos ir biochemijos katedros profesorius Aleksas Feltusas, kulminacija. "Feltus" buvęs studentas Stephenas Ficklinas, dabar asistentas Vašingtono valstijos universitete, sukūrė programinę įrangą. Bakalauro ir magistrantūros studijuotojai Lelandas Dunwoodie ir Willas Poehlmanas dirbo su CCIT darbuotoju Kim Roche, šiuo metu Dukeo doktorančiu, rinkti ir analizuoti duomenis.

Išskleidus daugiau nei 2 000 gemalų išvestinių savybių duomenų rinkinių iš "Cancer Genome Atlas" - viešos informacijos apie 33 skirtingų vėžio formų genominę informaciją saugyklą, komanda sugebėjo statistiškai ir vizualiai organizuoti genus, remdamasi bendromis funkcijomis.

"Idėja yra tai, kad tuo pačiu metu, kai du genai yra, jie gali dirbti kartu", - sakė Feltusas. "Taigi mes sudaužėme tarpusavyje sąveikaujančių genų tinklą ir galėjome rasti penkis, 20, o kartais ir tūkstančius genų, kurie turi pakilti ir sugriauti kartu savo išraiškingumo lygiuose. Tada mes galime pasakyti: Na, kokie yra šie genų paketai? " "

Naudodami KINC programinę įrangą, mokslininkams nereikia turėti išankstinių žinių apie tai, koks turėtų būti genų tinklas, nes programinė įranga paleis duomenis, kad nustatytų, kaip genus reikėtų klasifikuoti. Šis nepriklausomas nuo žinių metodas sumažina "triukšmo" kiekį - nuo laboratorinių protokolų ar natūralių ląstelių svyravimų, kurie gali apsisaugoti nuo genetinių sąveikų.

"Kartais programinė įranga rūšia mėginius į tuos pačius navikų grupes, o tai mums buvo skydliaukė, šlapimo pūslė, kiaušidės ir dviejų rūšių smegenų augliai: glioma ir glioblastoma", - sakė Feltusas. "Tačiau kartais kiekvienos poros genų programinė įranga žiūri į tai, kaip jie yra tarpusavyje susiję skirtingose ​​mėginių grupėse. Taigi, galbūt jūs pastebėsite, kad šie du genai sąveikauja tik su skydliaukės vėžiu, todėl jie yra labiau linkę turi būti specifinė skydliaukės ir vėžio specifinė genų sąveika. Tačiau programinė įranga taip pat gali būti specifinė auglio rūšiai, nustatant sąveiką, kuri įvyksta ankstyvojo stadijos navikų, pažengusių stadijų navikų, vyrų navikų, moterų navikų ar netgi etninės kilmės. "

Kai KINC sugrupavo genus į grupes, mokslininkai gali atlikti gilesnius statistinius tyrimus, kad atskleistų koreliacijas tarp genų ir korinių takų. Gautame genų bendrojo išraiškos tinkle (GCN) du genai, kurie turi didelę tikimybę sąveikauti tarpusavyje, bus sujungti linija, vadinama kraštu.

Nenuostabu, kad kuriant genų tinklus, kuriuose paprastai yra daug duomenų rinkinių, komandos tyrimas parodė, kad GCN turi tiek daug genų sąveikų - tiek daug kraštų - kad jis panašus į plaukuotuvę.

"Moksleivyje visada stengiamės sumažinti sistemą iki vieno ar dviejų kintamųjų. Tačiau naudojant bioinformatiką, mes sumažiname šimtus tūkstančių kintamųjų iki šimtų", - sakė Feltusas. "Mes suprantame sistemos sudėtingumą, bet mes norime, kad jis būtų prasmingas, išlygindamas triukšmą".

Norint apdoroti ir analizuoti šiuos sudėtingus genominius duomenis, bioinformatikos sričiai reikalingi greitųjų ir didelio masto skaičiavimo sugebėjimai. Atsižvelgiant į tai, kad tik vienas eksperimentas generuoja 700 terabaitų duomenų - užtenka užpildyti daugiau nei 700 nešiojamųjų kompiuterių su duomenų failais - lengva suprasti, kodėl bioinformatika ir superkompiuteriai vyksta rankiniu būdu.

Laimei, Clemsono universitetas turi "Palmetto" klasterį, kuris yra vienas iš 100 geriausių pasaulyje superkompiuterių Pendletono mieste. Kadangi tai veikia pagal demokratizuotą Kondominiumo modelių sistemą, bet koks "Clemson" fakultetas, personalas ar studentas gali užsiregistruoti sąskaitai ir nemokamai naudotis superkompiuteriu. Tačiau, atsižvelgiant į tai, kad tai pasidalijama tarp daugybės žmonių, grupės vėžio tyrimų duomenų saugojimo apimtis buvo ribota.

"Palyginti su tradicinėmis bendrojo išraiškos analize, mūsų KINC programinė įranga buvo didelis skaičiavimo iššūkis", - sakė Poehlmanas. "Mes greitai suvokėme, kad negalėjome generuoti rezultatų per pagrįstą laiką, naudodamiesi tik" Clemson "čia esančiu superkompiuteriu, todėl aš daug laiko dirbau su" Open Science Grid ", kad galėčiau kurti darbo eigą, leidžiančią mums pasinaudoti skaičiavimo ištekliais. šalis užbaigti šį eksperimentą. "

KINC plėtra tapo platesnio tyrimo, kurį atliko Feltusas ir kolegė Melissa Smithas iš elektros ir kompiuterių inžinerijos katedros "Mokslinių duomenų analizė skale" arba SciDAS. Finansuojant 2, 95 mln. USD nacionalinio mokslo fondo dotacija, komanda ketina sukurti nacionalinę skaičiavimo sistemą, kad duomenų apdorojimas būtų efektyvesnis.

"Naudodamiesi" SciDAS ", dabar mes dinamiškai generuojame superkompiuterius, perimdami vieną superkompiuterį ir sukūrę naują superkompiuterį per pažangius tinklus, naudodamiesi KINC, kaip apdorojame duomenis iš daugelio daugelio rūšių. Tada mes pateikiame duomenis išsiplėtus šioms paskirstytoms kompiuterių sistemoms, atverdama galimybę apdoroti šias dideles duomenų rinkinius žmonėms ", - sakė Feltusas.

Dunwoodie, kuris, atlikdamas komandos tyrimą, atskleidė 22 gliukozei būdingus genus, teigė esąs garbės prisijungti KINC algoritmą prie vėžio biologijos. Šiuo metu jis rengia dokumentą, kuriame analizuojama, kaip šie genai veikia auglių glioblastomą.

Komandos programinė įranga yra nemokama ir prieinama visuomenei. Tie, kurie atsisiųsti KINC, gali net pakeisti savo mokslinių tyrimų poreikius pakeisdami savo kodą tiek, kiek jie viešai paskelbia savo modifikuotą versiją.