北京生物/藥物信息學(xué)分析數(shù)據(jù)科學(xué)活動(dòng)

來(lái)源: 發(fā)布時(shí)間:2022-01-23

    GeneInteraction基因互作:基因相互作用指miRNA、lncRNA、circRNA或其它RNA介導(dǎo)DNA轉(zhuǎn)錄,從而影響mRNA的表達(dá)過(guò)程。通俗意義上來(lái)說(shuō),基因互作關(guān)系指基于序列預(yù)測(cè)的靶基因?qū)?。miRNA通過(guò)與靶mRNA的結(jié)合,或促使mRNA降解,或阻礙其翻譯,從而***目的基因的表達(dá)。競(jìng)爭(zhēng)性?xún)?nèi)源RNA網(wǎng)絡(luò)是靶基因預(yù)測(cè)的研究深入,簡(jiǎn)稱(chēng)ceRNA網(wǎng)絡(luò)。通過(guò)進(jìn)行ceRNA網(wǎng)絡(luò)的分析,我們能從一個(gè)更為宏觀(guān)的角度來(lái)解釋轉(zhuǎn)錄體如何構(gòu)建基因表達(dá)調(diào)控網(wǎng)絡(luò),從而進(jìn)一步挖掘基因在其中的調(diào)控機(jī)制?;驹恚簃iRNA主要通過(guò)與靶基因的非翻譯區(qū)(UTR)結(jié)合而發(fā)揮其作用,對(duì)miRNA和mRNA、lncRNA、circRNA結(jié)合進(jìn)行的預(yù)測(cè)稱(chēng)為靶基因預(yù)測(cè)。靶基因預(yù)測(cè)使用軟件根據(jù)miRNA和靶基因間的結(jié)合的規(guī)律預(yù)測(cè)結(jié)合基因?qū)?。在生物體內(nèi),miRNA可以通過(guò)與proteincoding特異性結(jié)合,影響相關(guān)基因的表達(dá),從而參與調(diào)控細(xì)胞內(nèi)的各項(xiàng)功能。ceRNA具有miRNA結(jié)合位點(diǎn),能后競(jìng)爭(zhēng)性地結(jié)合miRNA,***miRNA對(duì)靶基因的調(diào)控。例如lncRNA與miRNA競(jìng)爭(zhēng)性結(jié)合,影響miRNA調(diào)控mRNA的過(guò)程,**終導(dǎo)致的mRNA表達(dá)失調(diào)。我們使用基于序列預(yù)測(cè)的軟件對(duì)差異分析得到的miRNA與mRNA,lncRNA,circRNA進(jìn)行靶點(diǎn)預(yù)測(cè)和ceRNA網(wǎng)絡(luò)分析。 多鏈條批量處理、快速獲得研究靶點(diǎn)。北京生物/藥物信息學(xué)分析數(shù)據(jù)科學(xué)活動(dòng)

    **突變頻譜分析(突變模式):目的:輸入突變數(shù)據(jù),用非負(fù)矩陣分解方法NMF分析突變特征,描述樣本集的突變模式。什么是突變模式:這也是對(duì)TCGA數(shù)據(jù)的深度挖掘,從而提出的一個(gè)統(tǒng)計(jì)學(xué)概念。文章(Signaturesofmutationalprocessesinhumancancer)研究了30種**,發(fā)現(xiàn)21種不同的mutationsignature。如果理解了,就會(huì)發(fā)現(xiàn)這個(gè)其實(shí)蠻簡(jiǎn)單的,他們并不重新測(cè)序,只是拿已經(jīng)有了的TCGA數(shù)據(jù)進(jìn)行分析,而且居然是發(fā)表在nature上面!文章研究了4,938,362mutationsfrom7,042cancers樣本,突變頻譜的概念只是針對(duì)于somatic的mutation。一般是對(duì)**病人的**組織和*旁組織配對(duì)測(cè)序,過(guò)濾得到的somaticmutation,一般一個(gè)樣本也就幾百個(gè)somatic的mutation。還有其它文章(Mutationalsignatures:thepatternsofsomaticmutationshiddenincancergenomes)也是這樣分析的從2013年提出到現(xiàn)在,已經(jīng)有30種mutationsiganures,在cosmic數(shù)據(jù)庫(kù)有詳細(xì)記錄,更新見(jiàn):MutationalSignatures。它的概念就是:根據(jù)突變上下文分成96類(lèi),然后每類(lèi)突變的頻率不一樣畫(huà)一個(gè)條形圖,可視化展現(xiàn)。應(yīng)用場(chǎng)景:突變特征定義:體細(xì)胞突變是多個(gè)突變過(guò)程如DNA修復(fù)缺陷,暴露于外源或內(nèi)源誘變劑等綜合結(jié)果。 山東生物/藥物信息學(xué)分析數(shù)據(jù)科學(xué)口碑推薦軟硬件配套,完成數(shù)據(jù)收集、整理、檢索、分析與智能化開(kāi)發(fā)工作。

    **初目的:對(duì)手上的**樣本(或病人)進(jìn)行分型分析,期望找到不同的亞型,并對(duì)應(yīng)不同的臨床特征??蓴U(kuò)展應(yīng)用到:所有樣本的亞型分析,用于樣本的特征分析。數(shù)據(jù)可用轉(zhuǎn)錄組、基因組、甲基化、蛋白質(zhì)組等。輸入數(shù)據(jù)格式:一個(gè)數(shù)值矩陣,行是基因或者其他特征,列是樣本。本分析要求樣本數(shù)要多,有利于亞型的分析。參考文獻(xiàn):(2)::本文利用室管膜瘤病人的甲基化數(shù)據(jù),首先進(jìn)行了tSNE分型,隨后又采用了新的方法spectralclustering進(jìn)行分類(lèi)分析,作者比較了兩種分類(lèi)方法。使用spectralclustering的分類(lèi),鑒定了每一種**亞型的特異性表達(dá)模式。并且發(fā)現(xiàn)spectralclustering的分類(lèi)和病人的臨床特征有關(guān),從而提出一種新的室管膜瘤亞型,可用于臨床的篩選和檢測(cè)。

    單細(xì)胞測(cè)序數(shù)據(jù)挖掘:GEO目前收錄的單細(xì)胞研究樣本已經(jīng)超過(guò)2萬(wàn)例,單細(xì)胞測(cè)序幾乎成為生物醫(yī)學(xué)領(lǐng)域CNS***文章的標(biāo)配。實(shí)驗(yàn)費(fèi)用高昂,阻斷了CNS夢(mèng),既然其他數(shù)據(jù)可以挖,單細(xì)胞測(cè)序數(shù)據(jù)照樣可以挖。已知公共數(shù)據(jù)庫(kù)中單細(xì)胞測(cè)序數(shù)據(jù)涉及各種疾病類(lèi)型,包括**、免疫細(xì)胞、炎癥類(lèi)甚至神經(jīng)、肌肉、骨骼等,樣本豐富、數(shù)據(jù)龐大,你不挖就是失去了一座金山。我們提供各種設(shè)計(jì)單細(xì)胞測(cè)序、各種測(cè)序、芯片、多組學(xué)的公共數(shù)據(jù)庫(kù)挖掘、培訓(xùn)、模型構(gòu)建、臨床統(tǒng)計(jì)、算法還原服務(wù);你能想到,我能做到;你提供參考文獻(xiàn)、思路和目的,我們提供結(jié)果;如果沒(méi)有思路,我們提供付費(fèi)科研設(shè)計(jì)服務(wù)。示例如下:利用公共數(shù)據(jù)庫(kù)的1539個(gè)單細(xì)胞樣本,構(gòu)建自己的生物學(xué)故事。 按照斯普林格學(xué)術(shù)規(guī)范化處理準(zhǔn)則提供文稿同行**投稿前意見(jiàn)評(píng)估。

棒棒糖圖是直觀(guān)顯示蛋白質(zhì)結(jié)構(gòu)上的突變點(diǎn)**簡(jiǎn)單且有效的方式。許多致*基因具有比任何其他基因座更頻繁突變的優(yōu)先位點(diǎn)。這些位點(diǎn)被認(rèn)為是突變熱點(diǎn),棒棒糖圖可以用于顯示突變熱點(diǎn)以及其他突變位點(diǎn)。并可以對(duì)比不同**/亞型的突變位點(diǎn)。

基本原理

將蛋白質(zhì)結(jié)構(gòu)根據(jù)氨基酸順序繪制為長(zhǎng)條形,以不同色塊標(biāo)注不同結(jié)構(gòu)域,在基因突變導(dǎo)致氨基酸改變的位置標(biāo)注棒棒糖,并在棒棒糖圓球標(biāo)注位點(diǎn)的突變頻數(shù)以及突變位點(diǎn)。

數(shù)據(jù)要求

基因突變或者蛋白質(zhì)突變數(shù)據(jù)


下游分析

1、突變位點(diǎn)靶向藥物分析

2、驅(qū)動(dòng)基因突變分析 檢測(cè)服務(wù)及數(shù)據(jù)分析助力取得2020年國(guó)自然面上十項(xiàng)、青年基金十八項(xiàng)。山東生物/藥物信息學(xué)分析數(shù)據(jù)科學(xué)口碑推薦

OmicCircos圖可以對(duì)感興趣的多個(gè)基因,展示其染色體的位置、拷貝數(shù)變異等多個(gè)特征。北京生物/藥物信息學(xué)分析數(shù)據(jù)科學(xué)活動(dòng)

    GSVA(基因集變異分析,反映了樣本和感興趣的通路之間的聯(lián)系):GSVA全名Genesetvariationanalysis(基因集變異分析),是一種非參數(shù),無(wú)監(jiān)督的算法。與GSEA不同,GSVA不需要預(yù)先對(duì)樣本進(jìn)行分組,可以計(jì)算每個(gè)樣本中特定基因集的富集分?jǐn)?shù)。換而言之,GSVA轉(zhuǎn)化了基因表達(dá)數(shù)據(jù),從單個(gè)基因作為特征的表達(dá)矩陣,轉(zhuǎn)化為特定基因集作為特征的表達(dá)矩陣。GSVA對(duì)基因富集結(jié)果進(jìn)行了量化,可以更方便地進(jìn)行后續(xù)統(tǒng)計(jì)分析。如果用limma包做差異表達(dá)分析可以尋找樣本間差異表達(dá)的基因,同樣地,使用limma包對(duì)GSVA的結(jié)果(依然是一個(gè)矩陣)做同樣的分析,則可以尋找樣本間有***差異的基因集。這些“差異表達(dá)”的基因集,相對(duì)于基因而言,更加具有生物學(xué)意義,更具有可解釋性,可以進(jìn)一步用于**subtype的分型等等與生物學(xué)意義結(jié)合密切的探究。 北京生物/藥物信息學(xué)分析數(shù)據(jù)科學(xué)活動(dòng)