棒棒糖圖是直觀顯示蛋白質(zhì)結(jié)構(gòu)上的突變點**簡單且有效的方式。許多致*基因具有比任何其他基因座更頻繁突變的優(yōu)先位點。這些位點被認(rèn)為是突變熱點,棒棒糖圖可以用于顯示突變熱點以及其他突變位點。并可以對比不同**/亞型的突變位點。
基本原理
將蛋白質(zhì)結(jié)構(gòu)根據(jù)氨基酸順序繪制為長條形,以不同色塊標(biāo)注不同結(jié)構(gòu)域,在基因突變導(dǎo)致氨基酸改變的位置標(biāo)注棒棒糖,并在棒棒糖圓球標(biāo)注位點的突變頻數(shù)以及突變位點。
數(shù)據(jù)要求
基因突變或者蛋白質(zhì)突變數(shù)據(jù)
下游分析
1、突變位點靶向藥物分析
2、驅(qū)動基因突變分析 診療軟件開發(fā)、算法還原與開發(fā)、臨床統(tǒng)計等數(shù)據(jù)科學(xué)工作。廣東臨床統(tǒng)計數(shù)據(jù)科學(xué)售后服務(wù)
術(shù)語解讀:PPI:蛋白質(zhì)-蛋白質(zhì)相互作用(protein-proteininteraction)PPImoduleI:指蛋白質(zhì)相互作用模塊,一個模塊指向一個功能數(shù)據(jù)要求:基因列表應(yīng)用示例1:(于2018年3月發(fā)表在Immunity.,影響因子)T細胞活化過程中產(chǎn)生蛋白質(zhì)組進行多重定量分析,然后對差異表達蛋白權(quán)重聚類,并將聚類蛋白疊加到PPI網(wǎng)絡(luò)上以識別功能模塊。D.模塊大小的分布,通過將每個WPC(權(quán)重聚類結(jié)果)中的蛋白疊加到蛋白-蛋白相互作用(PPI)網(wǎng)絡(luò)上識別模塊。每個模塊的蛋白質(zhì)數(shù)量顯示出來。E.各個模塊及其交互的關(guān)系圖。圓圈(節(jié)點)表示90個模塊,圓圈大小與模塊大小成比例。邊連接共享PPIs的模塊。在(F)和(G)中進一步擴展了裝箱模塊。F.來自WPC3的細胞質(zhì)和線粒體核糖體的四個互連模塊。顯示了蛋白質(zhì)的名稱和每個模塊的代表性功能術(shù)語。G.來自WPC3的蛋白酶體,OXPHOS和線粒體復(fù)合物IV途徑的模塊。 重慶文章成稿指導(dǎo)數(shù)據(jù)科學(xué)服務(wù)利用甲基化數(shù)據(jù)分析樣本的拷貝數(shù)變異。
三角坐標(biāo)統(tǒng)計圖是采用數(shù)字坐標(biāo)形式來表現(xiàn)三項要素的數(shù)字信息圖像。三角形坐標(biāo)圖常用百分?jǐn)?shù)(%)來表示某項要素與整體的結(jié)構(gòu)比例。三條邊分別表示三個不同分量,三個頂點可以看作是三個原點。三角圖可以展示某特定值在一個整體中不同類型的分布。在生物信息中三角圖可以方便地展示3種不同疾病或者3個不同分組之間某個指標(biāo)的相關(guān)性。
數(shù)據(jù)要求
多個樣本的三個變量值,或者多個基因在三個不同分組中的數(shù)據(jù)值,可以是突變頻率數(shù)據(jù)、基因表達數(shù)據(jù)、甲基化數(shù)據(jù)等。
ROC機器學(xué)習(xí)受試者工作特征曲線(receiveroperatingcharacteristiccurve,簡稱ROC曲線),又稱為感受性曲線(sensitivitycurve),是用來驗證一個分類器(二分)模型的性能的。一般應(yīng)用于直觀展示敏感性和特異性連續(xù)變量的綜合指標(biāo),如比較多個biomarker或臨床參數(shù)的診斷表現(xiàn)、比較多個算法的分類效果?;驹鞷OC曲線工作原理是,向模型中輸入已知正負類的一組數(shù)據(jù),對比模型對該組數(shù)據(jù)的預(yù)測,衡量這個模型的性能。術(shù)語解讀:1、TP(TruePositive,真正,TP)被模型預(yù)測為正的正樣本(原來為正預(yù)測為正)2、TN(TrueNegative,真負,TN)被模型預(yù)測為負的負樣本(原來為負預(yù)測為負)3、FP(FalsePositive,假正,FP)被模型預(yù)測為正的負樣本(原來為負預(yù)測為正)4、FN(FalseNegative,假負,FN)被模型預(yù)測為負的正樣本(原來為正預(yù)測為負)5、真正類率(TruePostiveRate)TPR:TP/(TP+FN),**分類器預(yù)測的正類中實際正實例占所有正實例的比例。Sensitivity6、假正類率(FalsePostiveRate)FPR:FP/(FP+TN),**分類器預(yù)測的負類中預(yù)測為正實例(實際為負實例)占所有負實例的比例。1-Specificity7、真負類率(TrueNegativeRate)TNR:TN/(FP+TN)。 糖尿病藥物基因組學(xué)分析找到新的作用靶點。
bubbles(不同分組的基因表達或通路富集展示):Bubbles可以同時展示pvalue和表達量。例如展示motif的pvalue和motif對應(yīng)的轉(zhuǎn)錄因子的表達量,方便快速看出轉(zhuǎn)錄因子富集且高表達所在的group,預(yù)示著該分組對細胞狀態(tài)的改變(例如細胞分化、轉(zhuǎn)移、應(yīng)激)起關(guān)鍵調(diào)控作用;例如做基因功能富集分析時,展示富集的通路qvalue和基因數(shù)量或geneRatio。
基本原理:
Bubbles的實質(zhì)是分組數(shù)據(jù)下基因表達量或通路內(nèi)基因數(shù)量的可視化,同時可以展示pvalue。
數(shù)據(jù)要求:
表達矩陣,分組 早期肝疾病的預(yù)后基因panel研究。天津算法還原與開發(fā)數(shù)據(jù)科學(xué)專業(yè)服務(wù)
目前能夠?qū)映^50家實驗室。廣東臨床統(tǒng)計數(shù)據(jù)科學(xué)售后服務(wù)
industryTemplate廣東臨床統(tǒng)計數(shù)據(jù)科學(xué)售后服務(wù)