湖北組學數(shù)據(jù)處理數(shù)據(jù)科學專業(yè)服務(wù)

來源: 發(fā)布時間:2022-01-24
bubbles(不同分組的基因表達或通路富集展示):

Bubbles可以同時展示pvalue和表達量。例如展示motif的pvalue和motif對應(yīng)的轉(zhuǎn)錄因子的表達量,方便快速看出轉(zhuǎn)錄因子富集且高表達所在的group,預(yù)示著該分組對細胞狀態(tài)的改變(例如細胞分化、轉(zhuǎn)移、應(yīng)激)起關(guān)鍵調(diào)控作用;例如做基因功能富集分析時,展示富集的通路qvalue和基因數(shù)量或geneRatio。

基本原理:

Bubbles的實質(zhì)是分組數(shù)據(jù)下基因表達量或通路內(nèi)基因數(shù)量的可視化,同時可以展示pvalue。

數(shù)據(jù)要求:

表達矩陣,分組 circos圖通過圓圈和連線展示多個亞組之間的關(guān)系,包括且不限于基因、基因片段、亞型。湖北組學數(shù)據(jù)處理數(shù)據(jù)科學專業(yè)服務(wù)

Inmmune gene

免疫學研究是目前科研領(lǐng)域爭相研究的熱點,**免疫細胞浸潤是其中一種。**免疫細胞浸潤是指免疫細胞從血液中移向**組織發(fā)揮作用。我們從**組織中分離出浸潤免疫細胞含量,計算基因與浸潤免疫細胞含量的相關(guān)性,篩選出影響免疫浸潤的候選基因。

基本原理:

從基因矩陣數(shù)據(jù)中提取免疫細胞含量,生成免疫細胞含量矩陣;

計算目標基因與浸潤免疫細胞含量的相關(guān)性,篩選與浸潤免疫細胞含量高度相關(guān)的基因。

術(shù)語解讀:

相關(guān)性系數(shù)(pearson,spearman, kendall)反應(yīng)兩個變量之間變化趨勢的方向以及程度。相關(guān)系數(shù)范圍為-1到+1。0表示兩個變量不相關(guān),正值表示正相關(guān),負值表示負相關(guān),值越大表示相關(guān)性越強。

數(shù)據(jù)要求:

**數(shù)據(jù)表達矩陣 北京診療軟件開發(fā)數(shù)據(jù)科學專業(yè)服務(wù)在分子生物、細胞生物、實驗動物、病理、臨床樣本方面已與長三角100余家企業(yè)形成良好合作關(guān)系。

    下游分析針對LASSO獲得的基因模型(或稱基因Panel)的驗證:1.計算風險指數(shù)RiskScore2.繪制ROC曲線、DCA曲線、列線圖進行驗證3.繪制生KM存曲線對基因模型中的基因進行解釋和分析:1.基因注釋2.靶向藥物分析應(yīng)用示例:文獻1:PrognosticandpredictivevalueofamicroRNAsignatureinstageIIcoloncancer:amicroRNAexpressionanalysis.于2013年12月發(fā)表在LancetOncol.,影響因子。一個miRNA特征集在stageII結(jié)腸*的預(yù)后預(yù)測作用分析文章對stageII結(jié)腸*組織和*旁正常組織的miRNA芯片數(shù)據(jù)進行了差異表達分析,并通過LASSOCox回歸對獲得的差異表達miRNA進行篩選,獲得了6個miRNA的可以預(yù)測預(yù)后情況的miRNA特征集。文獻2:PrognosticValueofaBCSC-associatedMicroRNASignatureinHormoneReceptor-PositiveHER2-NegativeBreastCancer(于2016年9月發(fā)表在EBioMedicine.上,影響因子)文章將符合條件的患者劃分為訓練集和測試集,首先分析獲得了**干細胞相關(guān)的miRNA,接著通過LASSO對**干細胞相關(guān)的miRNA進行篩選,構(gòu)建了10個miRNA的預(yù)后預(yù)測模型,并計算風險指數(shù)繪制了生存曲線和ROC曲線。

    STEM基因表達趨勢分析數(shù)據(jù)要求表達譜芯片或測序數(shù)據(jù)(已經(jīng)過預(yù)處理)下游分析得到***富集的時間表達模式之后的分析有:1.時間表達模式中基因的功能富集2.時間表達模式中基因表達與性狀之間的相關(guān)性挖掘模塊的關(guān)鍵信息:1.找到時間表達模式中的**基因2.利用關(guān)系預(yù)測該時間表達模式功能文獻1:DynamicEBF1occupancydirectssequentialepigeneticandtranscriptionaleventsinB-cellprogramming(于2018年1月發(fā)表在GenesDev.,影響因子)EBF1動態(tài)占據(jù)在B細胞中對序列表觀遺傳和轉(zhuǎn)錄過程的影響該文獻采用基因表達趨勢分析,探尋了EBF1誘導前后25kb轉(zhuǎn)錄起始位點內(nèi)基因轉(zhuǎn)錄水平的差異,來尋找EBF1對特定功能基因的影響以及造成影響的時間節(jié)點。文獻2:ComprehensivetranscriptionalprofilingofNaCl-stressedArabidopsisrootsrevealsnovelclassesofresponsivegenes(于2016年10月發(fā)表在BMCPlantBiol.,影響因子)該文獻采用基因表達趨勢分析,研究了高濃度鹽水作用不同時間下擬南芥根的基因表達差異,來探尋在遇到高濃度鹽水時擬南芥在基因?qū)用嫔系膽?yīng)對方式。 調(diào)控區(qū)域ChiP-seq信號分布圖。

    pancancer泛**圖譜泛*研究是通過整合不同**類型、不同組織起源的**表達數(shù)據(jù),查找**之間的共性或者差異的過程。通常使用**數(shù)據(jù)信息較為***的TCGA數(shù)據(jù),通過分裂小提琴圖展示某個基因在TCGA**和正常組織中的表達差異。分裂小提琴圖(ViolinPlot)結(jié)合了箱形圖和密度圖的特征,主要用來顯示數(shù)據(jù)的分布形狀,它一般應(yīng)用于對比某一基因在TCGA**組織和正常組織基因表達量TPM值或其它表達量數(shù)據(jù)?;驹恚盒√崆賵D(ViolinPlot)使用一組數(shù)據(jù)中的最小值、**四分位數(shù)、中位數(shù)、第三四分位數(shù)和**值來反映數(shù)據(jù)分布的中心位置和散布范圍,將多組數(shù)據(jù)的小提琴圖畫在同一坐標上,可以清晰地顯示各組數(shù)據(jù)的分布差異。分裂小提琴圖在小提琴圖的基礎(chǔ)上又加入了分組對比項,便于觀察多**類型在某一基因上的表達分布情況,或者某一基因在某一**上,其疾病與正常的對比表達差異情況。 WGCNA其譯為加權(quán)基因共表達網(wǎng)絡(luò)分析。云南數(shù)據(jù)庫建設(shè)數(shù)據(jù)科學專業(yè)服務(wù)

利用甲基化數(shù)據(jù)分析樣本的拷貝數(shù)變異。湖北組學數(shù)據(jù)處理數(shù)據(jù)科學專業(yè)服務(wù)

    **初目的:對手上的**樣本(或病人)進行分型分析,期望找到不同的亞型,并對應(yīng)不同的臨床特征??蓴U展應(yīng)用到:所有樣本的亞型分析,用于樣本的特征分析。數(shù)據(jù)可用轉(zhuǎn)錄組、基因組、甲基化、蛋白質(zhì)組等。輸入數(shù)據(jù)格式:一個數(shù)值矩陣,行是基因或者其他特征,列是樣本。本分析要求樣本數(shù)要多,有利于亞型的分析。參考文獻:(2)::本文利用室管膜瘤病人的甲基化數(shù)據(jù),首先進行了tSNE分型,隨后又采用了新的方法spectralclustering進行分類分析,作者比較了兩種分類方法。使用spectralclustering的分類,鑒定了每一種**亞型的特異性表達模式。并且發(fā)現(xiàn)spectralclustering的分類和病人的臨床特征有關(guān),從而提出一種新的室管膜瘤亞型,可用于臨床的篩選和檢測。 湖北組學數(shù)據(jù)處理數(shù)據(jù)科學專業(yè)服務(wù)