成果發(fā)表指導數(shù)據(jù)科學共同合作

來源: 發(fā)布時間:2022-02-11

    Nomogram列線圖(nomogram,諾莫圖)是在平面直角坐標系中,用一簇互不相交的線段表示多個臨床指標或者生物學特征,用以預測一定的臨床結(jié)局或者某類事件發(fā)生的概率的圖。列線圖使預測模型的結(jié)果更具有可讀性,可個性化地計算特定**患者生存率,在臨床實踐中有較大的價值。一般可應用的研究方向有:將回歸的結(jié)果進行可視化呈現(xiàn),對個體樣本給出其發(fā)病風險或比例風險;根據(jù)多個臨床指標或生物學特征,判斷個體樣本的疾病分類或特征?;驹恚毫芯€圖的理論于1884年提出,**早用于工程學。它能夠?qū)碗s的計算公式以圖形的方式,快速、直觀、精確的展現(xiàn)出來。列線圖通過構(gòu)建多因素回歸模型(例如Cox回歸、Logistic回歸等),根據(jù)模型中各個影響因素對結(jié)局變量的影響程度的高低,即回歸系數(shù)的大小,給每個影響因素的每個取值水平進行賦分。將各個評分相加得到總評分,通過總評分與結(jié)局事件發(fā)生概率之間的函數(shù)轉(zhuǎn)換關(guān)系,從而計算出該個體結(jié)局事件的預測概率。校準曲線(calibrationcurve)為實際發(fā)生率和預測發(fā)生率的散點圖,常于用于化工行業(yè)溶液配制。在這里通過觀察預測值與實際值相差情況,判斷基于回歸模型構(gòu)建列線圖的有效性。 承擔各類項目超過400余項。成果發(fā)表指導數(shù)據(jù)科學共同合作

    單細胞測序數(shù)據(jù)挖掘:GEO目前收錄的單細胞研究樣本已經(jīng)超過2萬例,單細胞測序幾乎成為生物醫(yī)學領域CNS***文章的標配。實驗費用高昂,阻斷了CNS夢,既然其他數(shù)據(jù)可以挖,單細胞測序數(shù)據(jù)照樣可以挖。已知公共數(shù)據(jù)庫中單細胞測序數(shù)據(jù)涉及各種疾病類型,包括**、免疫細胞、炎癥類甚至神經(jīng)、肌肉、骨骼等,樣本豐富、數(shù)據(jù)龐大,你不挖就是失去了一座金山。我們提供各種設計單細胞測序、各種測序、芯片、多組學的公共數(shù)據(jù)庫挖掘、培訓、模型構(gòu)建、臨床統(tǒng)計、算法還原服務;你能想到,我能做到;你提供參考文獻、思路和目的,我們提供結(jié)果;如果沒有思路,我們提供付費科研設計服務。示例如下:利用公共數(shù)據(jù)庫的1539個單細胞樣本,構(gòu)建自己的生物學故事。 重慶組學實驗數(shù)據(jù)科學口碑推薦指導科研方案糾偏,更好更快發(fā)表文章。

ssGSEA(single sample GSEA)主要針對單樣本無法做GSEA而提出的一種實現(xiàn)方法,原理上與GSEA是類似的。ssGSEA根據(jù)表達譜文件計算每個基因的rank值,再進行后續(xù)的統(tǒng)計分析。通過這個方法,我們可以得到每個樣本的免疫細胞或者免疫功能,免疫通路的活性,然后根據(jù)免疫活性進行分組。

ssGSEA量化免疫細胞浸潤**的一個優(yōu)點就是自己可以定制量化免疫浸潤細胞種類。目前公認并且用的**多的免疫細胞marker就是2013年發(fā)表在Immunity上的SpatiotemporalDynamicsof IntratumoralImmuneCellsReveal the Immune Landscape in Human Cancer 所提供的免疫細胞marker genes(Table S1),能提取到24種免疫細胞信息。

    TMB**突變負荷**突變負荷(TMB)作為免疫療法的生物標志物,能夠較好的預測患者免疫***的療效?;?*突變負荷,可以從一種新的角度探尋基因跟免疫及預后的關(guān)系。一般應用場景:基于TMB預測不同性狀的免疫***療效、不同基因表達或突變對免疫***潛在的影響。基本原理:**突變負荷(TumorMutationBurden,TMB),通常被定義為一份**樣本中,所評估基因的外顯子編碼區(qū)每兆堿基中發(fā)生置換和插入/缺失突變的總數(shù)。近年許多研究都報道了TMB與PD-1/PD-L1抑制劑的療效高度相關(guān),同時基于TMB進行的臨床研究都得到了較好的結(jié)果。這讓一些**患者可以通過TMB標志物對免疫療法的療效進行一定程度的預測。結(jié)合TMB,可以從免疫***角度探尋關(guān)鍵基因、探究不同亞型**存在的不同發(fā)病機制。數(shù)據(jù)要求:基因突變數(shù)據(jù),臨床或其他分類數(shù)據(jù)。 可對接各類公共數(shù)據(jù)庫,切入各類接口,并對公共數(shù)據(jù)庫進行大規(guī)模數(shù)據(jù)挖掘。

Inmmune gene

免疫學研究是目前科研領域爭相研究的熱點,**免疫細胞浸潤是其中一種。**免疫細胞浸潤是指免疫細胞從血液中移向**組織發(fā)揮作用。我們從**組織中分離出浸潤免疫細胞含量,計算基因與浸潤免疫細胞含量的相關(guān)性,篩選出影響免疫浸潤的候選基因。

基本原理:

從基因矩陣數(shù)據(jù)中提取免疫細胞含量,生成免疫細胞含量矩陣;

計算目標基因與浸潤免疫細胞含量的相關(guān)性,篩選與浸潤免疫細胞含量高度相關(guān)的基因。

術(shù)語解讀:

相關(guān)性系數(shù)(pearson,spearman, kendall)反應兩個變量之間變化趨勢的方向以及程度。相關(guān)系數(shù)范圍為-1到+1。0表示兩個變量不相關(guān),正值表示正相關(guān),負值表示負相關(guān),值越大表示相關(guān)性越強。

數(shù)據(jù)要求:

**數(shù)據(jù)表達矩陣 按照斯普林格學術(shù)規(guī)范化處理準則提供文稿同行**投稿前意見評估。成果發(fā)表指導數(shù)據(jù)科學共同合作

生物醫(yī)學科研領域的組學數(shù)據(jù)處理。成果發(fā)表指導數(shù)據(jù)科學共同合作

    PCA主成分分析測序技術(shù)的發(fā)展使得現(xiàn)在能夠從宏觀角度分析基因表達,但是也在一定程度上增加了數(shù)據(jù)分析難度。許多基因之間可能存在相關(guān)性,如果分別對每個基因進行分析,分析往往是孤立的,盲目減少指標會損失很多有用的信息。PCA(PrincipalComponentAnalysis),即主成分分析方法,是一種使用*****的數(shù)據(jù)降維算法。一般可應用的研究方向有:一組基因在多個分組中的差異情況,多個基因在該樣本中的差異情況?;驹鞵CA的主要思想是將n維特征映射到k維上,這k維是全新的正交特征也被稱為主成分,是在原有n維特征的基礎上重新構(gòu)造出來的k維特征。PCA的工作就是從原始的空間中順序地找一組相互正交的坐標軸,新的坐標軸的選擇與數(shù)據(jù)本身是密切相關(guān)的。其中,**個新坐標軸選擇是原始數(shù)據(jù)中方差**的方向,第二個新坐標軸選取是與**個坐標軸正交的平面中使得方差**的,第三個軸是與第1,2個軸正交的平面中方差**的。依次類推,可以得到n個這樣的坐標軸。通過這種方式獲得的新的坐標軸,我們發(fā)現(xiàn),大部分方差都包含在前面k個坐標軸中,后面的坐標軸所含的方差幾乎為0。于是,我們可以忽略余下的坐標軸,只保留前面k個含有絕大部分方差的坐標軸。事實上。 成果發(fā)表指導數(shù)據(jù)科學共同合作