成果發(fā)表指導(dǎo)數(shù)據(jù)科學(xué)共同合作

來源: 發(fā)布時間:2022-02-11

    Nomogram列線圖(nomogram,諾莫圖)是在平面直角坐標(biāo)系中,用一簇互不相交的線段表示多個臨床指標(biāo)或者生物學(xué)特征,用以預(yù)測一定的臨床結(jié)局或者某類事件發(fā)生的概率的圖。列線圖使預(yù)測模型的結(jié)果更具有可讀性,可個性化地計算特定**患者生存率,在臨床實踐中有較大的價值。一般可應(yīng)用的研究方向有:將回歸的結(jié)果進行可視化呈現(xiàn),對個體樣本給出其發(fā)病風(fēng)險或比例風(fēng)險;根據(jù)多個臨床指標(biāo)或生物學(xué)特征,判斷個體樣本的疾病分類或特征?;驹恚毫芯€圖的理論于1884年提出,**早用于工程學(xué)。它能夠?qū)?fù)雜的計算公式以圖形的方式,快速、直觀、精確的展現(xiàn)出來。列線圖通過構(gòu)建多因素回歸模型(例如Cox回歸、Logistic回歸等),根據(jù)模型中各個影響因素對結(jié)局變量的影響程度的高低,即回歸系數(shù)的大小,給每個影響因素的每個取值水平進行賦分。將各個評分相加得到總評分,通過總評分與結(jié)局事件發(fā)生概率之間的函數(shù)轉(zhuǎn)換關(guān)系,從而計算出該個體結(jié)局事件的預(yù)測概率。校準(zhǔn)曲線(calibrationcurve)為實際發(fā)生率和預(yù)測發(fā)生率的散點圖,常于用于化工行業(yè)溶液配制。在這里通過觀察預(yù)測值與實際值相差情況,判斷基于回歸模型構(gòu)建列線圖的有效性。 承擔(dān)各類項目超過400余項。成果發(fā)表指導(dǎo)數(shù)據(jù)科學(xué)共同合作

    單細(xì)胞測序數(shù)據(jù)挖掘:GEO目前收錄的單細(xì)胞研究樣本已經(jīng)超過2萬例,單細(xì)胞測序幾乎成為生物醫(yī)學(xué)領(lǐng)域CNS***文章的標(biāo)配。實驗費用高昂,阻斷了CNS夢,既然其他數(shù)據(jù)可以挖,單細(xì)胞測序數(shù)據(jù)照樣可以挖。已知公共數(shù)據(jù)庫中單細(xì)胞測序數(shù)據(jù)涉及各種疾病類型,包括**、免疫細(xì)胞、炎癥類甚至神經(jīng)、肌肉、骨骼等,樣本豐富、數(shù)據(jù)龐大,你不挖就是失去了一座金山。我們提供各種設(shè)計單細(xì)胞測序、各種測序、芯片、多組學(xué)的公共數(shù)據(jù)庫挖掘、培訓(xùn)、模型構(gòu)建、臨床統(tǒng)計、算法還原服務(wù);你能想到,我能做到;你提供參考文獻(xiàn)、思路和目的,我們提供結(jié)果;如果沒有思路,我們提供付費科研設(shè)計服務(wù)。示例如下:利用公共數(shù)據(jù)庫的1539個單細(xì)胞樣本,構(gòu)建自己的生物學(xué)故事。 重慶組學(xué)實驗數(shù)據(jù)科學(xué)口碑推薦指導(dǎo)科研方案糾偏,更好更快發(fā)表文章。

ssGSEA(single sample GSEA)主要針對單樣本無法做GSEA而提出的一種實現(xiàn)方法,原理上與GSEA是類似的。ssGSEA根據(jù)表達(dá)譜文件計算每個基因的rank值,再進行后續(xù)的統(tǒng)計分析。通過這個方法,我們可以得到每個樣本的免疫細(xì)胞或者免疫功能,免疫通路的活性,然后根據(jù)免疫活性進行分組。

ssGSEA量化免疫細(xì)胞浸潤**的一個優(yōu)點就是自己可以定制量化免疫浸潤細(xì)胞種類。目前公認(rèn)并且用的**多的免疫細(xì)胞marker就是2013年發(fā)表在Immunity上的SpatiotemporalDynamicsof IntratumoralImmuneCellsReveal the Immune Landscape in Human Cancer 所提供的免疫細(xì)胞marker genes(Table S1),能提取到24種免疫細(xì)胞信息。

    TMB**突變負(fù)荷**突變負(fù)荷(TMB)作為免疫療法的生物標(biāo)志物,能夠較好的預(yù)測患者免疫***的療效?;?*突變負(fù)荷,可以從一種新的角度探尋基因跟免疫及預(yù)后的關(guān)系。一般應(yīng)用場景:基于TMB預(yù)測不同性狀的免疫***療效、不同基因表達(dá)或突變對免疫***潛在的影響?;驹恚?*突變負(fù)荷(TumorMutationBurden,TMB),通常被定義為一份**樣本中,所評估基因的外顯子編碼區(qū)每兆堿基中發(fā)生置換和插入/缺失突變的總數(shù)。近年許多研究都報道了TMB與PD-1/PD-L1抑制劑的療效高度相關(guān),同時基于TMB進行的臨床研究都得到了較好的結(jié)果。這讓一些**患者可以通過TMB標(biāo)志物對免疫療法的療效進行一定程度的預(yù)測。結(jié)合TMB,可以從免疫***角度探尋關(guān)鍵基因、探究不同亞型**存在的不同發(fā)病機制。數(shù)據(jù)要求:基因突變數(shù)據(jù),臨床或其他分類數(shù)據(jù)。 可對接各類公共數(shù)據(jù)庫,切入各類接口,并對公共數(shù)據(jù)庫進行大規(guī)模數(shù)據(jù)挖掘。

Inmmune gene

免疫學(xué)研究是目前科研領(lǐng)域爭相研究的熱點,**免疫細(xì)胞浸潤是其中一種。**免疫細(xì)胞浸潤是指免疫細(xì)胞從血液中移向**組織發(fā)揮作用。我們從**組織中分離出浸潤免疫細(xì)胞含量,計算基因與浸潤免疫細(xì)胞含量的相關(guān)性,篩選出影響免疫浸潤的候選基因。

基本原理:

從基因矩陣數(shù)據(jù)中提取免疫細(xì)胞含量,生成免疫細(xì)胞含量矩陣;

計算目標(biāo)基因與浸潤免疫細(xì)胞含量的相關(guān)性,篩選與浸潤免疫細(xì)胞含量高度相關(guān)的基因。

術(shù)語解讀:

相關(guān)性系數(shù)(pearson,spearman, kendall)反應(yīng)兩個變量之間變化趨勢的方向以及程度。相關(guān)系數(shù)范圍為-1到+1。0表示兩個變量不相關(guān),正值表示正相關(guān),負(fù)值表示負(fù)相關(guān),值越大表示相關(guān)性越強。

數(shù)據(jù)要求:

**數(shù)據(jù)表達(dá)矩陣 按照斯普林格學(xué)術(shù)規(guī)范化處理準(zhǔn)則提供文稿同行**投稿前意見評估。成果發(fā)表指導(dǎo)數(shù)據(jù)科學(xué)共同合作

生物醫(yī)學(xué)科研領(lǐng)域的組學(xué)數(shù)據(jù)處理。成果發(fā)表指導(dǎo)數(shù)據(jù)科學(xué)共同合作

    PCA主成分分析測序技術(shù)的發(fā)展使得現(xiàn)在能夠從宏觀角度分析基因表達(dá),但是也在一定程度上增加了數(shù)據(jù)分析難度。許多基因之間可能存在相關(guān)性,如果分別對每個基因進行分析,分析往往是孤立的,盲目減少指標(biāo)會損失很多有用的信息。PCA(PrincipalComponentAnalysis),即主成分分析方法,是一種使用*****的數(shù)據(jù)降維算法。一般可應(yīng)用的研究方向有:一組基因在多個分組中的差異情況,多個基因在該樣本中的差異情況?;驹鞵CA的主要思想是將n維特征映射到k維上,這k維是全新的正交特征也被稱為主成分,是在原有n維特征的基礎(chǔ)上重新構(gòu)造出來的k維特征。PCA的工作就是從原始的空間中順序地找一組相互正交的坐標(biāo)軸,新的坐標(biāo)軸的選擇與數(shù)據(jù)本身是密切相關(guān)的。其中,**個新坐標(biāo)軸選擇是原始數(shù)據(jù)中方差**的方向,第二個新坐標(biāo)軸選取是與**個坐標(biāo)軸正交的平面中使得方差**的,第三個軸是與第1,2個軸正交的平面中方差**的。依次類推,可以得到n個這樣的坐標(biāo)軸。通過這種方式獲得的新的坐標(biāo)軸,我們發(fā)現(xiàn),大部分方差都包含在前面k個坐標(biāo)軸中,后面的坐標(biāo)軸所含的方差幾乎為0。于是,我們可以忽略余下的坐標(biāo)軸,只保留前面k個含有絕大部分方差的坐標(biāo)軸。事實上。 成果發(fā)表指導(dǎo)數(shù)據(jù)科學(xué)共同合作