遼寧臨床統(tǒng)計數(shù)據(jù)科學專業(yè)服務(wù)

來源: 發(fā)布時間:2021-05-05

    immune-network免疫網(wǎng)絡(luò)**微環(huán)境(TME)是**周圍的環(huán)境,包括周圍血管,免疫細胞,成纖維細胞,信號分子和細胞外基質(zhì)(ECM)。**與周圍微環(huán)境密切相關(guān),不斷相互作用。**可以通過釋放細胞外信號,促進**血管生成和誘導外周免疫耐受來影響微環(huán)境,而微環(huán)境中的免疫細胞可以影響*細胞的生長和進化。免疫細胞泛指所有參與免疫反應(yīng)的細胞,也特指能識別抗原,產(chǎn)生特異性免疫應(yīng)答的淋巴細胞等。主要包括T淋巴細胞、B淋巴細胞、單核細胞、巨噬細胞、粒細胞、肥大細胞、輔佐細胞,以及它們的前體細胞等,是免疫系統(tǒng)的功能單元。**微環(huán)境中免疫細胞之間相互作用形成免疫網(wǎng)絡(luò),網(wǎng)絡(luò)設(shè)立可以清晰了解**微環(huán)境中免疫細胞之間的影響機制。應(yīng)用場景用網(wǎng)絡(luò)圖同時展示相關(guān)關(guān)系、pvalue、聚類/分類結(jié)果、跟預(yù)后的關(guān)系。-例如例文中各細胞之間的相關(guān)關(guān)系、跟預(yù)后的關(guān)系?;驹恚好庖呦到y(tǒng)遍布全身,涉及多種細胞、***、蛋白質(zhì)和組織。它可以區(qū)分我們的組織和外來組織自我和非自我。死亡和有缺陷的細胞也會被免疫系統(tǒng)識別和***。如果免疫系統(tǒng)遇到病原體就會產(chǎn)生免疫反應(yīng)。免疫細胞泛指所有參與免疫反應(yīng)的細胞,也特指能識別抗原,產(chǎn)生特異性免疫應(yīng)答的淋巴細胞等。 不斷拓展各類大學、科研院所、醫(yī)院學術(shù)資源,互通有無,形成強大學術(shù)生態(tài)圈。遼寧臨床統(tǒng)計數(shù)據(jù)科學專業(yè)服務(wù)

    survivalCurve生存分析生存分析(survivalCurve)旨在更好地分析對不同因素對患者預(yù)后的影響,從而找到影響患者疾病的關(guān)鍵因素。生存曲線(Kaplan-Meier曲線)是生存分析的基本步驟,展示分類樣本的生存曲線,從而揭示不同因素對疾病預(yù)后的影響。一般可應(yīng)用的研究方向有:患者的生存期跟基因變異的關(guān)系、藥物處理導致模式動物生存期變化?;驹鞬aplan-Meier法,直接用概率乘法定理估計生存率,故稱乘積極限法(product-limitmethod),是一種非參數(shù)法。相比其他方法,KM曲線能更好的處理刪失數(shù)據(jù)。先將樣本生存時間從小到大排列。若遇到非刪失值和刪失值相同時,非截刪失****。在生存時間后列出與時間相應(yīng)的死亡人數(shù),期初病例數(shù)(即生存期為某時間時尚存活的病例數(shù))。然后計算活過每個時間點的生存率。以生存時間為橫坐標,生存率為縱坐標所作的曲線,即為Kaplan-Meier曲線。術(shù)語解釋風險比(HazardRatio,HR):Kaplan-Meier方法中計算的風險比HR為兩分組對生存期影響的比例,用來描述該基因高表達對生存期的危險程度。該方法中的假設(shè)檢驗為兩組中樣本的生存期是否存在差異,即該因素是否會導致生存期的改變。刪失(censored):在生存分析中。 四川生物/藥物信息學分析數(shù)據(jù)科學共同合作采用機器學習算法對疾病的干性指數(shù)進行分型分類研究。

    GeneBodyProfile(對比不同的樣品在某一區(qū)域的信號特征,不**于ChIP-seq、DNase-seq、ATAC-seq數(shù)據(jù)):GeneBodyProfile表觀遺傳修飾和對基因表達、細胞發(fā)育等過程有著深遠的影響,但相關(guān)的研究還未完善。通過對比不同的樣品在某一區(qū)域的信號特征,了解不同情況下該基因的表觀遺傳情況,幫助更好的了解其發(fā)***展過程。一般應(yīng)用場景:觀察相關(guān)基因轉(zhuǎn)錄起始位點(TSS)、轉(zhuǎn)錄終止位點(TTS)、genebody以及兩側(cè)信號特征;觀察某一功能區(qū)域(CpGi、TSS、TTS、peaksummits或enhancer區(qū))及其兩側(cè)信號特征。數(shù)據(jù)要求:ChIP-seq、DNase-seq或ATAC-seq數(shù)據(jù)。下游分析:基于展示的基因或功能情況1.補充展示部分的已有相關(guān)研究2.解釋展示部分對研究課題的意義。

    GSEA數(shù)據(jù)要求1、通常為表達譜芯片或測序數(shù)據(jù)(已經(jīng)過預(yù)處理),也可以是其他形式可排序的基因數(shù)據(jù)。2、具有已知生物學意義(GO、Pathway、**特征基因集等)的基因集。下游分析:得到GSEA結(jié)果之后的分析有:1.基因注釋:1、繪制基因集富集趨勢圖(Enrichmentplot)橫坐標:按差異表達差異排序的基因序列。數(shù)值越?。ㄆ蜃蠖耍┑幕?*在shICAM-1組中有越高倍數(shù)的差異表達,數(shù)值越小(偏向右端)的基因在對照組中有越高倍數(shù)的差異表達??v坐標:上方的縱坐標為富集打分ES,ES是一個動態(tài)的值,沿著基因序列,找到條目中的基因則增加評分,否則減少評分。通常用偏離0**遠的值作為**終富集打分。下方的縱坐標**基因表達與表型的關(guān)聯(lián),***值越大**關(guān)聯(lián)越強,數(shù)值大于0**正相關(guān),小于0則**負相關(guān)。 與復旦大學問附屬醫(yī)院合作,開發(fā)人血液外泌體中RNA的數(shù)據(jù)庫。

    LASSO回歸:更多的變量在擬合時往往可以給出一個看似更好的模型,但是同時也面臨過度擬合的危險。此時如果用全新的數(shù)據(jù)去驗證模型(Validation),通常效果很差。一般來說,變量數(shù)大于數(shù)據(jù)點數(shù)量很多,或者某一個離散變量有太多獨特值時,都有可能過度擬合。LASSO回歸復雜度調(diào)整的程度由參數(shù)λ來控制,λ越大對變量較多的線性模型的懲罰力度就越大,從而**終獲得一個變量較少的模型。LASSO回歸與Ridge回歸同屬于一個被稱為ElasticNet的廣義線性模型家族。這一家族的模型除了相同作用的參數(shù)λ之外,還有另一個參數(shù)α來控制應(yīng)對高相關(guān)性(highlycorrelated)數(shù)據(jù)時模型的性狀。LASSO回歸α=1,Ridge回歸α=0,一般ElasticNet模型0<α<1。LASSO過程中我們通常會進行多次交叉驗證(crossvalidation)擬合(1000次)進而選取模型,從而對模型的性能有一個更準確的估計。 實驗室致病類病原微生物數(shù)據(jù)分析平臺。山東診療軟件開發(fā)數(shù)據(jù)科學共同合作

OmicCircos圖可以對感興趣的多個基因,展示其染色體的位置、拷貝數(shù)變異等多個特征。遼寧臨床統(tǒng)計數(shù)據(jù)科學專業(yè)服務(wù)

三角坐標統(tǒng)計圖是采用數(shù)字坐標形式來表現(xiàn)三項要素的數(shù)字信息圖像。三角形坐標圖常用百分數(shù)(%)來表示某項要素與整體的結(jié)構(gòu)比例。三條邊分別表示三個不同分量,三個頂點可以看作是三個原點。三角圖可以展示某特定值在一個整體中不同類型的分布。在生物信息中三角圖可以方便地展示3種不同疾病或者3個不同分組之間某個指標的相關(guān)性。

數(shù)據(jù)要求

多個樣本的三個變量值,或者多個基因在三個不同分組中的數(shù)據(jù)值,可以是突變頻率數(shù)據(jù)、基因表達數(shù)據(jù)、甲基化數(shù)據(jù)等。 遼寧臨床統(tǒng)計數(shù)據(jù)科學專業(yè)服務(wù)