鶴山軟件產(chǎn)品檢測(cè)報(bào)告

來(lái)源: 發(fā)布時(shí)間:2025-04-28

    將三種模態(tài)特征和三種融合方法的結(jié)果進(jìn)行了對(duì)比,如表3所示。從表3可以看出,前端融合和中間融合較基于模態(tài)特征的檢測(cè)準(zhǔn)確率更高,損失率更低。后端融合是三種融合方法中較弱的,雖然明顯優(yōu)于基于dll和api信息、pe格式結(jié)構(gòu)特征的實(shí)驗(yàn)結(jié)果,但稍弱于基于字節(jié)碼3-grams特征的結(jié)果。中間融合是三種融合方法中**好的,各項(xiàng)性能指標(biāo)都非常接近**優(yōu)值。表3實(shí)驗(yàn)結(jié)果對(duì)比本實(shí)施例提出了基于多模態(tài)深度學(xué)習(xí)的惡意軟件檢測(cè)方法,提取了三種模態(tài)的特征(dll和api信息、pe格式結(jié)構(gòu)信息和字節(jié)碼3-grams),提出了通過(guò)三種融合方式(前端融合、后端融合、中間融合)集成三種模態(tài)的特征,有效提高惡意軟件檢測(cè)的準(zhǔn)確率和魯棒性。實(shí)驗(yàn)結(jié)果顯示,相對(duì)**且互補(bǔ)的特征視圖和不同深度學(xué)習(xí)融合機(jī)制的使用明顯提高了檢測(cè)方法的檢測(cè)能力和泛化性能,其中較優(yōu)的中間融合方法取得了%的準(zhǔn)確率,對(duì)數(shù)損失為,auc值為,各項(xiàng)性能指標(biāo)已接近**優(yōu)值??紤]到樣本集可能存在噪聲,本實(shí)施例提出的方法已取得了比較理想的結(jié)果。由于惡意軟件很難同時(shí)偽造多個(gè)模態(tài)的特征,本實(shí)施例提出的方法比單模態(tài)特征方法更魯棒。以上所述*為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。如何選擇適合企業(yè)的 IT 解決方案?鶴山軟件產(chǎn)品檢測(cè)報(bào)告

鶴山軟件產(chǎn)品檢測(cè)報(bào)告,測(cè)評(píng)

    所述生成軟件樣本的dll和api信息特征視圖,是先統(tǒng)計(jì)所有類(lèi)別已知的軟件樣本的pe可執(zhí)行文件引用的dll和api信息,從中選取引用頻率**高的多個(gè)dll和api信息;然后判斷當(dāng)前的軟件樣本的導(dǎo)入節(jié)里是否存在選擇出的某個(gè)引用頻率**高的dll和api信息,如存在,則將當(dāng)前軟件樣本的該dll或api信息以1表示,否則將其以0表示,從而對(duì)當(dāng)前軟件樣本的所有dll和api信息進(jìn)行表示形成當(dāng)前軟件樣本的dll和api信息特征視圖。進(jìn)一步的,所述生成軟件樣本的格式信息特征視圖,是從當(dāng)前軟件樣本的pe格式結(jié)構(gòu)信息中選取可能區(qū)分惡意軟件和良性軟件的pe格式結(jié)構(gòu)特征,形成當(dāng)前軟件樣本的格式信息特征視圖。進(jìn)一步的,所述從當(dāng)前軟件樣本的pe格式結(jié)構(gòu)信息中選取可能區(qū)分惡意軟件和良性軟件的pe格式結(jié)構(gòu)特征,是從當(dāng)前軟件樣本的pe格式結(jié)構(gòu)信息中確定存在特定格式異常的pe格式結(jié)構(gòu)特征以及存在明顯的統(tǒng)計(jì)差異的格式結(jié)構(gòu)特征;所述特定格式異常包括:(1)代碼從**后一節(jié)開(kāi)始執(zhí)行,(2)節(jié)頭部可疑的屬性,(3)pe可選頭部有效尺寸的值不正確,(4)節(jié)之間的“間縫”,(5)可疑的代碼重定向,(6)可疑的代碼節(jié)名稱,(7)可疑的頭部***,(8)來(lái)自,(9)導(dǎo)入地址表被修改,(10)多個(gè)pe頭部,(11)可疑的重定位信息,。醫(yī)院信息系統(tǒng)軟件測(cè)評(píng)中心可靠性評(píng)估連續(xù)運(yùn)行72小時(shí)出現(xiàn)2次非致命錯(cuò)誤。

鶴山軟件產(chǎn)品檢測(cè)報(bào)告,測(cè)評(píng)

    圖2是后端融合方法的流程圖。圖3是中間融合方法的流程圖。圖4是前端融合模型的架構(gòu)圖。圖5是前端融合模型的準(zhǔn)確率變化曲線圖。圖6是前端融合模型的對(duì)數(shù)損失變化曲線圖。圖7是前端融合模型的檢測(cè)混淆矩陣示意圖。圖8是規(guī)范化前端融合模型的檢測(cè)混淆矩陣示意圖。圖9是前端融合模型的roc曲線圖。圖10是后端融合模型的架構(gòu)圖。圖11是后端融合模型的準(zhǔn)確率變化曲線圖。圖12是后端融合模型的對(duì)數(shù)損失變化曲線圖。圖13是后端融合模型的檢測(cè)混淆矩陣示意圖。圖14是規(guī)范化后端融合模型的檢測(cè)混淆矩陣示意圖。圖15是后端融合模型的roc曲線圖。圖16是中間融合模型的架構(gòu)圖。圖17是中間融合模型的準(zhǔn)確率變化曲線圖。圖18是中間融合模型的對(duì)數(shù)損失變化曲線圖。圖19是中間融合模型的檢測(cè)混淆矩陣示意圖。圖20是規(guī)范化中間融合模型的檢測(cè)混淆矩陣示意圖。圖21是中間融合模型的roc曲線圖。具體實(shí)施方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例**是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。

    這樣做的好處是,融合模型的錯(cuò)誤來(lái)自不同的分類(lèi)器,而來(lái)自不同分類(lèi)器的錯(cuò)誤往往互不相關(guān)、互不影響,不會(huì)造成錯(cuò)誤的進(jìn)一步累加。常見(jiàn)的后端融合方式包括**大值融合(max-fusion)、平均值融合(averaged-fusion)、貝葉斯規(guī)則融合(bayes’rulebased)以及集成學(xué)習(xí)(ensemblelearning)等。其中集成學(xué)習(xí)作為后端融合方式的典型**,被廣泛應(yīng)用于通信、計(jì)算機(jī)識(shí)別、語(yǔ)音識(shí)別等研究領(lǐng)域。中間融合是指將不同的模態(tài)數(shù)據(jù)先轉(zhuǎn)化為高等特征表達(dá),再于模型的中間層進(jìn)行融合,如圖3所示。以深度神經(jīng)網(wǎng)絡(luò)為例,神經(jīng)網(wǎng)絡(luò)通過(guò)一層一層的管道映射輸入,將原始輸入轉(zhuǎn)換為更高等的表示。中間融合首先利用神經(jīng)網(wǎng)絡(luò)將原始數(shù)據(jù)轉(zhuǎn)化成高等特征表達(dá),然后獲取不同模態(tài)數(shù)據(jù)在高等特征空間上的共性,進(jìn)而學(xué)習(xí)一個(gè)聯(lián)合的多模態(tài)表征。深度多模態(tài)融合的大部分工作都采用了這種中間融合的方法,其***享表示層是通過(guò)合并來(lái)自多個(gè)模態(tài)特定路徑的連接單元來(lái)構(gòu)建的。中間融合方法的一大優(yōu)勢(shì)是可以靈活的選擇融合的位置,但設(shè)計(jì)深度多模態(tài)集成結(jié)構(gòu)時(shí),確定如何融合、何時(shí)融合以及哪些模式可以融合,是比較有挑戰(zhàn)的問(wèn)題。字節(jié)碼n-grams、dll和api信息、格式結(jié)構(gòu)信息這三種類(lèi)型的特征都具有自身的優(yōu)勢(shì)。從傳統(tǒng)到智能:艾策科技助力制造業(yè)升級(jí)之路。

鶴山軟件產(chǎn)品檢測(cè)報(bào)告,測(cè)評(píng)

    optimizer)采用的是adagrad,batch_size是40。深度神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練基本都是基于梯度下降的,尋找函數(shù)值下降速度**快的方向,沿著下降方向迭代,迅速到達(dá)局部**優(yōu)解的過(guò)程就是梯度下降的過(guò)程。使用訓(xùn)練集中的全部樣本訓(xùn)練一次就是一個(gè)epoch,整個(gè)訓(xùn)練集被使用的總次數(shù)就是epoch的值。epoch值的變化會(huì)影響深度神經(jīng)網(wǎng)絡(luò)的權(quán)重值的更新次數(shù)。本次實(shí)驗(yàn)使用了80%的樣本訓(xùn)練,20%的樣本驗(yàn)證,訓(xùn)練50個(gè)迭代以便于找到較優(yōu)的epoch值。隨著迭代數(shù)的增加,前端融合模型的準(zhǔn)確率變化曲線如圖5所示,模型的對(duì)數(shù)損失變化曲線如圖6所示。從圖5和圖6可以看出,當(dāng)epoch值從0增加到5過(guò)程中,模型的驗(yàn)證準(zhǔn)確率和驗(yàn)證對(duì)數(shù)損失有一定程度的波動(dòng);當(dāng)epoch值從5到50的過(guò)程中,前端融合模型的訓(xùn)練準(zhǔn)確率和驗(yàn)證準(zhǔn)確率基本不變,訓(xùn)練和驗(yàn)證對(duì)數(shù)損失基本不變;綜合分析圖5和圖6的準(zhǔn)確率和對(duì)數(shù)損失變化曲線,選取epoch的較優(yōu)值為30。確定模型的訓(xùn)練迭代數(shù)為30后,進(jìn)行了10折交叉驗(yàn)證實(shí)驗(yàn)。前端融合模型的10折交叉驗(yàn)證的準(zhǔn)確率是%,對(duì)數(shù)損失是,混淆矩陣如圖7所示,規(guī)范化后的混淆矩陣如圖8所示。前端融合模型的roc曲線如圖9所示,該曲線反映的是隨著檢測(cè)閾值變化下檢測(cè)率與誤報(bào)率之間的關(guān)系曲線。性能基準(zhǔn)測(cè)試GPU利用率未達(dá)理論最大值67%。西安第三方軟件評(píng)測(cè)單位

艾策醫(yī)療檢測(cè)中心為體外診斷試劑提供全流程合規(guī)性驗(yàn)證服務(wù)。鶴山軟件產(chǎn)品檢測(cè)報(bào)告

    后端融合模型的10折交叉驗(yàn)證的準(zhǔn)確率是%,對(duì)數(shù)損失是,混淆矩陣如圖13所示,規(guī)范化后的混淆矩陣如圖14所示。后端融合模型的roc曲線如圖15所示,其顯示后端融合模型的auc值為。(6)中間融合中間融合的架構(gòu)如圖16所示,中間融合方式用深度神經(jīng)網(wǎng)絡(luò)從三種模態(tài)的特征分別抽取高等特征表示,然后合并學(xué)習(xí)得到的特征表示,再作為下一個(gè)深度神經(jīng)網(wǎng)絡(luò)的輸入訓(xùn)練模型,隱藏層的***函數(shù)為relu,輸出層的***函數(shù)是sigmoid,中間使用dropout層進(jìn)行正則化,防止過(guò)擬合,優(yōu)化器(optimizer)采用的是adagrad,batch_size是40。圖16中,用于抽取dll和api信息特征視圖的深度神經(jīng)網(wǎng)絡(luò)包含3個(gè)隱含層,其***個(gè)隱含層的神經(jīng)元個(gè)數(shù)是128,第二個(gè)隱含層的神經(jīng)元個(gè)數(shù)是64,第三個(gè)隱含層的神經(jīng)元個(gè)數(shù)是32,且3個(gè)隱含層中間間隔設(shè)置有dropout層。用于抽取格式信息特征視圖的深度神經(jīng)網(wǎng)絡(luò)包含2個(gè)隱含層,其***個(gè)隱含層的神經(jīng)元個(gè)數(shù)是64,其第二個(gè)隱含層的神經(jīng)元個(gè)數(shù)是32,且2個(gè)隱含層中間設(shè)置有dropout層。用于抽取字節(jié)碼n-grams特征視圖的深度神經(jīng)網(wǎng)絡(luò)包含4個(gè)隱含層,其***個(gè)隱含層的神經(jīng)元個(gè)數(shù)是512,第二個(gè)隱含層的神經(jīng)元個(gè)數(shù)是384,第三個(gè)隱含層的神經(jīng)元個(gè)數(shù)是256,第四個(gè)隱含層的神經(jīng)元個(gè)數(shù)是125。鶴山軟件產(chǎn)品檢測(cè)報(bào)告

標(biāo)簽: 測(cè)評(píng)