先將訓(xùn)練樣本的dll和api信息特征視圖、格式信息特征視圖以及字節(jié)碼n-grams特征視圖分別輸入至一個(gè)深度神經(jīng)網(wǎng)絡(luò)中抽取高等特征表示,然后合并抽取的高等特征表示并將其作為下一個(gè)深度神經(jīng)網(wǎng)絡(luò)的輸入進(jìn)行模型訓(xùn)練,得到多模態(tài)深度集成模型。進(jìn)一步的,所述多模態(tài)深度集成模型的隱藏層的***函數(shù)采用relu,輸出層的***函數(shù)采用sigmoid,中間使用dropout層進(jìn)行正則化,優(yōu)化器采用adagrad。進(jìn)一步的,所述訓(xùn)練得到的多模態(tài)深度集成模型中,用于抽取dll和api信息特征視圖的深度神經(jīng)網(wǎng)絡(luò)包含3個(gè)隱含層,且3個(gè)隱含層中間間隔設(shè)置有dropout層;用于抽取格式信息特征視圖的深度神經(jīng)網(wǎng)絡(luò)包含2個(gè)隱含層,且2個(gè)隱含層中間設(shè)置有dropout層;用于抽取字節(jié)碼n-grams特征視圖的深度神經(jīng)網(wǎng)絡(luò)包含4個(gè)隱含層,且4個(gè)隱含層中間間隔設(shè)置有dropout層;用于輸入合并抽取的高等特征表示的深度神經(jīng)網(wǎng)絡(luò)包含2個(gè)隱含層,且2個(gè)隱含層中間設(shè)置有dropout層;所述dropout層的dropout率均等于。本發(fā)明實(shí)施例的有益效果是,提出了一種基于多模態(tài)深度學(xué)習(xí)的惡意軟件檢測(cè)方法,應(yīng)用了多模態(tài)深度學(xué)習(xí)方法來融合dll和api、格式結(jié)構(gòu)信息、字節(jié)碼n-grams特征。隱私合規(guī)檢測(cè)確認(rèn)用戶數(shù)據(jù)加密符合GDPR標(biāo)準(zhǔn)要求。軟件測(cè)試報(bào)告的費(fèi)用
optimizer)采用的是adagrad,batch_size是40。深度神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練基本都是基于梯度下降的,尋找函數(shù)值下降速度**快的方向,沿著下降方向迭代,迅速到達(dá)局部**優(yōu)解的過程就是梯度下降的過程。使用訓(xùn)練集中的全部樣本訓(xùn)練一次就是一個(gè)epoch,整個(gè)訓(xùn)練集被使用的總次數(shù)就是epoch的值。epoch值的變化會(huì)影響深度神經(jīng)網(wǎng)絡(luò)的權(quán)重值的更新次數(shù)。本次實(shí)驗(yàn)使用了80%的樣本訓(xùn)練,20%的樣本驗(yàn)證,訓(xùn)練50個(gè)迭代以便于找到較優(yōu)的epoch值。隨著迭代數(shù)的增加,前端融合模型的準(zhǔn)確率變化曲線如圖5所示,模型的對(duì)數(shù)損失變化曲線如圖6所示。從圖5和圖6可以看出,當(dāng)epoch值從0增加到5過程中,模型的驗(yàn)證準(zhǔn)確率和驗(yàn)證對(duì)數(shù)損失有一定程度的波動(dòng);當(dāng)epoch值從5到50的過程中,前端融合模型的訓(xùn)練準(zhǔn)確率和驗(yàn)證準(zhǔn)確率基本不變,訓(xùn)練和驗(yàn)證對(duì)數(shù)損失基本不變;綜合分析圖5和圖6的準(zhǔn)確率和對(duì)數(shù)損失變化曲線,選取epoch的較優(yōu)值為30。確定模型的訓(xùn)練迭代數(shù)為30后,進(jìn)行了10折交叉驗(yàn)證實(shí)驗(yàn)。前端融合模型的10折交叉驗(yàn)證的準(zhǔn)確率是%,對(duì)數(shù)損失是,混淆矩陣如圖7所示,規(guī)范化后的混淆矩陣如圖8所示。前端融合模型的roc曲線如圖9所示,該曲線反映的是隨著檢測(cè)閾值變化下檢測(cè)率與誤報(bào)率之間的關(guān)系曲線。南昌軟件安全檢測(cè)報(bào)告專業(yè)機(jī)構(gòu)認(rèn)證該程序內(nèi)存管理效率優(yōu)于行業(yè)平均水平23%。
在介紹諸多知識(shí)點(diǎn)的過程當(dāng)中結(jié)合直觀形象的圖表或?qū)嶋H案例進(jìn)行深入淺出的分析,從而使讀者可以更好地理解秋掌握軟件測(cè)試?yán)碚撝R(shí),并迅速地運(yùn)用到實(shí)際測(cè)試工作中去。本書適合作為各層次高等院校計(jì)算機(jī)及相關(guān)的教學(xué)用書,也可作為軟件測(cè)試人員的參考書。目錄前言第1章概述第2章軟件測(cè)試基礎(chǔ)第3章單元測(cè)試第4章集成測(cè)試第5章系統(tǒng)測(cè)試……軟件測(cè)試技術(shù)圖書2書名:軟件測(cè)試技術(shù)層次:高職高專配套:電子課件作者:徐芳出版社:機(jī)械工業(yè)出版社出版時(shí)間:2011-6-21ISBN:開本:16開定價(jià):¥內(nèi)容簡(jiǎn)介本書根據(jù)軟件測(cè)試教學(xué)的需要,結(jié)合讀者對(duì)象未來的職業(yè)要求和定位,除了盡力***闡述軟件測(cè)試技術(shù)基本概念外,采取了計(jì)劃、設(shè)計(jì)與開發(fā)、執(zhí)行這樣的工程步驟來描述軟件測(cè)試的相關(guān)知識(shí),使學(xué)生在學(xué)習(xí)軟件測(cè)試的技術(shù)知識(shí)時(shí),能夠同時(shí)獲得工程化思維方式的訓(xùn)練。本書共7章。第1章介紹軟件測(cè)試的基本知識(shí);第2章介紹如何制定軟件測(cè)試計(jì)劃;第3章介紹測(cè)試用例的設(shè)計(jì)和相關(guān)技術(shù);第4章介紹執(zhí)行測(cè)試中相關(guān)技術(shù)和方法;第5章介紹實(shí)際工作中各種測(cè)試方法;第6章介紹MI公司的一套測(cè)試工具的使用,包括功能、性能和測(cè)試管理工具;第7章通過一個(gè)實(shí)例,給出了完整的與軟件測(cè)試相關(guān)的文檔。
3)pe可選頭部有效尺寸的值不正確,(4)節(jié)之間的“間縫”,(5)可疑的代碼重定向,(6)可疑的代碼節(jié)名稱,(7)可疑的頭部***,(8)來自,(9)導(dǎo)入地址表被修改,(10)多個(gè)pe頭部,(11)可疑的重定位信息,(12)把節(jié)裝入到vmm的地址空間,(13)可選頭部的sizeofcode域取值不正確,(14)含有可疑標(biāo)志。存在明顯的統(tǒng)計(jì)差異的格式結(jié)構(gòu)特征包括:(1)無證書表;(2)調(diào)試數(shù)據(jù)明顯小于正常文件,(3).text、.rsrc、.reloc和.rdata的characteristics屬性異常,(4)資源節(jié)的資源個(gè)數(shù)少于正常文件。生成軟件樣本的字節(jié)碼n-grams特征視圖,是統(tǒng)計(jì)了每個(gè)短序列特征的詞頻(termfrequency,tf),即該短序列特征在軟件樣本中出現(xiàn)的頻率。先從當(dāng)前軟件樣本的所有短序列特征中選取詞頻tf**高的多個(gè)短序列特征;然后計(jì)算選取的每個(gè)短序列特征的逆向文件頻率idf與詞頻tf的乘積,并將其作為選取的每個(gè)短序列特征的特征值,,表示該短序列特征表示其所在軟件樣本的能力越強(qiáng);**后在選取的詞頻tf**高的多個(gè)短序列特征中選取,生成字節(jié)碼n-grams特征視圖。:=tf×idf;tf(termfrequency)是詞頻,定義如下:其中,ni,j是短序列特征i在軟件樣本j中出現(xiàn)的次數(shù),∑knk,j指軟件樣本j中所有短序列特征出現(xiàn)的次數(shù)之和。數(shù)據(jù)驅(qū)動(dòng)決策:艾策科技如何提升企業(yè)競(jìng)爭(zhēng)力。
程序利用windows提供的接口(windowsapi)實(shí)現(xiàn)程序的功能。通過一個(gè)可執(zhí)行程序引用的動(dòng)態(tài)鏈接庫(dll)和應(yīng)用程序接口(api)可以粗略的預(yù)測(cè)該程序的功能和行為。統(tǒng)計(jì)所有樣本的導(dǎo)入節(jié)中引用的dll和api的頻率,留下引用頻率**高的60個(gè)dll和500個(gè)api。提取特征時(shí),每個(gè)樣本的導(dǎo)入節(jié)里存在選擇出的dll或api,該特征以1表示,不存在則以0表示,提取的560個(gè)dll和api特征作為***個(gè)特征視圖。提取格式信息特征視圖pe是portableexecutable的縮寫,初衷是希望能開發(fā)一個(gè)在所有windows平臺(tái)上和所有cpu上都可執(zhí)行的通用文件格式。pe格式文件是封裝windows操作系統(tǒng)加載程序所需的信息和管理可執(zhí)行代碼的數(shù)據(jù)結(jié)構(gòu),數(shù)據(jù)**是大量的字節(jié)碼和數(shù)據(jù)結(jié)構(gòu)的有機(jī)融合。pe文件格式被**為一個(gè)線性的數(shù)據(jù)流,由pe文件頭、節(jié)表和節(jié)實(shí)體組成。惡意軟件或被惡意軟件***的可執(zhí)行文件,它本身也遵循格式要求的約束,但可能存在以下特定格式異常:(1)代碼從**后一節(jié)開始執(zhí)行;(2)節(jié)頭部可疑的屬性;(3)pe可選頭部有效尺寸的值不正確;(4)節(jié)之間的“間縫”;(5)可疑的代碼重定向;(6)可疑的代碼節(jié)名稱;(7)可疑的頭部***;(8)來自;(9)導(dǎo)入地址表被修改;(10)多個(gè)pe頭部;(11)可疑的重定位信息;。第三方實(shí)驗(yàn)室驗(yàn)證數(shù)據(jù)處理速度較上代提升1.8倍。軟件測(cè)評(píng)認(rèn)證有什么用
代碼質(zhì)量評(píng)估顯示注釋覆蓋率不足30%需加強(qiáng)。軟件測(cè)試報(bào)告的費(fèi)用
它已被擴(kuò)展成與軟件生命周期融為一體的一組已定義的活動(dòng)。測(cè)試活動(dòng)遵循軟件生命周期的V字模型。測(cè)試人員在需求分析階段便開始著手制訂測(cè)試計(jì)劃,并根據(jù)用戶或客戶需求建立測(cè)試目標(biāo),同時(shí)設(shè)計(jì)測(cè)試用例并制訂測(cè)試通過準(zhǔn)則。在集成級(jí)上,應(yīng)成立軟件測(cè)試**,提供測(cè)試技術(shù)培訓(xùn),關(guān)鍵的測(cè)試活動(dòng)應(yīng)有相應(yīng)的測(cè)試工具予以支持。在該測(cè)試成熟度等級(jí)上,沒有正式的評(píng)審程序,沒有建立質(zhì)量過程和產(chǎn)品屬性的測(cè)試度量。集成級(jí)要實(shí)現(xiàn)4個(gè)成熟度目標(biāo),它們分別是:建立軟件測(cè)試**,制訂技術(shù)培訓(xùn)計(jì)劃,軟件全壽命周期測(cè)試,控制和監(jiān)視測(cè)試過程。(I)建立軟件測(cè)試**軟件測(cè)試的過程及質(zhì)量對(duì)軟件產(chǎn)品質(zhì)量有直接影響。由于測(cè)試往往是在時(shí)間緊,壓力大的情況下所完成的一系列復(fù)雜的活動(dòng),因此應(yīng)由訓(xùn)練有素的人員組成測(cè)試組。測(cè)試組要完成與測(cè)試有關(guān)的多種活動(dòng),包括負(fù)責(zé)制訂測(cè)試計(jì)劃,實(shí)施測(cè)試執(zhí)行,記錄測(cè)試結(jié)果,制訂與測(cè)試有關(guān)的標(biāo)準(zhǔn)和測(cè)試度量,建立鍘試數(shù)據(jù)庫,測(cè)試重用,測(cè)試**以及測(cè)試評(píng)價(jià)等。建立軟件測(cè)試**要實(shí)現(xiàn)4個(gè)子目標(biāo):1)建立全**范圍內(nèi)的測(cè)試組,并得到上級(jí)管理層的領(lǐng)導(dǎo)和各方面的支持,包括經(jīng)費(fèi)支持。2)定義測(cè)試組的作用和職責(zé)。3)由訓(xùn)練有素的人員組成測(cè)試組。軟件測(cè)試報(bào)告的費(fèi)用