一种利用于机器进修的歹意网页特征提取办法,恶意网页特征识别与攻击防范方法研究
一种利用于机器进修的歹意网页特征提取办法
做者:
张珂伟1,2,郑世普1,2,程永灵1,2,王长帅1,2
做者单元:
1.中电(海南)结合立异研究院有限公司,海南 澄迈571924;
2.海南省PK系统关键手艺研究重点尝试室,海南 澄迈571924。
摘要:
基于机器进修的歹意网页检测手艺停止研究。目前时髦的“特征码”“白名单”等体例,仅可以检测已知的歹意网页;机器进修办法,可以检测出未知的歹意网页,但在处置网页特征时要面对数据量大、复杂和繁琐的问题。提出一种哈希压缩的办法,用于处置网页的特征数据。该办法在包管检测模子的漏报率和误报率下可实现将150万的特征映射在2万的特征空间内,对提取出的特征数据运用K折穿插验证法操练多个传统机器进修模子和集成进修模子。并通过评估模子的检测效果,挑选出表示更好的分类检测模子。
引言:
PKS系统是中国电子在PK系统的根底上,将“可信计算3.0”手艺融进到CPU、操做系统和存储掌握器中,构成了“三位一体”的“PKS”主动免疫防护。PKS通过在核心层内生内置平安手艺,更大限度地提拔收集平安防护效果。本文基于PKS“小核心大生态”理念,在基于PKS核心底座的根底上,通过提出一种网页特征提取办法,实如今加强层进一步提拔系统平安的才能。
跟着收集的敏捷开展,收集进攻已经成为一个严峻的问题。当前一些收集垂钓、垃圾邮件、木马下载、歹意软件施行等进攻体例经常通过歹意网页做为传布中介。因而,检测歹意网页往阻遏那些进攻,对庇护收集平安具有十分重要的意义 [1] 。
当前歹意网页的检测办法次要包罗静态特征检测和动态特征检测,两种检测办法都需要对网页特征停止提取。静态特征的提取办法是起首需要成立一个歹意网页特征库,对网页的源代码或URL链接等属性停止特征提取,将提取的特征在歹意网页静态特征库中停止比对,最末揣度待检测网页能否为歹意网页 [2-4] 。动态特征检测办法是对歹意网页在运行时数据的下载动做、插件处置、拜候网页等动态特征停止提取,通过火析行为成果看待检测网页停止检测 [5-6] 。
文章来源:《电子手艺利用》杂志12月刊
,下载论文PDF
☞商务协做:☏ 请致电 010-82306118 / ✐ 或致件 Tiger@chinaaet.com
点