一种利用于机器进修的歹意网页特征提取办法

1年前 (2023-02-13)阅读2回复1
小强
小强
  • 管理员
  • 注册排名8
  • 经验值276535
  • 级别管理员
  • 主题55307
  • 回复0
楼主

一种利用于机器进修的歹意网页特征提取办法

做者:

张珂伟1,2,郑世普1,2,程永灵1,2,王长帅1,2

做者单元:

1.中电(海南)结合立异研究院有限公司,海南 澄迈571924;

2.海南省PK系统关键手艺研究重点尝试室,海南 澄迈571924。

摘要:

基于机器进修的歹意网页检测手艺停止研究。目前时髦的“特征码”“白名单”等体例,仅可以检测已知的歹意网页;机器进修办法,可以检测出未知的歹意网页,但在处置网页特征时要面对数据量大、复杂和繁琐的问题。提出一种哈希压缩的办法,用于处置网页的特征数据。该办法在包管检测模子的漏报率和误报率下可实现将150万的特征映射在2万的特征空间内,对提取出的特征数据运用K折穿插验证法操练多个传统机器进修模子和集成进修模子。并通过评估模子的检测效果,挑选出表示更好的分类检测模子。

引言:

PKS系统是中国电子在PK系统的根底上,将“可信计算3.0”手艺融进到CPU、操做系统和存储掌握器中,构成了“三位一体”的“PKS”主动免疫防护。PKS通过在核心层内生内置平安手艺,更大限度地提拔收集平安防护效果。本文基于PKS“小核心大生态”理念,在基于PKS核心底座的根底上,通过提出一种网页特征提取办法,实如今加强层进一步提拔系统平安的才能。

跟着收集的敏捷开展,收集进攻已经成为一个严峻的问题。当前一些收集垂钓、垃圾邮件、木马下载、歹意软件施行等进攻体例经常通过歹意网页做为传布中介。因而,检测歹意网页往阻遏那些进攻,对庇护收集平安具有十分重要的意义 [1] 。

当前歹意网页的检测办法次要包罗静态特征检测和动态特征检测,两种检测办法都需要对网页特征停止提取。静态特征的提取办法是起首需要成立一个歹意网页特征库,对网页的源代码或URL链接等属性停止特征提取,将提取的特征在歹意网页静态特征库中停止比对,最末揣度待检测网页能否为歹意网页 [2-4] 。动态特征检测办法是对歹意网页在运行时数据的下载动做、插件处置、拜候网页等动态特征停止提取,通过火析行为成果看待检测网页停止检测 [5-6] 。

文章来源:《电子手艺利用》杂志12月刊

,下载论文PDF

☞商务协做:☏ 请致电 010-82306118 / ✐ 或致件 Tiger@chinaaet.com

0
回帖

一种利用于机器进修的歹意网页特征提取办法 相关回复(1)

繁星点点
繁星点点
沙发
机器进修助力,恶意网页特征提取办法高效精准。
吐槽7天前 (05-28 00:03)回复00
取消
载入表情清单……
载入颜色清单……
插入网络图片

取消确定

图片上传中
编辑器信息
提示信息