相似样本查找引擎研究
目录:
一、概述。
二、基于可变长度特征的相似度。
1、两个字符串之间的相似度(最短编辑距离)。
2、从样本到变长特征。
(1) 强弱hash模型。
(2) 关键字密度模型。
三、基于固定长度特征的相似度。
1、修改的K-means算法。
2、从样本到定长特征。
(1) 基于数据频度的量化。
(2) 基于图片压缩的算法。
四、总结。
五、引用。
一、概述
在日常工作中,病毒分析师经常被要求在样本库里查找相似样本。比如在获得某APT组织的样本的情景下,希望查找其历史版本来确定组织的活动时[......]