近日,领先的信息安全解决方案提供商卡巴斯基又在美国获得一项新专利,专利号为№ 8,001,195。该专利涉及一项高效的垃圾邮件识别技术,运用词汇学向量对垃圾邮件进行识别。
据了解,由卡巴斯基开发的这项技术,能够在使用大型已知垃圾邮件数据库时,显著缩短垃圾邮件检测所需要的时间。这一技术对于大型的电子邮件服务商非常实用,因为其每小时都要过滤数量庞大的垃圾邮件。
通过创建词汇学向量来检测垃圾邮件,较传统的垃圾邮件检测技术(包括关键字过滤、发件人地址屏蔽等)更为有效。这项专利技术包括几个步骤,逐一对电子邮件进行分析。首先,邮件中的文本会被形态标准化(异体归类),从而确定其中的特定词汇以及其变形。除去干扰词汇(介词、冠词、常见动词的各种变形,如do、have和be等等),每个特定词汇都会基于其在邮件文本中出现的数量被赋予一个标识符。根据所有被赋予的标识符,就可以组成词汇学向量。接下来,根据词汇学向量,创建直方图,同时每个词汇学向量的长度会被单独计算。
为了检测垃圾邮件,需要将直方图结果和词汇学向量长度同数据库中存储的已知垃圾邮件信息的直方图和向量长度进行比较。这项新专利技术相比传统的直接同大型数据库垃圾邮件信息匹配技术,大大提高了检测速度。
卡巴斯基工作人员介绍,这项反垃圾邮件技术已经是卡巴斯基实验室在美国获得的第31项专利,卡巴斯基实验室目前还有46项专利技术正在接受美国专利商标局的审核。此外,卡巴斯基实验室尚有80多项专利申请在俄罗斯、中国以及欧洲进行审理。这些新技术均在信息安全领域具有独创意义。
网友评论