反垃圾邮件的战争永不会停息,而本文在此给出了一些反垃圾邮件的实用技巧。
垃圾邮件怎样发送
真实情形
在开放式中转站如此少的情况下,如此大量的垃圾邮件是怎样被发送的呢?上文的解释可能为我们提供了答案。然而,上文并没有说明,有多少垃圾邮件究竟如何进入了你的收件箱。几年前,我们在杂志中读到那些反垃圾邮件工具的时候,其中有些工具特别有效,删除或标出垃圾邮件的比例非常高。
而如今,垃圾邮件情形则完全变了。一个典型的收件箱不仅包括各种分门别类的过时的促销商品广告,而且充斥各种商品,如高级手表,还有近来出现的买进股票的建议。不用说,高级手表极有可能是赝品,买进的股票肯定要赔钱。问题是,所有那些垃圾邮件到底是如何绕过你设置的垃圾邮件过滤器的?
垃圾邮件发送者很狡猾。好几年前,Bayesian filtering(贝叶斯)被捧为垃圾邮件识别的最强大的工具之一。这种工具不是仅仅查找信息中的关键词和短语从而加以过滤,而是分析所有单词过滤垃圾邮件,允许你用好或坏的信息对系统进行“训练”。其构想是,某些单词组合在一起使用是垃圾邮件的典型特征,而在其他语境中,同样的单词组合却可能并非如此。通过谨慎地分析其概率,Bayesian filtering能捕捉大量的垃圾邮件。
然而,过不了多久,垃圾邮件发送者就弄明白了这个道理,这就是为什么很多垃圾邮件都包含看上去是任意组成的部分文本—你可能没能看见这些白底白色的文本,但是这些文本的确存在—而Bayesian filtering读到的则是垃圾邮件之外的文本。 因此,如果在邮件中放进大量的随意组成的常见单词和短语,那么垃圾邮件成为过滤器漏网之鱼的机遇还是不小的。
当然,也还有其他的方法:诸如Cloudmark和DCC这样的系统,能够计算垃圾邮件的校验和或“指纹”,并在服务器上与其他机器共享。邮件服务器能利用其指纹来识别垃圾邮件,而且,这类系统在设计时还设置了一定程度的模糊性,包容信息中通常出现的个性化内容。然而问题是:由于僵尸网络使发送者具备了强大的计算处理能力,因此,对数以百万计的垃圾邮件进行分别设置,对一台机器来言,是一项耗时费力的工作,发送过程由此变得缓慢,因此,仍然有足够的垃圾邮件能混进信息之中,因而“指纹”就不再那么可靠了。
但同时,垃圾邮件也有了最新的招数:图片垃圾邮件。虽说垃圾邮件发送者也常常利用图片来推广其产品,但近来,使用图片的垃圾邮件数量显著上升:根据McAfee的说法,图片垃圾邮件占到了所有垃圾邮件的40%以上,而且比例还在上升,这是去年图片垃圾数量的四倍。这种图片垃圾邮件在“炒股诈骗”式的骗局(该骗局的目的,就是骗你去购买某公司股票,从而抬高该公司的股价)中最为常见。由于没有真正的文本可以扫描识别,而且信息都是从大量不同的IP地址发送过来,因此,当它们达到邮件服务器时,就很难识别出来。从理论上讲,你可以在信息中运行字符识别程序,但这样做会耗费大量的处理时间。你也不能看到带有图片的信息就加以阻止,因为如此多的个人都通过邮件共享照片,或将他们公司的标徽贴在信息中作为署名。(下一页)
网友评论