清除垃圾邮件(2)
真实情形
在开放式中转站如此少的情况下,如此大量的垃圾邮件是怎样被发送的呢?上文的解释可能为我们提供了答案。然而,上文并没有说明,有多少垃圾邮件究竟如何进入了你的收件箱。几年前,我们在杂志中读到那些反垃圾邮件工具的时候,其中有些工具特别有效,删除或标出垃圾邮件的比例非常高。
而如今,垃圾邮件情形则完全变了。一个典型的收件箱不仅包括各种分门别类的过时的促销商品广告,而且充斥各种商品,如高级手表,还有近来出现的买进股票的建议。不用说,高级手表极有可能是赝品,买进的股票肯定要赔钱。问题是,所有那些垃圾邮件到底是如何绕过你设置的垃圾邮件过滤器的?
垃圾邮件发送者很狡猾。好几年前,Bayesian filtering(贝叶斯)被捧为垃圾邮件识别的最强大的工具之一。这种工具不是仅仅查找信息中的关键词和短语从而加以过滤,而是分析所有单词过滤垃圾邮件,允许你用好或坏的信息对系统进行“训练”。其构想是,某些单词组合在一起使用是垃圾邮件的典型特征,而在其他语境中,同样的单词组合却可能并非如此。通过谨慎地分析其概率,Bayesian filtering能捕捉大量的垃圾邮件。
然而,过不了多久,垃圾邮件发送者就弄明白了这个道理,这就是为什么很多垃圾邮件都包含看上去是任意组成的部分文本—你可能没能看见这些白底白色的文本,但是这些文本的确存在—而Bayesian filtering读到的则是垃圾邮件之外的文本。 因此,如果在邮件中放进大量的随意组成的常见单词和短语,那么垃圾邮件成为过滤器漏网之鱼的机遇还是不小的。
当然,也还有其他的方法:诸如Cloudmark和DCC这样的系统,能够计算垃圾邮件的校验和或“指纹”,并在服务器上与其他机器共享。邮件服务器能利用其指纹来识别垃圾邮件,而且,这类系统在设计时还设置了一定程度的模糊性,包容信息中通常出现的个性化内容。然而问题是:由于僵尸网络使发送者具备了强大的计算处理能力,因此,对数以百万计的垃圾邮件进行分别设置,对一台机器来言,是一项耗时费力的工作,发送过程由此变得缓慢,因此,仍然有足够的垃圾邮件能混进信息之中,因而“指纹”就不再那么可靠了。
但同时,垃圾邮件也有了最新的招数:图片垃圾邮件。虽说垃圾邮件发送者也常常利用图片来推广其产品,但近来,使用图片的垃圾邮件数量显著上升:根据McAfee的说法,图片垃圾邮件占到了所有垃圾邮件的40%以上,而且比例还在上升,这是去年图片垃圾数量的四倍。这种图片垃圾邮件在“炒股诈骗”式的骗局(该骗局的目的,就是骗你去购买某公司股票,从而抬高该公司的股价)中最为常见。由于没有真正的文本可以扫描识别,而且信息都是从大量不同的IP地址发送过来,因此,当它们达到邮件服务器时,就很难识别出来。从理论上讲,你可以在信息中运行字符识别程序,但这样做会耗费大量的处理时间。你也不能看到带有图片的信息就加以阻止,因为如此多的个人都通过邮件共享照片,或将他们公司的标徽贴在信息中作为署名。
到处都是垃圾邮件,数量如此巨大,难怪也有人在想,互联网是否也该需要新的邮件系统了。然而,这种情况却不太可能会发生。首先,就是因为有太多的人在使用现有的标准,沟通交流由此变得更为容易。其次,还有那些僵尸部落的存在:由于如此多的系统都被感染,进而受到控制,因此,用不了多久,垃圾邮件发送者就会找到方法去攻击那些系统。如此看来,可能只有从技术和法律层面提供解决方案了:从技术层面看,可以采用新技术,将其融入现存系统,以此来验证邮件;从法律层面来看,只要这些邮件发送者利用垃圾邮件的行为触犯法律,那么就将其告上法庭。
同时,要保持收件箱干净,你能采取什么措施呢?很明显,对于桌面反垃圾邮件软件而言,有效的清除工作十分困难,清除图片垃圾邮件更是如此。当然,就清除其他各类垃圾邮件而言,只要通过查找关键字、阻止已知的垃圾邮件域名或将已知联系人放进“白名单”中,这些桌面反垃圾邮件软件仍然发挥着作用。但是,看起来,要有效地解决这个问题,真的有必要,在全球的电子邮件服务器上展开对垃圾邮件的战争。
传统做法中的“黑名单”就是反垃圾邮件的一项工具。黑名单就是一个已知的垃圾邮件发送者的IP地址列表,因此,只要邮件发送者试图接入,邮件服务器就会拒绝这种垃圾邮件。虽然这种名单能够阻止商业电子邮件营销公司来骚扰你,但正如Spamhaus(www.spamhaus.org )这类组织发现的那样,当具商业目的的垃圾邮件发送者污染我们收件箱的“权利”受到侵犯时,他们会付诸法律,和受害人对簿公堂。
跟SPF一样,域名允许你设置哪个邮件服务器是否是可靠的服务器,是否可以用来发送哪些宣称是来自你的域名的信息。
当然,限制垃圾邮件发送者,我们也有其他策略:其中之一就是试图将邮件发回到发送邮件的每一台机器上,不过,这的确耗费资源,而且,不一定总是可靠。其他两项新技术则更为实用。其中一项是使用灰色名单,阻止垃圾邮件一次性大量群发邮件的行为,另外一项就是使用发送方策略框架(Sender Policy Framework, SPF)。这两项策略都可以应用于你自己的邮件服务器,当前,为公司提供主机空间的越来越多的ISP都大量使用这两项策略。
网友评论