侯虹斌:算法:趟过大江大海,也要越过荆棘沟壑

互联网 | 编辑: 李佳佳 2018-01-17 15:24:52转载

在内容分发行业,不仅今日头条,大家都应为机器算法释疑。社会共治下,才会诞生最贴近社会和人民的平台。

2018-01-15 侯虹斌

技术的进步神速,远远超过人类的想象。

中国的科技发展,速度也越来越快。今天的互联网行业,已经完成了一轮又一轮的自我更新和进化了;而且,无论是在体量上,还是在创新的理念上,都领先于全球。

你试想一想,如果出门没有智能手机,是不是就毫无安全感?是不是感觉一瞬间就会错过全世界的信息?而且,我们更需要合适的算法,来为我们从海量的信息甄选出我们最感兴趣的。

其中,今日头条以“机器算法”为利器,崛起于全球互联网之间。

值得一提的是,今日头条揭开一张面纱,加了一道保险杠。

1月11日,今日头条召开了一场题为“让算法公开透明”的分享会,资深算法架构师、中国科学技术大学计算机博士曹欢欢向媒体和行业公开了算法原理,尤其是在内容安全机制上的防控举措。

机器算法,是今日头条在几年内崛起于全球互联网的利器,更是这家年轻企业的核心机密。不过,在最近不小的舆论声浪中,机器算法再一次遭遇质疑。

这场分享会除了BAT、美团、新浪和网易的技术同行外,还接纳了100多位自中央电视台、新华社、人民日报技术局等媒体机构的从业者。

这样的路子显然是对的。在创业早期,今日头条需要安抚的,是那些愤怒的传统媒体总编,他们将影响力和广告的下滑,归咎于内容分发平台的崛起。

今天,今日头条还要说服传统媒体所依附的体制相信,机器算法是信息流动的筛选机和稳压器,而不是外界想象的,是一台失控的无人驾驶汽车。

所以,今日头条早就应该将机器算法的原理,从码农们熟知的那种语言,编译成大众可以听懂的话语,尽可能消除疑惧。1月11日的这场分享会,相信只是一次开端。

但是,也不宜将分享会视作一次被动的“应激反应”,我们不能将它今日的处境,与创业史隔离。今日头条创始5年来,围绕机器算法的是非黑白之辩,一直是个老话题,所不同的是,这个话题每一次呈现的方式和烈度各有不同。

今日头条的疑惑就在于,内容分发内容分发平台更类似于信息的超市,既要追求丰富度,又要在审美上完全符合知识精英和有关部门的期待,其实是个不可能完成的任务。大多数内容消费者都各有偏好,但有兴趣发出声音,并且自带传播渠道的人群,则往往会对大众的资讯偏好持保守立场。

今日头条,则不幸地被夹在中间。

无论中外,媒体和内容分发平台不但要在技术和运营上持续迭代,也要时刻确保内容的安全性。这是进行时而非过去时,似乎也注定了,这项工作每一刻都要忍受挑剔,因为没有“最安全”和“最干净”的内容,只有下一刻的“更安全”和“更干净”。

制订内容标准的,永远是人类,人类的认知和执行标准,又极易波动。现在这一秒的内容分发平台,是上一秒的标准的产物,却注定无法让下一秒的人尽数满意。

与此同时,信息流总数一直狂飙猛进。现在,今日头条APP内每天信息流展示的文章/视频超过100亿条,处理的数据量超过7.8PB,每天产生60亿次的服务器请求数量。

这些空前的数据不但每一天都在提升今日头条的商业价值,也会在非市场领域为它制造难题。

而今日头条、乃至整个算法驱动的内容分发行业最大的问题是,内容分发平台和机器算法需要什么样的价值观?

这恐怕可以算得上近几年来,运营策略最值得商榷的一处盲区。

就像这次今日头条算法分享会,如果在两年前或者一年前召开,局面或许就会不一样。而在这几年内,今日头条的技术一直被友商借鉴和学习,但对机器算法推崇最高调的,无疑还是头条。

无论这出自商业考虑还是技术上的自信,都难以避免被外界甚至是业界做负面的解读。

今日头条CEO张一鸣说过,低俗和有害信息其实在损害今日头条的商业利益。在流量品牌护城河筑成之后,信息流广告是今日头条的主要收入渠道,信息流的安全高频推送成为平台的生命线。今日头条都没有可能,更没有必要去触碰高压线。

今日头条CEO张一鸣

理虽然是这个理,但更需要今日头条主动讲出去。

1月11日的分享会,今日头条详述机器算法的原理和规则,重点叙及内容安全审核的举措,行外人很可能难以完全看懂,但这并不重要,需要看懂的那群人可以知悉,就已足够。对整个行业来讲,这已是个好的开始。

在今日头条的技术框架内,机器算法成为人工审核团队的臂膀,今日头条还有技术识别,包括风险内容识别技术,构建千万张图片样本集的鉴黄模型,超过百万样本库的低俗模型和谩骂模型等,以及泛低质内容识别技术等。

在这一整套内容技术生态面前,外界对于机器算法的猜测和非议,很多都需要修正。

人类对人工智能的疑惧由来已久,不过大都参照了科幻电影中的恐怖想象,这其实与人工智能的原理和路径严重不符。正如分享会宣讲者曹欢欢所说,机器终究是为人服务的,在很多方面并不能替代人工,相反还可以增益人工效率和精准度。

机器算法是今日头条的长项,但更是移动互联时代的大势。

在内容分发行业,不仅今日头条,大家都应为机器算法释疑。社会共治下,才会诞生最贴近社会和人民的平台。

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑