推荐算法,机器学习,会将我们带向何方?

今日头条 是一个非常成功的移动互联网创业企业,其用户活跃度,营收规模均已经达到了一个惊人的高度。市值也相当了不起,可以认为最近几年除了美团和滴滴以外,大概最有潜力走入巨头领域的互联网公司,很惭愧,后知后觉的我其实最近几年一直没看过今日头条,最近,换了部新手机,才注意到里面预装了今日头条,那么也就随之打开看了看,别说,还挺过瘾的,每天都会刷几遍,读一些奇怪的文章。

今日头条的成功,被认为是算法的成功,基于用户的点击,阅读行为,做出的一种判断,从而形成个性推送。

但很惭愧的是,我相信,在今日头条的算法数据里,我大约是个很低俗,很脑残的人。

我能理解那些作者,为了迎合增加点击率的诉求,他们所做出的种种努力,我所看到的满屏的标题,基本都是故弄玄虚,危言耸听的东西,实话说,我确实也存在好奇心,挨个点过去看看到底是啥东西配的上如此奇幻的标题,然后就是愤怒,我承认我有时候会过于较真,一些明显扯淡,谣言,以及莫名其妙,因果不分的东西,或者是牵强附会的文字,堂而皇之的出现在文章里,然而,因为我点击了,浏览了,系统大约会认为,我就喜欢这样的文字。

是的,有人会说,你可以点叉啊,可以提交不感兴趣啊。我很好奇有多少人会在看完一篇无聊的文字后,还要做这样的事情。

但这个问题,也并非是今日头条才会有的。

之前,很多人会说百度有非常坏的案例,比如某个词汇的搜索结果,会莫名其妙的出现一些色情内容,很多人觉得是百度算法烂,但其实今天我要公平说一句,这一句话对于部分从业者来说,是非常非常值钱的,今天发在这里,我猜有些朋友会嫌我多嘴了。

搜索引擎有一条规则,是基于用户点击率提权,算法认为,哪个结果的点击率越高,就越趋近于用户的搜索目标,这个规则适用于非常多的搜索场景,不仅仅是网页搜索,也包括苹果,安卓市场的搜索。

这个事情追溯一下,其最初的理由是这样的,当搜索引擎调整算法的时候,需要评估你调整的效果好,还是不好对不对,请问怎么通过数据评估呢?就是算法调整前,调整后,排名和点击率的关系是怎样的,比如第一名点击率如何,前五名点击率如何,第一页点击率如何,翻页率是多少。理论上,搜索算法越完善,用户的点击行为就应该越趋近于搜索结果的第一名,我们想想,抛开前面的所有铺垫,只从技术和数据角度去想这个逻辑,是不是这回事。所以,既然点击率是评估搜索算法调整优劣的重要数据,那么将它作为调整搜索排名的重要参数,岂不是一劳永逸,简单直接的解决了这个问题!

从技术逻辑,这是一个非常简单有效又清晰的执行方案。

但问题来了,色情内容的点击率,不论在任何关键词,都会占有优势。我做过不十分严谨的比对测试,有一个不十分严谨的个人认识,似乎Google对点击率所带来的搜索权值,没有百度给的高。当然也可能是他们对色情内容在非色情搜索词中的排名,做了额外的降权处理。

回到今日头条,也就是今天的主题,在推荐算法和机器学习的体系里,很多作者也很明白这里的利益和价值关系,为了追求用户的点击,浏览,也就是自己的内容更多的被推荐,他们更倾向于采纳故弄玄虚,危言耸听的标题,而系统,这套算法,在实践运营中,也明显激励了这样的行为。

从数据来说,这是一个多赢,用户的活跃度很高,点击率很好看,广告卖的很好,作者分到了很多钱,而这家公司获得了非常漂亮的财务报告。

但我还是很担心这样的事情,我以前讲过很多次,选择性阅读是互联网时代的一个非常可怕的事情,加剧了偏激,傲慢,族群的分裂。从中国大陆,到宝岛台湾,到香港,到美国,我们已经看到了这种互联网时代里,人们政治观点和诉求严重冲突和对立的情况越来越激烈。互联网没有减少偏见,没有增加彼此的理解和交流,而是相反,加剧了冲突和对立。

推荐算法,则对此推波助澜。

今天,我看到这些以点击率为诉求的文章,我可以当一个笑话看,或者当一个八卦看;但是对于年轻人来说,据我所知,很多人的世界观,价值观,一直被这样的文字所引导,所灌输。

前几天和人喝茶聊天,有个在新加坡国立大学读书的年轻中国留学生,愤愤的说,新加坡是如何干扰和破坏克拉克运河项目的,他的拳拳爱国心是很不错,但我真的很惊诧他平时的阅读习惯和信息来源,这件事情无论是中国政府,还是泰国政府,早就出面辟谣了,双双否认有此意向,从头到尾,根本就没存在过任何政府层面的洽谈和商讨,破坏和干扰一说又从何而来?

当然,我知道,阴谋论者一定不相信这些,点击率和推荐算法喜欢这样的东西。

下面放两篇旧文

偏见的由来-选择性阅读

再谈选择性阅读 – 巴黎惨案的话题

以上旧文内容,其实比今天写的更有价值。

很多今日头条的文章,我也注意到了,为了观点,肆意曲解事实,混淆因果,相当严重,甚至是令人难以容忍。正如第二篇文章中的范例一样。


必须说,让技术去承担太多的责任和义务,是不公平的;让商业公司去承担拯救人类的重任,也是不现实的。

推荐算法,追随用户,从常规来说,是一款好产品的标签,但,在恶趣味上越陷越深,沉溺于追求数据指标,而失去对价值的判定,我个人不喜欢这样的算法逻辑。

未经允许不得转载:人工智能 » 推荐算法,机器学习,会将我们带向何方?

赞 (1)
分享到:更多 ()

评论 0

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址