小心!个性化推荐可能加强偏见|荐读

万周按
有没有某一刻,发现社交网络、APP等给你推荐了一些离奇的内容?心理念叨“我怎么会对这种内容感兴趣呢?”这种情况,一、“母体”算法出现了Bug;二、算法将“你循环”演进到了极致;三、算法更了解你。哪种最可怕?
本文摘自:《注意力市场》
作者:詹姆斯•韦伯斯特

大数据的概念一直很火热,但数字从来不会自己说话。数据必须经过分析才能产生意义。数据必须要清理、加权、整理、分析,海量的数据需要简化为指导行动的推荐法则。这就是算法,简单地说,算法就是一个计算机程序。算法的目的通常是预测。例如,算法可以预测我们最希望从某个网站获取什么特定信息,或者推荐我们喜欢的书籍、电影、新闻。

生成推荐的两种思路

有很多方法可以建立算法。但是有两个最为常见的方法用于建立推荐算法:搜索和协同过滤。

搜索引擎根据询问提供推荐。只要输入一个搜索词,你就会得到推荐。这个推荐一般是超链接的函数。很多网站都通过提供链接指向其它站点。只要有足够大的计算机,就有可能“爬梳”整个网络,从而知道众多网页是如何互联的。例如,谷歌每天将 200 多万个网页编入索引。虽然链接表示的是路径的存在,而不是实际的流量,但是它们经常被用来表示流通数量、联系强度,甚至直接就表示重要性。海量信息被提取到一个排序列表,最重要的或者最受欢迎的东西被置于顶部。

另一个生成推荐的方法是协同过滤。亚马逊和奈飞使用的就是这个方法。协同过滤通过追踪每个用户的购买、租赁、下载、评价等行为,从而为每个用户建立档案。然后,算法将具有相似档案的用户进行比较,目的是向你推荐“像你一样的人”可能喜欢的东西。

例如,如果大多数与你档案相似的用户购买了《五十度灰》(Fifty Shades of Grey)这本书,而你没有购买,那么你很可能收到一个对该书的推荐。协同过滤被用于推荐电影、音乐、新闻、电视节目,甚至任何东西。最新一代的推荐机制考虑了各种各样的背景信息,例如你在哪里或你的日历上有什么,从而预测出你接下来可能想要什么。

除了帮助用户找到东西,这些个性化推荐也常常向你推荐另外一本书或传送定位性非常强的信息。大多数用户可能看穿了这些伎俩,但是推荐机制似乎仍然广受欢迎。推荐算法能否在对的时间推荐对的东西,根本上取决于它们收集数据的规模和范围。如果这些数据能与其他描述用户的信息(购买、偏好、社会关系、活动等)相结合,就能进一步加强定位能力,提高推荐精准度。

创造忠诚客户的“最好方法”

网络时代可选择的东西如此之多,可用于选择的时间如此之少。个性化推荐在一定程度上能够预见我们认为有用或有趣的东西。它意味着我们无须在搜索上浪费时间,无须考虑每个选项。

营利网站具有追求个性化推荐的欲望,这被一些专家称为“为相关性而进行的竞赛”,驱动着大多数硅谷企业。因为创造忠诚客户的最好方法就是,“提供真正对应每个人独特兴趣、欲望和需求的内容”。而这也正是协同过滤的存在理由。

640.webp (7)

谷歌从 2009 年开始提供个性化搜索结果。Facebook 的图谱搜索提供了另一种个性化推荐方法。根据《纽约时报》的说法,“在用户的 Facebook 好友中哪一个与用户最亲密,在搜索结果中用户最想看到谁的答案,这些都是由算法审定的”。

社交网络和亲密小组也无意中造成了个性化偏见。几乎所有的社交网络都是同质化的。社交网络的成员倾向于拥有相似的背景、兴趣和性情。在这些网络之中,照顾到相关群体兴趣、规范和偏见的媒介更容易得到广泛传播。社交新闻网站,通过推导、综合和排名向人们推荐值得关注的东西,从而鼓励了这种选择性。

其实,社交网络呈现给我们的推荐,可能比我们想象的还要自动化。Facebook 通过一种名为EdgeRank的算法,为每个用户提供个性化的动态新闻。与图谱搜索类似,EdgeRank也是优先呈现来自与我们关系密切的人们的最新消息。换句话说,在所有的 Facebook 好友中,我们更可能听到像我们自己类似的用户的消息。

在一定程度上,这种定制内容造成了社交媒体上普遍存在的个性化偏见。个性化推荐带来的最大问题是,它让用户撤回到舒服的飞地,其结果是用户的视野变窄,偏见增强。例如,个性化可能会鼓励保守主义者收看“红媒”,自由主义者收看“蓝媒”。

然而,这些来自朋友的推荐所产生的社会效应,到底是社交传染效应还是同质性效应?我们难以区分。

人们可能会看到同样的东西,做同样的事情,这不是因为推荐,而是因为他们彼此相同。然而,也有证据证明,朋友的督促能够促使人们去投票,从而影响难分伯仲的选举结果。而且,似乎来自熟人的推荐压倒了选择性接触的倾向。

自动化的“非人类”推荐,例如协同过滤——或许不如“人类”推荐更具潜在影响力,但在当今世界,随着 Facebook 和推特使用算法滤出个人信息和推荐,人类推荐和非人类推荐之间的界限也变得日益模糊。

极化的社会?

过去很多人认为,当大量不同个体独立做出决定或预测时,智慧得以实现。将这些自主决定加在一起,通常可以产生一个明显优于专家意见的结果。不幸的是,个性化推荐挑战了这一观点。

首先,推荐通常以相对较小的同质群体为基础。如我们所见,社交网络或亲密小组的成员是同质的,成员的数量是有限的。人类学家罗宾·邓巴认为,人类最多能够维持150多个有意义的人际关系,因此社交网络的规模是有限的。不管怎样,社交网络作为推荐实体,通常并不具备做出聪明判断所需的规模和多样性。

其次,在用户信息机制中,缺少了独立决策,而这是明智决断必须的。搜索为用户提供了其他人所作所为的信息,有效引导了接下来的决策。社交网络整合并报告其他用户选择了什么或推荐了什么,为用户提供了强烈的社会期望信号。而人类天性中有从众心理,喜欢随大流。

个性化推荐将我们引向那些关心我们兴趣和偏见的媒体。通常,推荐机制需要从我们过去的行为中进行推断,从而猜测我们是谁、喜欢什么。作家伊莱·帕里泽将此称为“你循环”:“你点击一个链接,说明你喜欢其中某个东西,意味着你接下来很有可能会看到与那个话题相关的文章,然后它进一步为你启动了那个话题。你陷入了‘你循环’,如果你的身份被误表达,就会产生一些奇怪的模式,就像扩音器中出现的回响。”

有一种可能是,某些东西被启动,而其它东西未被启动,我们可能会培养起一种对所推荐东西的品位。正如我们所看到的,很多社会评论家担心个性化可能会使社会极化,如果所有这些推荐机制进一步去迎合并创造偏好、偏见的话,情况会更糟糕。

640.webp (12)

 


  • 隐私保护 2013万科企业股份有限公司 版权所有 粤ICP备05098314号 技术支持
  • Copyright ©1996-2013 Vanke Corporation, All Rights Reserved