昨日重现:算法改变了我们的怀旧

神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。

编者按:未来属于大数据,你能想到的一切正在被数据化,甚至包括文化艺术。研究表明,音乐正在变得越来越雷同。为什么?因为人们日益通过流媒体平台收听音乐,而这些普通会利用算法预测我们的品味并推荐歌曲。但这种根据过去预测未来的算法只会让我们同质化,让文化因为缺乏产生新想法、新可能性的资源而衰落。崇拜数字技术力量的那些人也许认为正朝着乌托邦迈进。但是,如果我们让算法替我们所有人预测未来,我们就会发现,除了回到过去,我们别无他处可去。文章来自编译。

图片来源:Pixabay

划重点:

音乐与消费者被简化成数据

听众的口味会慢慢开始跟流媒体平台所创建的模型类似

预测算法其实什么也预测不了,只能让特定类型的过去重现而已

重新配置的文化艺术品看起来也许很新鲜,但其实却是新瓶装旧酒

推荐算法

2012 年,西班牙国家研究委员会人工智能研究所(Artificial Intelligence Research Institute of the Spanish National Research Council)的 Joan Serra 等科学家证实了一件很多人开始怀疑的事情:音乐正变得越来越雷同。这支团队利用计算机分析,把近 50 万首录音歌曲按响度、音高和音色等变量进行分解,结果发现,自 1960 年代以来,流行音乐音色的多样性就一直在减少。这种趋同性表明,流行音乐在朝着消费品的底层特征发展:遵循一种让音乐得到病毒式传播的公式。

这些发现标志着音乐发现行业走到了分水岭。为了利用人工智能生成歌曲的描述性元数据,从而让算法可以推荐合适的歌曲给听众,这个行业已经付出了 10 亿美元的努力。2010 年代初期,领先的音乐智能公司还是Echo Nest,然后 Spotify 在 2014 年收购了前者。 2005 年诞生于麻省理工学院媒体实验室的Echo Nest 研究了一系列的算法,这些算法可以利用一组参数来测量录制音乐,比方说原声性(acousticness)、舞蹈性(danceability)、器乐性(instrumentalness)和言语性(speechiness)等名字比较拗口的参数。为了完善他们的模型,这些算法还可以到互联网上面去搜索,并对描写特定音乐的任何内容进行语义分析。其目标是设计出一首歌曲的完整指纹:把音乐简化成数据,从而更好地引导消费者找到他们喜欢的歌曲。

最终,听众的口味就会慢慢开始跟流媒体平台所创建的模型类似

到了 Spotify 收购下 Echo Nest 时,后者声称已利用一万亿个数据点分析了超过 3500 万首歌曲。这些数据让 Spotify 获得强悍的推荐能力,可以跟踪用户的收听习惯,并推荐相关的新音乐,把数据收集、分析与预测性干预集成到一个闭环之中。

科学哲学家 Catherine Stinson 是这样描述这个闭环的:

事件序列是这样的一个闭环,它从根据初始模型做出推荐开始,然后把推荐呈现给向用户,并选择其中部分推荐进行互动。这些互动会以标签的形式提供显式或隐式的反馈,用来更新初始模型。然后这个闭环会根据更新的模型提供新的推荐。

其结果是用户会不断遭遇类似的内容,因为算法不断地推荐给他们。随着这个反馈循环不断继续,慢慢已经没有新信息可以添加进去;而算法的目的就是推荐出它认为肯定符合你品味的内容。

没有哪个流媒体平台可以准确预测品味;人类太善变了,没法做出一致的预测。Spotify 的做法是建立用户模型,然后通过推荐跟模型匹配的音乐来做出预测。一旦陷入到这些反馈循环里面之后,音乐风格就会开始趋同,因为过去推荐的依据是Echo Nest 描述器预先确定的词汇。最终,听众可能就会慢慢接近流媒体平台创建的模型。随着时间的推移,有的人可能会变得对回声以外的任何事物都无法容忍。

在 Echo Nest 的参数出现之前,20 世纪的音乐行业还要靠其他类型的数据去制作热门歌曲。所谓的波普文化创造者(merchants of cool)会走上街头去寻找下一个热门趋势,会对青少年的欲望进行研究,生成大量数据,然后用来辅助推销下一个热门话题。这种数据收集现在已经内置到收听装置本身了。一旦用户用 Spotify 收听了足够多的音乐,让后者建立起个人品味档案(就变量的一致性而言,可以将其简化为歌曲本身等数据),推荐系统就可以开始工作了。你使用 Spotify 的次数越多,Spotify 就越能确定你的兴趣,或者做出预测的尝试。(你准备好收听更多的原声音乐了吗?)

将文化产品与消费者均拆解为数据,这不仅揭示了病毒式传播的一个明显的潜在公式,还促成了流媒体时代新型的公式化内容以及品味的渠限化(canalizing)。被简化成零部件后,文化现在可以重新组合与优化,从而推动用户的参与。这让平台能够从积压的内容当中榨取出更多的价值,并把预先存在的数据点重组为一系列新的相关性,推动新内容的创作朝着平台最有能力处理,并能从中获利的方向发展。(听众在 Spotify 上收听针对 Spotify 优化的音乐受益最大。)但是,尽管这种重新配置的文化艺术品看起来也许很新鲜,但其实却是新瓶装旧酒。这有可能会导致文化因为缺乏产生新想法、新可能性的资源而衰落。

尽管这种重新配置的文化艺术品看起来也许很新鲜,但其实却是新瓶装旧酒

而在平台环境以外的地方,社交互动往往是生成式(generative)的;想法靠分享或协作产生,大家的相互影响以不可预测的方式进行。但在平台之内,我们被归类成数据,然后跟系统里面其他人的个人资料进行比较,这一过程叫做协同过滤(collaborative filtering)。作品是根据用户的品味档案以及消费过类似内容的其他人的档案而做出的推荐。然后用户以点击作品的形式提供反馈,过滤算法则会对其推荐做出相应调整。这也许会扩大一个人的接触面,但逃不出平台的五指山,必须符合其计算预测的方向。平台在你面前竖起的是一面镜子,它不仅反映了你自己,也反映出你是怎么随大流的。

如果你想冻结住文化,第一步就是把文化简化为数据。如果你想维持僵化的现状,根据人们过去的行为和品味训练出来的算法将是最好的工具。就像凯茜·奥尼尔(Cathy O"Neil) 在 2017 年的一次演讲中所说那样,他们在“重复我们过去的做法”。詹姆斯·布里德尔(James Bridle)解释说,文化如果像算法一样去思考的话,也会“投射出一个跟过去一样的未来,因为当作数据收集的东西,建模的时候依据的就是它的本来面貌,然后向前投射——其隐含的假设是跟之前的经验相比,事物不会发生根本上的改变或偏离。” 在一个依赖计算来理解事物的世界里,“探索可能性变成了探索可计算性”。

随着将音乐拆解为计算机算法可以理解的参数的做法不断深入,西方主流流行音乐的差异化可能会进一步减少,因为模拟时代的数据正在被重新注入到当下。很多新歌都是对旧歌的优化重排,试图去利用算法分析检测和实现出来的相关性。如果我们的口味稍有变化,算法就会做出调整,或者强行向我们提供它计算出来的,我们最有可能参与的内容,试图逐步推动我们的口味符合它的设定。不管是哪种方式,推荐算法的目标都不是制造惊喜或震撼,而是确认。这个过程看起来很像预测,其实只是重复。结果是千篇一律:现在看起来像过去,而未来没有未来

复古诱饵

因此,怀旧不再只是对过去的“乡愁”,在今天,有人还通过算法的干预,以改良的方式,主动去煽动这种情绪。这种新的怀旧不仅源自一个以数据形式呈现的世界;它还变成了不断产生数据的诱饵。

刚开始的时候,平台部分是靠外在的怀旧来吸引用户:这也许可以叫做 “复古诱饵”(retrobait)。这种风格是 Instagram 在2010 年推出的。用了模拟摄影的那种气氛和局限性来吸引用户,Instagram早期的竞争对手 Hipstamatic 也这么做(新进入者 Dispo 现在也想这么做)。Instagram 推出了系列滤镜,用户可以用滤镜在发布之前给自己的数字图像增加一种模拟照片的朦胧感,从而把瞬间变成回忆。这种策略类似于给让人回想起旧时流行文化的新作品嵌入的复活节彩蛋,比方说最近的电影《太空大灌篮》、《玩家一号》以及《无敌破坏王2:大闹互联网》(Ralph Breaks the Internet)等。

随着社交媒体变得愈发的根深蒂固与无处不在,怀旧开始直接由平台自身的性质塑造,就像 Timehop 一样,这款app可挖掘过去的帖子,然后并向用户展示他们过去发布过的内容,还有其他类似的算法性回忆功能,到了“周年纪念日”的时候将内容重现。

在流媒体平台这里,新旧内容是混合的,要进行再平衡,目的是要吸引和留住用户,所以它们经常要求助于复古诱饵,诱骗用户参与,以确保类似《办公室》或《老友记》这样令人垂涎的旧内容的权利。但与此同时,他们也制作了一些原创内容,就是把过去的一些节目元素进行重新组合(跟 Echo Nest 把歌曲分解成据称可拆卸的核心组件很像)——算是一种精致的复古诱饵吧。

这种新的怀旧不仅源自一个以数据形式呈现的世界;它还变成了不断产生数据的诱饵。

在 Netflix 上面,大家可以找到很多例子,比方说 《怪奇物语》(Stranger Things),说的是1980 年代一个虚构的小镇里,一群小孩被迫与邪恶势力作斗争的系列剧;以及《纸牌屋》(House of Cards),这是Netflix 通过研究订户的品味特征而制作出来的原创剧。 同样,迪士尼的流媒体平台 Disney+,也通过《旺达幻视》(WandaVision)表达了对情景喜剧的怀旧之情,节目里面充满了向《范戴克秀》(The Dick Van Dyke Show)、《布雷迪家庭》(The Brady Bunch)、《欢乐满屋》(Full House)、《马尔柯姆的一家》(Malcolm in the Middle)以及《摩登家庭》(Modern Family)等致敬的元素。当然了,还有无数的重启、前传或者续集。在音乐行业里面,复古诱饵趋势往往表现为“流量作品(streambait)”或“Spotify热门歌曲(Spotifycore)”,一种靠简单公式创作出来的,充满着对怀旧作品的借鉴,好方便算法推荐的音乐流派,用音乐评论家Jeremy Larson的话来说,这是“音乐当中最廉价的高潮”。

了解了平台内置的激励措施之后,通过制作自己的复古诱饵,独立的社交媒体账户也可以扩大自己的知名度。你可以关注众多的“怀旧美学”账号,比如@publicschoolpizza、@rerunthe80s 以及@vintage.cheese等,这些账号专门发布有关 20 世纪流行文化的内容,从 1980 年代的电视广告到老式的软色情都有介绍。有时候,这些账号还会发布模仿过去风格的内容。Instagram 上面有几十个“retrowave”或“synthwave”账号,这些账号会把旧的内容跟看起来很旧的新内容混搭在一起,对于像 General Mills 这样希望让复古营销跟社交媒体协同起来的品牌来说,这是一种很有价值的做法。如果我在 Instagram 上滚动浏览那些复古诱饵账号,app就会在我的Explore页面展示来自复古诱饵账号的帖子,然后这个反馈循环就会周而复始:因为怀旧进去,出来的也是怀旧。

对于希望从社交媒体的怀旧风获利的投资公司来说,受到版权保护的旧内容非常有价值。Hipgnosis 与 Primary Wave 等基金会购买歌曲的版权,然后利用社交媒体推广,再收取流媒体版税。2020 年 9 月,佛利伍麦克合唱团(Fleetwood Mac) 的《梦》(Dreams)在 TikTok 上再度走红之后,Stevie Nicks、Lindsey Buckingham 和 Mick Fleetwood 把歌曲版权卖给了一家专业基金,很快,TikTok 上面就出现了一波新的挑战。

并不是说消费者一心只想要怀旧内容。但新奇往往会受到熟悉事物的限制:制作商会把包容性写进重启(比如 2016 年的《捉鬼敢死队》),电影宇宙不断扩张(从怪兽宇宙到漫威电影宇宙),旧规被废除,换成了新规(如 2018 年的《月光光新慌慌》万圣节重启,对系列过去的所有电影追溯了连续性),并且越来越多过去小众的微趋势得以复兴。这些姿态刷新了过去的IP,让算法来放大,并为企业提供新的角度来推销怀旧。

怀旧已经成为更多内容批量制作的模板,成为版权所有者新的收入来源,为平台带来新的数据流,让用户有了表明身份的新手段。有很多昔日的流行文化可供借鉴,平台资本主义似乎永远不会消失。他们告诉我们,收集数据是为了预测我们想要什么,但这并不完全正确。在尝试预测我们的口味时,流媒体服务会按照自己的想象去制作内容。由于算法是基于过去训练出来的,所以就不只是通过中立的渠道把怀旧交给用户;而且还在培养一种怀旧的偏见,试图让用户更喜欢复古。

与此同时,科技巨头技术却大谈未来,承诺用自己的技术提供沉浸式体验和数字解决方案。但就算硅谷的自我定位是进步主义,但它的算法却停留在过去。

昨日重现

预测算法并不能真正预测任何事情,那只是让特定类型的过去反复出现而已。对历史的特定理解(确认偏见或刻板印象)往往会被优先考虑,同时淡化或完全隐藏(非主流人群的)观点。这往往是从媒体呈现中得到的历史的可盈利的版本,而且由最大的媒体集团的 IP 主演:马迪·麦克弗莱(Marty McFly)发明了摇滚乐;1960 年代只有《爱之夏》,没有那场运动;得到五角大楼批准的漫威超级英雄;没人死的汽车加速赛,哪怕是詹姆斯·迪恩也没有(James Dean,因超速驾驶英年早逝)。

这种对过去的描述是准“官方”记录,为特定目的服务,如粉饰大西洋奴隶贸易;歌颂哥伦布与罗伯特·李这样的“伟人”的丰功伟绩;或马丁·路德·金的圣诞老人化。他们抹掉了的怀旧阴影,剩下的只有这样一种怀旧:传播对白人、规范以及消费主义的渴望,这跟巴迪亚·阿哈德-莱加迪(Badia Ahad-Legardy)所谓的“对怀旧的整体理解”是背道而驰的。

预测算法并不能真正预测任何事情,那只是让特定类型的过去反复出现而已

过去的数据往往很暴力,很帝国主义——就像历史学家西奥多拉·德赖尔(Theodora Dryer) 所说那样,这是一种“殖民主义的数学”。这是历史种族主义和偏执的数字。算法推荐想把这些数据转化成怀旧情绪,转化成不断上演的将压迫合理化的故事。但它利用的还是那些带偏见的信息,让贫富差距入籍,或者给刻板印象再注册,因为已经太熟悉了还是詹姆斯·布里德尔(James Bridle)说得好,他是这么描述预测算法的,“因此,用先验知识的残余来训练这些新生的智能,就是把……野蛮行为写进我们的未来。

算法决定论大规模地将人与事件锁定进重复的循环之中,这是一个同质化过程,反映出社会本身被更大规模地同质化:独特之处被夷为平地,变成无名之地,被媒体公司吞并。随着元宇宙被大肆炒作,怀旧霸权的新时代即将到来。硅谷长期以来一直梦想着虚拟现实,而像 《玩家一号》 以及《黑镜》第三季第四集《圣朱尼佩洛》(San Junipero)那样的虚拟现实叙事,往往会承诺在假想中的数字天堂里面提供充满怀旧感的自我实现——另一种形式新旧重组。在外面,社会正在崩溃,但虚拟宇宙为绝望的人们提供了逃避的机会:在受控的环境下,大家可以用自己的化身,在我的世界(Minecraft World)里面闲逛,甚至可以跟蝙蝠侠一起攀登珠穆朗玛峰。

尽管技术还没有赶上这个梦想,但元宇宙已经被誉为可将知识产权掺和进来的数字领域。你可以是超级英雄,也可以是巨型机器人,你可以终此一生去寻找流行文化的复活节彩蛋。元宇宙有望成为我们的世界,就像所有关于虚拟现实所描绘的前景一样,但它的前提和财源是析取出来的消费者数据,这些数据会被用来训练算法,去推广迪士尼和华纳兄弟的知识产权,同时化解任何形式的社会变革努力。

如果把文化和消费者简化成数据,只会继续制造出同样的怀旧表现,供保守的算法吐出推荐。崇拜数字技术力量的那些人也许相信,我们正朝着乌托邦迈进,以为人们可以逃离我们创造的未来。但是,如果我们让算法替我们所有人预测未来,我们就会发现,除了回到过去,我们别无他处可去

译者:boxi。