159.算法的六副面孔:它是如何从处理数据,变成定义我们是谁的起朱楼宴宾客

159.算法的六副面孔:它是如何从处理数据,变成定义我们是谁的

69分钟 ·
播放数12011
·
评论数92

2026年的年度系列“算法纪”聚焦算法与媒体,第一集让我们从人文视角把算法大卸八块。

大家好,我是大卫翁,"起朱楼宴宾客"是我用来记录这个大时代的播客节目。

今年启动的新系列和投资没什么关系,至少表面上没有,是我在哥伦比亚大学新闻学院研究课题的延伸。这个系列想聚焦于算法驱动的社交媒体时代,对我们的信息获取、对世界的感知与认知,乃至整个社会结构,究竟产生了哪些我们还未完全意识到的深层影响。

这一集是系列的第一期,也是一期单口,在后续的对谈陆续展开之前我想先搭好舞台:如果从人文的视角出发,应该如何定义算法?

这期节目的骨架来自两个主视角。学术层面,是Tarleton Gillespie(塔尔顿·吉列斯皮)发表于2014年MIT论文集中的《算法的相关性》,被称为算法研究领域的"创世文献",以六个维度完整覆盖了算法从数据输入到身份构建的全过程。

感性层面,是记者Kyle Chayka(凯尔·恰卡)2024年出版的《Filterworld: How Algorithms Flattened Culture》(筛选世界:算法如何压平文化),提供了很多普通人在算法时代的切身感受。

本期节目引用的其他节目、报告、论文和书目,请见文末参考资料。

简明时间轴:

00:46 为什么要做这个系列?

02:33 第一期单口的目的,以及两个主要信源的介绍

07:55 算法的定义:它不只是工具,它是一种新的"权力意志"

15:59 第一个维度:包含模式(Patterns of Inclusion)

26:52 第二维度:预判循环(Anticipation)

35:46 第三维度:相关性评估(Evaluation of Relevance)

42:11 第四维度:客观性的承诺(Objectivity)

47:36 第五维度:与实践的纠缠(Entanglement)

59:15 第六维度:计算出的公众(Publics)

参考资料:

蜉蝣天地:《风霁:优化体验,还是塑造现实?平台推荐算法探秘》

创业启示录:《揭秘抖音、小红书算法内幕|算法到底怎么看内容》

硅谷101:《E160|重新理解信息茧房:为何科学研究与我们主观感受相反?》

Anderson, C. W. 2011. Deliberative, agonistic, and algorithmic audiences: Journalism's vision of its public in an age of audience. Journal of Communication 5:529–547.

Beer, David. 2009. Power through the algorithm? Participatory web cultures and the technological unconscious. New Media & Society 11 (6):985–1002.

boyd, danah. 2010. Social network sites as networked publics: Affordances, dynamics, and implications. In Networked Self: Identity, Community, and Culture on Social Network Sites, ed. Zizi Papacharissi, 39–58. New York: Routledge.

Brunton, Finn, and Helen Nissenbaum. 2011. Vernacular resistance to data collection and analysis: A political theory of obfuscation. First Monday 16 (5).

Bucher, Taina. 2012. Want to be on the top? Algorithmic power and the threat of invisibility on Facebook. New Media & Society 14 (7):1164–1180.

Cheney-Lippold, John. 2011. A new algorithmic identity: Soft biopolitics and the modulation of control. Theory, Culture & Society 28 (6):164–181.

Gillespie, Tarleton. 2012. "Can an algorithm be wrong?" Limn 2.

Gillespie, Tarleton, and Hector Postigo. 2012. "Five more points." Culture Digitally, May 4.

Gitelman, Lisa, and Virginia Jackson. 2013. Introduction. In "Raw Data" Is an Oxymoron, ed. Lisa Gitelman, 1–14. Cambridge, MA: MIT Press.

Goffey, Andrew. 2008. Algorithm. In Software Studies: A Lexicon, ed. Matthew Fuller, 15–20. Cambridge, MA: MIT Press.

Grimmelmann, James. 2010. Some skepticism about search neutrality. In The Next Digital Decade: Essays on the Future of the Internet, ed. Berin Szoka and Adam Marcus, 435–459. Washington, DC: TechFreedom.

Introna, Lucas, and Helen Nissenbaum. 2000. Shaping the Web: Why the politics of search engines matters. Information Society 16 (3):169–185.

Ito, Mizuko. 2008. Introduction. In Networked Publics, ed. Kazys Varnelis, 1–14. Cambridge, MA: MIT Press.

Light, Jennifer. 1999. When computers were women. Technology and Culture 40 (3):455–483.

Longford, Graham. 2005. Pedagogies of digital citizenship and the politics of code. Techné: Research in Philosophy and Technology 9 (1):68–96.

Marshall McLuhan, 《理解媒介》

Morozov, Evgeny. 2011. "Don't be evil." The New Republic, July 13.

Pariser, Eli. 2011. The Filter Bubble: What the Internet Is Hiding from You. New York: Penguin Press.

Pasquale, Frank. 2009. "Assessing algorithmic authority." Madisonian.net, November 18.

Rieder, Bernhard. 2012. "ORDER BY column_name: The relational database as pervasive cultural form." Presented at The Lived Logics of Database Machinery conference, London.

Smythe, Dallas. 2001. On the audience commodity and its work. In Media and Cultural Studies: KeyWorks, ed. Meenakshi Durham and Douglas Kellner, 253–279. Malden, MA: Blackwell Publishing.

Stalder, Felix, and Christine Mayer. 2009. The second index: Search engines, personalization and surveillance. In Deep Search: The Politics of Search beyond Google, ed. Konrad Becker and Felix Stalder, 98–115. London: Transaction Publishers.

Striphas, Theodore G. 2010. "How to have culture in an algorithmic age." Differences and Repetitions, July 13.

Tushnet, Rebecca. 2008. Power without responsibility: Intermediaries and the First Amendment. George Washington Law Review 76 (4):986–1016.

van Couvering, Elizabeth. 2007. Is relevance relevant? Market, science, and war: Discourses of search engine quality. Journal of Computer-Mediated Communication 12 (3).

van Couvering, Elizabeth. 2010. "Search engine bias: The structuration of traffic on the World Wide Web." PhD diss., London School of Economics and Political Science.

Walter Benjamin, 《机械复制时代的艺术作品》(1939修订版)

Zimmer, Michael. May 9, 2007. "Google: 'Did you mean: "He invented"?'"

Zimmer, Michael. 2008. The externalities of search 2.0: The emerging privacy threats when the drive for the perfect search engine meets Web 2.0. First Monday 13 (3).

欢迎支持我的新书:《资产配置行动指南》

欢迎订阅我的Substack频道,它是一个以英文为主的频道:hubris2025.substack.com

欢迎关注我和雨白、小跑新制作的时事聊天节目《不熄灯Lights On》

欢迎关注我的生活方式类节目《犬生活》,《去堪萨斯城,看一个美国人梦中的中国“伊甸园”》新上线!

欢迎加入我的知识星球,我正在好好运营那一片后花园。

欢迎在评论区互动,或者给我写邮件,邮箱地址qizhulouyanbinke@gmail.com。

节目BGM:

The Long Way Round - Jodymoon

一些Gemini生成的声音片段

节目后期:大卫翁

展开Show Notes
杰里德
杰里德
1 天前
我自己最近几年对推荐算法的态度越来越从负面转向正面。主要原因是作为信息获取者,要主动建立起真正可靠的信息获取渠道是一件挺难的事:找到一定数量不同立场的信息源,花时间去熟悉这些信息源并进一步甄别,定期去刷/获取通知,并且持续改进自己的渠道。而信息量的爆炸式增长又让这种主动型的渠道建立方式更加困难。

诚然就像大老师在第四个维度最后说的,把选择权交给算法比较“偷懒”,这种“解脱”也有代价,但推荐算法确实,高效地连接了大量的信息获取者和他们所需要的信息。

内容创作者的视角则完全不同,大老师提到的那个小红书工程师在节目中说过一个观点,大意是“发发可以,但要是为了流量去做,就必然被平台拿捏”。期待后续节目中创作者角度的探讨。
大卫翁
:
你说的没错,但就像摄影术让大家足不出户就看到了世界各地一样,一方面它大大拓展了我们的视野,但另一方面永远别忘了看照片不代表你真的看到了世界那个角落的全部要素,去现场是无法也不应该被取代的,就像算法不应该取代我们主动搜索以及更多方式去获取信息。
24:36 算法不是在处理现实,而是在处理可以被数字化的现实
Gastronomy
Gastronomy
1 天前
感觉又是可以出书的题材
大卫翁
:
🤯
Ass嘟嘟
Ass嘟嘟
16小时前
「✅主要信源」
1)学术层面 - 《算法的相关性》
兼具了自然科学和人文科学的双重视角。这篇论文本身就是一篇文献综述。被称为算法研究领域的"创世文献"。
2)感性层面 - 《筛选世界:算法如何压平文化》
普通人对于算法时代的感受的嘴替。

「✅算法的定义:它不只是工具,它是一种新的"权力意志"」
算法的基础是特定的计算方法。广义上,所有将输入数据转化为期望输出的编码化流程都是算法。
随着互联网变成我们最重要的信息入口和表达出口,我们所有的知识、情感、观点被强行塞进“数字化”的模具。依然是数学程序,但和公共相关,因为既处理知识,又在为知识提供认证。
媒介推给我们的具体内容固然重要,但更重要的信息是算法正在以前所未有的规模和速度彻底重塑人类连接的模式。
摄影术之于艺术的影响,和算法基于信息传递的影响,可以相提并论。技术改变了我们所创造的文化形态,与此同时也改变了我们对文化的感知方式,改变了我们如何理解周围的世界。
算法,不仅仅是一个技术,而是现在数字化生存过程中进化的一种新的个人信息感知方式、群体的连接方式,甚至是社会的治理方式。

「1️⃣第一个维度:包含模式(Patterns of Inclusion)」
1)分类
图书馆有无数的书架和抽屉。先找到索引卡片,才能找到对应的书。进入到算法时代,所有信息被打碎成一个个细小的微粒。
谁来定义这些颗粒,谁给这些信息打标签,谁就拥有了最终的解释权。没有了清晰的目录结构,而是变成了看不见的标签。
一个事情热度很高,但就是不上热搜。有可能是某个帖子/话题,被贴上了一个不被算法认可的标签,于是它们就从大众的视野里消失了。因为算法比起人工更加在意规则。掌握分类权在这个时代比任何时代都更加重要。
更常见的是降低权重,是一种隐形管理。
现在,编辑的职责给到了算法索引。看似是自动化,但数据库收录时,我们能看到的边界已经被焊死了。
2)衍生问题
第一,算法是在进行一种审美的剪裁,我们看到的是被算法过滤后剩下的那一点“安全且平庸的现实”。而且标签化已经影响到了我们对世界的认知、我们看待这个世界的方式。
第二,如果一个群体在互联网不发声或者声量很小,在算法世界里是不存在的。算法不是处理现实,是处理可以被数字化的现实。前互联网时代,至少有编辑关注到这些人群,替他们发声。

「2️⃣第二维度:预判循环(Anticipation)」
算法设计师如何预判用户的需求和用户价值的评级,再根据它调整模型。
明确知道你喜好的算法,并不是真的知道你的喜好的每一个细节。只是通过当前的信息、历史的记录、同类用户的数据,构建第二索引,算法服务的对象是这个被算法化的用户。
算法世界:屏幕前的肉身、数字双胞胎(第二索引)。
打开App那一刻,算法已经通过你现在的定位和时间、过去所有的浏览痕迹、成千上个行为相似的人的特征,立刻铺天盖地的给你推内容。
算法不需要对你有100%精准的预判才能满足你,只需要一个足够精确的近似值就够了。
主动驯化:当你为了获得更加精准的推荐而不断的点击这些选项时,是在主动把自己修剪成算法能够识别的形状。驯化算法,让平台一直给我推我想看的内容。
设计算法的人默认我们的某种行为模式就是固定的,是常态。
心理学概念“选择的消失”,当96%的好评被标注在搜索结果的第一页,算法已经在替你做决定了,暗示你这就是标准答案。最终预判达成了自我验证的循环。
当我们的生活没有了31%可能失败的风险,就失去了100%撞见惊喜的可能。

「3️⃣第三维度:相关性评估(Evaluation of Relevance)」
1)算法黑箱
算法的不透明就是它能够运行的前提。
这把名为相关性的尺子必须要藏起来,至少把上面的刻度藏起来。
算法的黑箱是功能的一部分。他决定了什么是热门,什么是对的,但是从不解释为什么。
2)数字民主
在算法的世界里,链接并不等同于每一个价值都一样的选票。
搜索引擎会偏好高人气的内容、以英语作为主要语言的网站、商业性信息的提供者。是现实社会的投影。
3)算法是流动的
也许界面和昨天一模一样,但背后的评估逻辑可能已经天翻地覆了。大平台每天都在进行成千上万次的AB测试。
所谓的黑箱,不仅仅是看不透的黑箱,甚至连固定的形状都没有,随时随地都在根据我们的反应进化。
当你以为你在使用工具时,你是处在一个巨大的实时调整的实验室里。任何关于算法偏见的静态观察可能都是过时的。因为在我们得出结论的那一刻,算法已经变了。
Ass嘟嘟:「4️⃣第四维度:客观性的承诺(Objectivity)」 算法的提供者会通过描述和展示,甚至向外界公布一些算法的原则,展演他们的正当性。数学是中立的,算法是工具的,技术是客观的。 表演式的后台:看似清晰的后台流程说明并不能真的揭示真实的后台运作过程。 愿意相信算法是中立的,因为最省事儿,相信推荐是懂我的,不用自责。内心深处渴望从永恒的怀疑中解脱出来。 算法提供了一个完美的借口。通过交出选择权,换取了心灵上的安宁。 「5️⃣第五维度:与实践的纠缠(Entanglement)」 当我们选择相信算法,就自动屏蔽了对它脆弱性、偏见的警觉。为了省事儿,进入了一种集体性的认知盲区,甚至会变得更加的懒惰。 这些都在不自觉的影响我们的表达。 这些都可以被看作是我们在调整自身的行为,以适应我们所依赖的算法。 算法可识别:用户通过话语标签、特定关键词等方式,使自身变得更容易被算法识别。这是一种主动的适应,是一种数字穿衣指南。 在算法时代,谁理解算法的逻辑,谁就有了内幕信息,就掌握了真正的权利。 真正的玩家是那些职业的SEO(搜索引擎优化的专家)、那些拥有API访问权限的第三方开发者、那些财大气粗的广告商。 以为我们是算法的主人,但只要算法的维护权和更新权还在大公司的手里,这种驯化就是一种幻觉。算法客观性的维度里,平台可以随时随地悄无声息的更改规则。 当我们和算法纠缠在一起的时候,它不光是在给我们提供信息,还在为我们提供一个看世界的方式,甚至还可以改变现实世界的运行。 音乐:过去20年间热门歌曲的平均时长是在持续缩短。因为流媒体服务的激励机制,延长歌曲时长对于创作者来说毫无经济效益。不光是一个物质激励的机制的问题,还有流量分配的问题。转调,在当代音乐中的消失。歌曲变得更加的循环化、氛围化。 很多时候我们并不是算法的被动受害者,我们是它的共谋者。我们和算法一起打造了现在的流行文化、政治文化,甚至是更深远的社会文化。 「6️⃣第六维度:计算出的公众(Publics)」 算法正在根据数据把人类分群,并且赋予我们一个可能自己都没有察觉过的身份。 最大公约数的消失。 1)网络化公众 因为共同兴趣聚在一起讨论,技术只是提供了一个场地。主角依然是人和人的连接,是我们自己选择聚在一起的。 2)计算出的公众 一个被代码发明出来的群体。并不认识彼此,甚至不知道自己在这里,是算法通过计算强行把我们圈在一起,说“你们是一类人”。久而久之你就会真的产生一种错觉。 算法不仅仅在测量、观察社会,还在通过计算把社会切成一块块更便于它定义的方式。 3)文化算法 算法是一面放大镜,把文化里那些已经存在的根深蒂固的丑陋偏见包装成了一种客观规律,再扔回给我们。 算法本身可能没有价值观,但当它吞下了所有人的偏见数据后,输出的每一条结果都在强化这些偏见,而且让它们变得更加难以动摇。 极化有可能是人类文明本身就存在的要素。但是毫无疑问,算法正在客观上加速它的进程。 4)信息茧房 大部分人不会只用一种算法、一个平台,当我们混合使用时,往往能获得更多侧面的信息,即算法的多样性红利。 使用更多的平台,在不同的平台关注不同的信息。 多元数据校验:每个平台的算法都有它的偏好,当我们同时使用时,相当于拥有了很多把不同刻度的尺子。通过这些维度的反馈,还原一个更加接近真实、更加立体的信息图景。
大卫翁
:
久违的课代表!
3条回复
肌无力
肌无力
1 天前
被数据流裹挟的人们,能跳出来看看整个过程,或许真的能帮我们在数据洪流中博出生机
肌无力:有跳出来的能力,这个是keypoint。大老师点醒了
杰里德
杰里德
1 天前
30:49 听到这里必须留言了哈哈,一个名字不方便写下来但质量很高的节目,那期我也完整看了,印象极深。
杰里德:PS: 那期节目也是油管的算法推给我的
serenity529:什么节目呀
6条回复
低级技能
低级技能
17小时前
34:31 就拿旅游来说,一个挺好的办法,是根据自己定位的位置,在步行范围内寻找感兴趣的景点,往往会有很多惊喜。
大卫翁
:
很好的办法
杨一妥
杨一妥
19小时前
上学的时候看动漫《psycho-pass》还觉得是科幻,现在ai兴起,感觉已经慢慢走进现实了,所谓的一群「顶级大脑」研发出来的算法,分析控制所有社会人,说不好是效率还是牢笼~
大卫翁
:
一体两面了
许言武:《攻壳机动队》TV版第二部的主线“个别的11人”也展现了媒体对大众心理和记忆的影响。
稻荷树
稻荷树
15小时前
这期很好
33:37 想起来自己出去旅游也是打卡小红书或者旅游网站上推荐的各个景点,看到的景观永远是“旅游区”。也许未来可以有所改变,旅游区当然好看,但是在一些更不知名的本地的角落才有可能发现互联网上没看见的美好吧。
serenity529
serenity529
17小时前
46:28 大老师 底色也是比较悲观吧……
在小花
在小花
21小时前
依旧沿着大老师的主线~投资是对世界观的投票,算法看世界如何在改变以及如何被改变。码住,有意思
最喜欢系列了
最近这个感受更加强烈:让机器像人一样工作,让人像机器一样工作
sl_51
sl_51
19小时前
44:56 捉虫:奉为圭臬(gui nie)
大卫翁
:
啊我一直读错了😧
点个外卖7
点个外卖7
21小时前
44:33 应该是奉为圭(gui)臬,不是妖孽吧哈哈
大卫翁
:
别字大王最新作,估计评论区会出现很多指正的😢
36:07 人们更倾向于获得认同感和虚荣感,甚于自由探索的体验
九号汽油
九号汽油
14小时前
35:20 我也是西安人,深有体会。个人对抗这种“被选择”(选择性消失)的方式就是纯粹的访古,这可能和审美取向有关。特别喜欢石碑或者寺庙遗迹(就是地处偏僻网上资料都不多的地方)。过年回家就去了好几个明代藩王的墓地(在工地里)以及唐朝比较不知名的帝王的陵墓。不过可惜的是指导我去做这些事的app使用体验还不太好(正好验证了它本身对大多数人没有意义,尚未被发掘出经济价值)
35:23 大老师居然是西安人,作为老乡居然有种与有荣焉的感觉😄
summer小宋
summer小宋
16小时前
最近开始思考的议题,支持大老师