#153 算法这只温柔的巨兽

#153 算法这只温柔的巨兽

67分钟 ·
播放数48410
·
评论数141

人生而自由,但现在,无往而不在算法的牢笼之中。

10 年前,人们期望技术和算法能给人带来更大的自由,但现在并非如此。新的技术带来新的限制。看什么、听什么、去哪儿消费,乃至和谁交往......这些都被算法所左右。大多数人,甚至连程序员自己,都没能清晰意识到我们自身以及这个世界,是如何被算法所影响,并永远回不到过去。

而这期访谈,是我们对算法的一个探讨。我们会说在讨论算法这个议题时,争论「技术是否中立」并非是个好的切入点;我们也会谈到算法为何会超出人类意图产生偏向;以及算法对社会的影响可能会分成哪些不同的层面;我们当然会谈到在未来,算法可能会如何改变社会的系统,以及每个个体在其中的角色。

本期节目的嘉宾是方师师,她是上海社会科学院新闻研究所的副研究员,也是「过滤泡」一书的译者。希望这次的讨论能够给你带来不一样的一些视角。

欢迎收听。
P.S. 声动活泼在招聘:来,加入我们一起探索播客的边界!

【主播】
徐涛,声动活泼联合创始人

【嘉宾】
方师师,上海社会科学院新闻研究所副研究员,关注科学技术与社会(ST & S)、科学知识社会学(SSK)

【主要话题】
11:52 谷歌、Facebook 的算法为何会有不同偏向
22:38 大公司选择算法的偏好会如何影响到我们
32:26 大公司的程序员意识到这些问题了吗
54:43 有这么多问题,大公司们可能做出什么改变吗
1:04:00 数字孪生世界中,数据使用的不平等是否会产生新的阶层划分

【后期】
Luke

【监制】
Amanda

【音乐】

  • Book Bag-E's Jammy Jams

【延伸阅读】

  • PageRank:又称网页排名、谷歌左侧排名,是一种由搜索引擎根据网页之间相互的超链接计算的技术,而作为网页排名的要素之一,以 Google 公司创办人拉里·佩奇(Larry Page)之姓来命名。Google 用它来体现网页的相关性和重要性,在搜索引擎优化操作中是经常被用来评估网页优化的成效因素之一。
  • 当心网上过滤泡」:伊莱·帕里泽的 TED 演讲。伊莱·帕里泽(Eli Pariser)是美国互联网观察家,Upworthy 网站的执行总裁。
  • 过滤泡」:伊莱·帕里泽的著作。过滤泡指一种「智能隔离状态」:受技术媒介的影响,用户与不同的意见信息分离,被隔离在自己的文化或思想泡沫中。
  • 回音室效应:封闭圈子内或相似的观点重复产生。强调个体意见的强化与群体极化现象。
  • 信息茧房:个体主动的信息接触行为,强调信息获取的单一化。
  • Parler:以自由表达为宗旨,并表示注重用户隐私的社交媒体平台。
  • MeWe:同样表示注重用户隐私,宣称没有广告、没有政治偏见、不审查政治新闻的社交媒体平台,但允许色情内容和虚假帐户。目前下载量仅次于 Parler。
  • 黑客帝国」:The Matrix,好莱坞科幻电影系列。其中一个情节设定是:现实世界其实是由一个名叫「母体」的计算机人工智能系统控制,人们就像他们饲养的动物,没有自由和思想。
  • Kevin Kelly 的文章:AR Will Spark the Next Big Tech Platform—Call It Mirrorworld
  • 一般数据保护条例」:简称 GDPR,2018 年 5 月 25 日正式生效的 GDPR 取代了 1995 年颁布的《欧盟数据保护指令》。该条例规定了企业收集、使用和存储个人数据的方式;基于现行文件和报告要求制定而成,旨在加强问责制;授权相关部门对违反 GDPR 要求的企业收取罚款。
  • What's Next| 科技早知道:Trailer|从硅谷到世界,What's Next?

【关于我们】
网站:etw.fm
社交媒体:@声东击西ETW
邮件:etwstudio@gmail.com
国内/外支持我们:www.etw.fm

Special Guest: 方师师.

展开Show Notes
Auraaaa
Auraaaa
2021.3.12
32:23 【过滤泡】:通过智能媒体的推送迅速进入隔离的状态。
【信息茧房】:民主选举制度下大家对硬新闻(政治新闻)的认知偏差,存在极化、隔离和分裂的状态。
【回音室】:已成隔离状态下,在群体内部进行发酵,对弥散的边缘观点形成支持。
JennyoO:小本本记下了 学新传的却一直弄混信息茧房和过滤泡 而且记得当时老师上课时说的信息茧房用的是差不多过滤泡的这个解释
蒙太奇
蒙太奇
2021.3.12
就我了解的程序员Geek们,很多还是有对信息茧房的认识和警惕的。比如很多人还会保持RSS或者邮件列表订阅新闻的习惯,而不是靠算法推荐。前段时间还看到一位机器学习博主在讨论监控资本主义。我自己订阅新闻时,也会有意识的把左中右各个倾向的新闻源都订阅一下。这个时代,信息检索、筛选、整理、分析的能力越来越重要了。
OrangeCLK:这是一个典型的误读,rss和邮件列表才会造成信息茧房,算法推荐破除了信息茧房。刚好搞反。
HD199953c:你说的最多也只是这些程序员的个人习惯,即使知道问题,有多少人会拒绝互联网巨头们的工作呢?类似的隐喻就像网上一个亦真亦假的段子——“张一鸣本人不用今日头条”。
20条回复
曾嘉俊
曾嘉俊
2021.3.16
建议少用 general 「算法」这个词,算法只是一个 fancy term for solution,加减乘除也是一个算法,菜谱也是一个算法,如果我们讲推荐算法,就特指推荐算法,不要给一个模糊的概念。
ladadee:文科生看评论学到了~感谢指教
Pioneer1:确实,算法涵盖层面太广,不同的人都有不同的理解。或许可以在开头表明本文算法如无特别说明均指推荐算法。不过这个要求对于文科生来说有点高了。。。
5条回复
希杰同學
希杰同學
2021.3.12
33:50 第一次听到“信息茧房的使用语境主要是政治新闻、硬新闻,在美国的党派之间加剧极化,在中国缺乏讨论语境”的说法诶。
sheldor:本来就只允许一种声音,何谈信息茧房。
Qiran
Qiran
2021.3.14
嘉宾多次无视主持人的观点和提出的问题。一个截然不同的观点就值得“嗯”一声就直接带过吗?主持人多次提到商业模式的区别也直接无视了。这不是一次足够有效的对话。 另外作为从业者的角度看,她也没有做到在理解算法原理的基础上研究。为什么即使原理中立的算法依旧会产生偏向性?这是在深入了解算法每个步骤发生了什么以后才能回答的问题。Google和Facebook的rank算法应用场景都不一样,比较他们没什么意义。也许只在新闻学领域会产生一点新意。
AmandaTse
AmandaTse
2021.3.11
开放的头脑永远是对抗过滤泡的最后防线。以及,数字权利意识应该植入内心。不要用隐私换取便利。
杨青亮
杨青亮
2021.3.16
15:13Google和Facebook在算法上的区别,Google page rank做的首先是将客观世界数字化,判断网页质量用的是13要素,更像新闻学的新闻判断要素,力求的是客观和新及重大,用的是广撒网、细分类。
Facebook age rank做的首先是将关系数字化,挖掘人的相关要素,更关注与你的相关性和你注意什么,关注3F价值观(family、friends、first),后来继续加入了更多的变量,但路径还是一致的。
我不跑调
我不跑调
2021.3.11
题目好棒
knight168
knight168
2021.3.12
Shownote里面谈到欧盟的GDPR,该法案确立了被遗忘权这个概念。请教嘉宾,从新闻学角度,该法权的建立对打破过滤泡和信息茧房是否能有很大影响?
AmandaTse:来自方老师的回复:首先,这个问题需要明确一下“被遗忘权”的定义。GDPR规定的被遗忘权是一种狭义的删除权,GDPR强调删除权是根本,被遗忘权是补充。被遗忘权的重要特征是个人信息在被收集和利用时具有正当性,即信息主体是明示或默许同意的,属于合法行为。之后要求删除个人信息是基于信息的不再相关、过时性或者没有必要,防止信息可能导致的负面评价,目的是维护个体的人格尊严、自由和公平。所以这和互联网公司收集个人信息进行个性化推送服务——这是导致过滤泡或者信息茧房的机制——之间没有太大的关系;其次,从技术实现上来说,目前针对个体的个性化推送,在很大程度上已经不仅仅依赖某个具体的用户画像,还与信息环境、历史数据、社交关系等等相关,所以即便是调用被遗忘权的相关救济对于最后的结果可能影响也不是很大;第三,中外对待被遗忘权的态度非常不同,详情可见2014“冈萨雷斯vs谷歌”案和2015“任甲玉诉百度”案。所以可能被遗忘权在具体实现的路径上也不能一概而论。
knight168:非常感谢如此详细回复。的确被遗忘权在国内根本没有相关立法文件,欧盟也是近些年才有相关规定。本以为个体能被给予给多的数据删除权一定程度能影响算法的精准度,让用户画像变得模糊。看来单纯个体权限增加无力改变此趋势。一个原始算法加上巨量数据快速迭代产生的新的算法已经超越个人数据本身,就算抽离原始数据,该算法还是存在极强的实用性,让人陷入过滤泡中无法自拔。之前听相关建议,感觉可以实验一下。一.使用rss相关主动性订阅信息,不自带推荐功能。二.扩充线下获取信息渠道,阅读实体书这块是网络所无法涵盖的,在图书馆阅读也不存在网络痕迹。三.合理安排线上线下获取信息的时间比例,不让自己完全沉浸虚拟世界。在此抛砖引玉,希望能听到其他小伙伴更多建议。
3条回复
轶楠YZ
轶楠YZ
2021.3.16
1:02:24 如果我们的将来真的是建立在数据就是一切的基础上,那“数据层级”可能就相当于历史上我们用了几千年想丢掉的“阶级”。 历史轮回,细思极恐,但是不是完全不可能啊
晨萱I语迟者说:其实反过来想,几千年来的阶级就是建立在数据层级的基础上的😜
杨青亮
杨青亮
2021.3.16
36:18回音室是反向的“沉默的螺旋”,在一个环境中反馈的差异导致我们对群体内意见的判断的差异,进而反过来影响我们本身的动作,让我们一起沉默或者更加坚信自己的观点,形成同盟,进而为之付出行动。都是一种态度的传染,可能现实中两者会一起存在,对一个观点发生“回音壁”效应,而对另一些则面临“沉默的螺旋”,更多的发生在非极端的两者之间,观点发生拉锯或者消解
石航嗖嗖嗖
石航嗖嗖嗖
2021.3.23
每一个app都应该放置一个选择按钮,1“让算法推荐你喜欢的内容”,2“我们小编帮你推荐内容”,3“无序推荐更多元的内容”。至少让大家意识到自己做了什么选择
Yaoyao2020:好主意
怨男0老公:
七个梦
七个梦
2021.3.16
03:51技术是人的延伸,技术是人的截肢
Pioneer1
Pioneer1
2021.3.12
46:26是的,模型大家都一样或者差不多,但是数据可就不一样了,那可真是宝藏,你看现在很多数据都还是收费的,而且数据获取和整理也非常困难耗时,一般不会轻易放出数据。
明磁
明磁
2021.3.16
谢谢分享。不过稍稍有点奇怪,就我身边的例子,小县城高中生大部分都知道信息茧房,大厂精英们怎么会不知道?
OrangeCLK:天哪这个骗局已经传这么深远了吗
王周彪
王周彪
2021.3.11
看到标题就有想听的冲动
五木
五木
2021.3.15
这一期神奇地串联了我在来英国读研之后大半年关于科技伦理的了解和讨论。很难得能在中文媒体看/听到国内的科研人员对这一问题的公开讨论,针对国内公司的研究和访谈也非常有价值。但是一个小时的时长有限,很多问题的确是只能浅尝辄止……希望之后声东击西能再邀请方老师或是其他在国内从事相关领域研究的人上节目!
徐涛丨声动活泼
:
应该以后会持续有探讨的。这次其实采访了两个小时,采访完还又聊一个小时。。。如果觉得国内哪些相关领域是学者从业者特别适合,也请推荐给我哈
bh1530
bh1530
2021.3.17
37:32 技术部和内容部这段太真实了😂
Lucyy
Lucyy
2021.3.11
49:46数据控制概念——不是全部交给互联网公司
康桑阿米达
康桑阿米达
2021.4.18
嘉宾在节目中(31分左右)说到:程序员们很多都不知道信息茧房,过滤泡等专业的术语,但是她明明经常会跟人讨论,从而推导出程序员们很有局限性... 这一瞬间我一个非程序员都有突然被冒犯到。所以嘉宾就觉得她谈论的就是每个人都会谈论的吗🙂这一句话说完,她才是听起来是局限性的那一个
兔子养殖专业户:这位嘉宾给人的感觉确实这样。
00:00
00:00