10. 语言的社会性 —— 如何通过分析语言数据理解社会关系?双重意识DoubleConsciousness

10. 语言的社会性 —— 如何通过分析语言数据理解社会关系?

60分钟 ·
播放数5262
·
评论数45

本期节目的嘉宾是我们的朋友裴嘉欣。嘉欣是美国密歇根大学信息学院的博士学生,研究领域包括计算社会科学和计算语言学。

 

1997年,美国心理学家阿瑟·亚伦(Arthur Aron)等人发现,两个陌生人之间的关系可以通过彼此询问一些相对比较亲密的问题而快速升温。这些问题和其他的普通聊天中的问题有什么差异?我们如何理解这种差异?而更近一步地,语言究竟承载着怎样的社会和人际功能,人们如何通过语言建立身份认同,又为何会产生误解与冲突?在这一期节目中,我们从嘉欣最近的一项关于语言亲密度(intimacy in language) 的研究开始,试图从计算社会科学和计算语言学的视角探讨关于人际互动,社会约束以及身份认同的一些话题。

 

如果大家希望了解更多关于计算社会科学的科研生活及体会,欢迎大家关注嘉欣的微信公众号「晴天的书」:book-in-sunny-days

 

本期嘉宾

裴嘉欣

 

内容提要+精彩预告

00:40 嘉欣自我介绍

01:20 什么是计算社会科学?

“在计算机技术在发展的过程中,会和社会进行深度融合,也会遇到一些没有办法预料的社会问题;计算机科学需要和社会科学领域进行交叉和融合,对于现有技术没有办法解决的问题,看看是否能从社会理论角度出发革新现在的技术,找到解决方案”

08:20 量化语言中的亲密度:让陌生人相爱的36个问题

12:50 语言亲密度与社会规范

“男性与男性之间的对话亲密度远远低于有女性参与的对话亲密度”

20:20 如何量化语言中的亲密度

24:40 计算语言学、语言学研究的侧重点不同

26:50 社交媒体数据的例子:线上社会规范

30:20 计算语言学能否提供现象的解释?如何影响社会现实?

35:30 计算语言学与其他研究的结合:算法公平、隐私讨论

40:50 跨语言研究

“跨语言的计算研究可能有一些局限性,因为它需要找到一个稳定的对所有语言适用的指标”

45:25 语言与身份认同、社会地位

“说多种语言的群体在面对不同情况的时候会选择使用不同的语言,对语言的选择能够反映社会生活中的权力关系”

50:10 语码转换 code switching、对所使用语言的微妙解读

“人和人之间的交流需要已有的身份认同”

“语言在社交媒体出现之前都是限制在小圈子中的,所用的语言和表达方式都是在接受这种表达方式的社群中被使用和存在的,不同的社群有不同的表达习惯。当物理空间的限制被打破时,人和人之间的交流中被看作是自然的表达可能在另一种群体看来是不友好不友善的、会造成冲突和误解”

54:20 科学传播:将英文学术成果呈现给中文公众的“翻译”体会

“如何把晦涩、小圈子中的知识生产变成公众可以理解的事情,和公众关心的议题结合起来非常重要”

58:40 总结

 

参考资料

Daniel Jones. (2015年1月23日). 《让陌生人迅速相爱的36个问题》纽约时报中文网, 检索自cn.nytimes.com

Jiiaxiin. (2020年11月6日).《让陌生人相爱的36个问题,为什么在现实中却不适用?》来自微信公众号「晴天的书」,mp.weixin.qq.com

Stewart, I., Pinter, Y., & Eisenstein, J. (2018). Sí o no, què penses? Catalonian Independence and Linguistic Identity on Social Media. arXiv preprint, arxiv.org

 

片头片尾音乐

《Sunrise at Seaside》by 王乾

 

封面图片

来自 @橘且FeliCJ 的 插画 

 

-----------

双重意识是一档「让我们认识到那些我们以为此时此刻与我们生活需求没有关联的东西其实和我们紧密相关」的播客节目。你可以在各大博客平台和社交平台搜索"双重意识DoubleConsciousness"找到我们,关注我们并收听我们的节目,给我们留言、提供反馈意见。


展开Show Notes
53:55 社交媒体的发言越来越割裂,个人理解为是网络过度连接了两个或多个文化群体。在未能充分了解对方文化的前提下,把对方文化的符号视为孕育其的文化本身,加上广场社交赋予的向全体发声的力量,叠加造成偏激和矛盾的增加。
PedroP:是的,对另一个群体的排斥可能本身就是群体内部身份认同的一环
我是RT
:
如果有兴趣继续和嘉宾讨论,欢迎微信公众号后台回复“听友群”,扫码加入听友群吖~
HD989986w
HD989986w
2021.1.09
双重意识的节目质量都很高啊,涉及很多小众的领域
橋_
橋_
2021.1.14
35:35本统计+心理学生听到中科院自杀干预的研究眼睛都亮了
学语言学的我,听完这期节目,感觉对假期的论文有了更多想法hhhh
我是RT
:
哇!那太好啦!有什么好玩的结果或者想分享的心得记得告诉我们鸭~
我是RT
:
如果有兴趣继续和嘉宾讨论,欢迎微信公众号后台回复“听友群”,扫码加入听友群吖~
3条回复
cariocas
cariocas
2021.1.12
因为是专门研究社会关系所以好奇:只是基于文本的定量研究怎么考虑 语气 对同一个词因为人物关系不同所意味的不同呢? 比如“你大笨蛋哦” 在陌生人和情侣之间的反差。
PedroP:冒犯性其实是另一个维度,对于正常的社交来说,一些看似冒犯的话是表达或者体现亲密度的一种方式,伴侣之间的亲密感一定程度上就建立在对于常规性的社会规范的打破上,极端的例子是sm。你说的语气这个也挺有意思的,但目前还没有考虑这点。
PedroP:语气这个可以通过类似“哦”这样的词来建模hhh,或者类似“好滴”之于“好的”这样
4条回复
肚肚肚肚
肚肚肚肚
2021.1.11
突然觉得 中性的流行 也许是社会进化中 大家不想被任何一种性别刻板印象绑架和攻击的自我保护
爆爷
爆爷
2021.1.10
我觉得这样聊也挺好的 不一定要很强的煽动性 不同主题and不同特色 挺好
cccccccccz
cccccccccz
2021.4.22
来迟了!社会语言学有在探讨language biography,language identity,language choices。我的研究生毕业论文就是在分析multilingual migrants相关表现🙋🏻‍♀️
Ray2023
Ray2023
2021.1.09
提一个小小的建议,主播和嘉宾大多聊天的语气是比较平铺直叙的,感觉缺少一点情绪,听起来会有点难以集中精力。这个可能是做研究的人的特性吧,会比较理性克制,我个人希望在了解知识的同时感受到主播和嘉宾更多的能量和情绪,会更加生动。
我是Lucia
:
嗯嗯这是我们努力改进的方向!之后的节目会有一些改善,敬请期待哦
Ray2023:加油吖!
陈回
陈回
2021.1.10
嘉宾的公众号叫啥来着~
我是青青
:
晴天的书
陈回:好嘞,谢谢!
00_FVM4
00_FVM4
2021.1.13
非常inspirational的研究,想问下建模时怎么量化有序变量呢?有提到亲密度这个指标建立在不断重复的两两比较上(中文说好拗口),那在量化时默认这些问题(的亲密度打分)是等距的吗?
PedroP:不是的,最后的分数是由基于两两比较的排序算法决定的
茜_B5Gj
茜_B5Gj
2021.2.13
35:29自杀识别那个我在一席上看过
ET_Jolly
ET_Jolly
2021.2.03
很喜欢,全部。话题角度和谈话气口都非常吸引我
橋_
橋_
2021.1.14
29:20想问这种线上依然保持了性别规范里女性之间亲密度高于男性的现象 是在双方知晓对方性别的情况下还是匿名的情况下?以及这两种情况会不会有区别
PedroP:介于二者之间hhhh,比如在Twitter上很大程度上是知道性别的,reddit会更匿名一点,匿名的话一般来说受到的约束会少很多,但性别不单单是一种约束,还是一种个人身份,所以这种现象还是会存在
橋_:makes sense,谢谢解释嘿嘿
49:35 到这里听不下去了,不知道主播真正想问什么…最好写个问题的提纲吧!
我是Lucia
:
哈哈其实每一期节目都是有提纲的!这个部分可能算是我们试图更自然地呈现聊天过程的一个尝试,所以没有剪掉,我觉得效果还不错啦
Tracy在想什么呢:这样!嗯 也能理解啦~可能也有原因是这期本身就比较深刻难懂,几个因素加起来就有点让人想放弃…不过还是很喜欢你们节目的!
22:29 pair-wise ranking?
allegraaa
allegraaa
2023.2.26
49:32 measure at scale 进行规模化衡量?
搜嘉宾的公众号,发现我已经关注了,难道我之前已经听过这一期播客?还是在没听这期之前已经关注了?(迷糊中
Hey_Link
Hey_Link
2021.12.08
听完了居然会写报告了,感谢感谢
cccccccccz
cccccccccz
2021.4.23
嘉宾在最后提到有时候和东北朋友相处久了,讲话也会有点东北味,这个其实就是the idexicality of language repertoires within language biography,在这个属性下,language repertoires are dynamic and diverse.