本期主题:从拉丁语 “被给予的东西” 到数字时代核心,data 的两千年蜕变
我们每天都在和 data 打交道:手机里的资讯、电脑中的文件、电商推荐、短视频记录,全都属于它。这个充满现代感的词,其实是来自古罗马的 “语言老古董”,最初和 “数据” 更是半毛钱关系都没有。
data 的源头可以追溯到两千多年前的拉丁语,动词 dare 意为 “给予”,由此派生出名词 datum,本义就是 “被给予的东西、依据、材料”。古罗马学者用它指代文章里引用的事实与观点,只是一个普通的学术用词,和今天的大数据完全无关。
19 世纪统计学兴起,人口普查、市场研究催生了海量记录,人们按照拉丁语复数规则,把 datum 变成 data,用来指代 “成组的事实记录”,但依旧停留在学术圈,普通人很少接触。17 世纪科学革命时期,天文学家、物理学家开始用 datum 记录观测结果,比如行星位置、实验数据,当时只使用单数形式,专指 “单一的记录事实”。
进入互联网时代,data 全面爆发:社交、购物、浏览、评论,每一个操作都在产生数据,它不再是冰冷的数字,而是你的喜好、习惯与社交关系,成为数字时代的核心资产。20 世纪中期的计算机革命,让 data 彻底转型。第一台电子计算机 ENIAC 诞生后,这个词因精准又有学术底蕴,被用来指代计算机输入、存储、处理的信息,从此和科技牢牢绑定。
直到今天,data 的单复数依然有争议:严格按拉丁语规则,data 是复数,单数为 datum;但在日常口语和计算机领域,大家早已把它当作不可数名词,语言规则也在跟着实际使用不断改变。
从古罗马的 “被给予之物”,到科学观测的记录,再到数字时代的核心,data 走过两千年,见证了人类记录、分析与理解世界的全过程。
