热点:研究发现AI 越聪明就越有可能“胡编乱造”
越聪明的人,编造出的谎言越难以被揭穿,这个逻辑似乎也适用于AI大模型。
最近,西班牙瓦伦西亚理工大学的科学家发现:越复杂的AI大模型越有可能撒谎,越擅于假装自己知识渊博,不太愿意承认自己的无知。
研究中,科学家测试了三种大型语言模型的各种版本,包括GPT、LLaMA 和 BLOOM。
研究发现:虽然这些大模型的回答在许多情况下变得更加准确,但总体上可靠性更差,给出错误答案的比例比旧模型更高。
科学家向模型提出了数千个各种领域难易程度不同的问题,然后比较各种版本的答案。
结果表明:随着每次迭代更新,总体而言,得到答案的准确性会有所提高;但随着问题的复杂性提升,得到答案的准确性则会有所降低。更为不可思议的是:越复杂、越聪明的AI,往往会自信过头,不肯承认自己的无知,而是编造谎言,以掩盖自己的错误;而早期的版本则会承认不知道或向提问者索要更多信息。
科学家称:最大的“撒谎者”是OpenAI的GPT-4和o1,但所有被研究的大模型似乎都呈这种趋势,对于LLaMA系列模型,没有一个能够达到60%的准确率,即使是最简单的问题。
随后,科学家又将AI给出的答案展示给人类志愿者进行测试。结果发现,大多数人都很难发现最新AI给出的错误答案。
科学家认为,从理论上讲,这些难以被发现的谎言,应该是一个更大的危险信号,AI谎言或给人类带来巨大灾难。
微信公众号图文消息新增支持修改封面
近日,微信公众平台发布新规:图文消息新增支持修改封面的功能。,目前支持替换和裁剪两种操作。在修改封面后,新的封面会在账号主页及新转发卡片中生效。
《黑神话:悟空》重新登顶IGN年度游戏投票
此前,《黑神话:悟空》在IGN年度游戏投票支持率急速下降,引发热议。IGN也在官网再次回应了此次投票争议事件。目前,《黑神话:悟空》的投票76.3%的支持率重新登顶IGN年度游戏榜首。
华为列为全球电子家电品牌价值第三
据2024“全球电子家电品牌价值50强”排行榜显示:苹果、三星、华为蝉联前三位。品牌价值被理解为品牌所有者通过在公开市场上许可该品牌所获得的净经济收益。50 强榜单中,来自中国的品牌共有20个。
Meta因密码存储不当在爱尔兰被罚款1亿美元
近日,爱尔兰数据保护监管机构对Meta处以9100万欧元(约1亿美元)的罚款。此前,Meta在其内部系统中存储了一些社交媒体用户的密码,而没有采取适当的安全措施。
索尼被指游戏定价过高面临集体诉讼
据报道:英国一起针对索尼的集体诉讼已确定将于2026年3月2日开庭审理。在该起诉讼中,原告认为:PlayStation在其平台上的数字游戏和游戏内容的发行中占据主导地位,向英国消费者收取了过高的费用。
腾讯不再公开显示职级
近日,腾讯发布全员邮件,对员工职业发展管理制度进行新一轮更新。核心内容包括:不再公开显示专业职级信息,将所有职级最短停留时间统一至少1年等。腾讯表示:不再显示职级信息是为了减少对职级的过度关注,倡导平等务实的职场文化。