- Daily-AI | 9.2 | 开源大模型新王!阿里Qwen2.5来了,性能跨量级超Llama3.1
0:00 “终结者”雏形将登场,英伟达预测未来 2-3 年机器人领域迎来“GPT-3 时刻” 1:24 人工智能笔记工具Fathom融资1700万美元 2:42 阿尔特曼称 o1 仅仅是“推理模型的 GPT-2”,黄仁勋表示“给你加速 50 倍” 3:38 新代码暗示 OpenAI 本月 24 日推出 ChatGPT AI 高级语音模式 4:46 全球开源大模型新王!阿里Qwen2.5来了,性能跨量级超Llama3.1 6:13 LinkedIn 在更新服务条款前抓取用户数据进行训练 7:26 Fal.ai,承载媒体生成 AI 模型,获得 a16z 等公司的 2300 万美元融资 8:40 研究称生成式 AI 耗水量巨大:使用 GPT-4 生成 100 字文本需消耗 3 瓶水 文字版 #英伟达高级科学家Jim Fan近日预测,机器人领域将在未来2-3年内迎来类似GPT-3的突破性时刻。Fan曾在斯坦福大学师从人工智能专家李飞飞,目前领导英伟达的AI研究,致力于开发人形机器人基础模型“Project Groot”。 Fan认为,机器人基础模型研究将取得重大进展,但要进入日常生活还需时日。他强调,人形机器人的优势在于能适应为人类设计的环境,理论上可执行人类所有任务。英伟达正结合互联网数据、模拟数据和真实机器人数据来开发AI,并研发“Eureka”等技术,利用语言模型自动生成机器人训练奖励函数。 此外,Fan的团队还在探索虚拟环境中的AI代理,如视频游戏,并致力于开发能同时控制虚拟和实体代理的统一模型。他指出,机器人普及还需解决成本、安全和法规等问题。 #AI会议记录工具Fathom宣布完成了1700万美元的A轮融资,由Telescope Partners领投,其中200万美元来自用户通过众筹平台Wefunder的投资。自2020年成立以来,Fathom的营收增长了90倍,使用量增长了20倍。公司提供丰富的免费计划,并已与8500多家公司合作使用HubSpot集成。Fathom的CEO和联合创始人Richard White表示,公司自始至终围绕AI技术构建,专注于构建可靠的基础设施和易于使用的产品。Fathom使用自己的模型或至少是针对开放模型的微调版本,拥有专门团队进行模型实验和开发。公司已添加了自动创建行动项和后续邮件草稿等功能,以及“询问Fathom”聊天机器人等面向团队的功能。White表示,Fathom的愿景是成为公司领导层的中央情报源,而不仅仅是支持单一会议平台。新资金将帮助Fathom开发更多集成功能,使用AI代理执行更多任务,并直接与CRM系统等接口。 #OpenAI CEO萨姆·阿尔特曼和英伟达创始人黄仁勋近日出席T-Mobile活动,分享了对AI发展的看法。阿尔特曼提到,新推出的o1模型仅为“推理模型的GPT-2”,并预测未来几个月将有重大改进。他将AI发展划分为五个级别,目前已达到L2推理者阶段,L3智能体即将到来。 黄仁勋则表示,英伟达最新的Blackwell架构GPU能够将o1模型的响应时间从几分钟缩短至几秒,推理性能提升50倍。他预计未来每个人都将拥有终身陪伴的AI助手,类似于《星球大战》中的R2-D2机器人,并指出AI正在设计下一代AI,其进展速度达到了摩尔定律的平方。 #OpenAI可能于9月24日进一步推广ChatGPT的高级语音模式。科技媒体testingcatalog发现,OpenAI更新了高级语音模式FAQ页面,代码中出现了"hasSeenAdvancedVoice/2024-09-24"的字符串,暗示将邀请部分移动用户体验该功能。 此外,macOS版ChatGPT应用也有新进展,语音模式界面中ChatGPT的图标被替换为随语音播放而动的天空动画。语音页面新增了快速访问语音选择功能的按钮,目前仍只有四种语音可选,界面设计似乎为未来支持更多语音做准备。 有网友发现FAQ页面提到,OpenAI已向少数Alpha高级语音用户启用语音聊天访问记忆的权限。今年7月,OpenAI首次向部分ChatGPT Plus用户开放了高级语音模式,用户可以体验到GPT4o的超现实音频响应。 #阿里云在云栖大会上推出了全球最强的开源大模型Qwen2.5-72B,其性能超过了Meta公司的Llama3.1-405B。Qwen2.5系列开源了超过100个模型,包括语言、视觉语言、编程和数学模型等。旗舰模型Qwen2.5-72B在多项权威测试中表现优异,支持128K上下文长度和29种语言。其视觉模型Qwen2-VL-72B能够理解超过20分钟的长视频,视觉理解能力超过GPT4。数学模型Qwen2.5-Math在相关任务中也优于GPT4和Claude 3.5等专有模型。 阿里云CTO周靖人宣布,截至2024年9月中旬,通义千问开源模型的累计下载量突破4000万,衍生大模型超过5万个,通过阿里云服务的客户已超过30万。2024年第二季度,阿里云AI相关产品收入实现三位数增长。 阿里云坚持自研大模型和开源开放策略,推动通义千问进入全球AI竞争的核心圈,随着开源模型性能的不断提升,行业正迎来新的分水岭时刻。 #领英被指在未更新其隐私政策的情况下,使用用户数据训练人工智能模型。美国用户可以在设置中选择退出数据抓取,但欧盟、欧洲经济区和瑞士的用户则没有这一选项,这可能是由于这些地区严格的数据隐私规则。领英表示,它正在训练自己的AI模型,包括写作建议和帖子推荐的模型,并可能由其母公司微软等其他供应商训练。领英声称使用隐私增强技术来限制用于AI训练的数据中的个人信息。用户可以通过领英的“数据隐私”设置来选择退出数据抓取。非营利组织Open Rights Group呼吁英国信息专员办公室调查领英及其他默认使用用户数据训练AI的社交网络。爱尔兰数据保护委员会表示,领英已通知其将发布全球隐私政策的澄清,包括一个退出设置,但欧盟/欧洲经济区成员的数据不会被用于训练或微调这些模型。 #Fal.ai,一个面向开发者的AI生成音视频和图像的平台,宣布完成了2300万美元的融资,其中包括由Kindred Ventures领投的1400万美元A轮融资和由Andreessen Horowitz领投的900万美元种子轮融资。该平台由Burkay Gur和Gorkem Yurtseven于2021年共同创立,提供私有计算管理和开源模型API,支持生成图像、音频和视频。Fal.ai是首批支持Black Forest Labs的Flux模型的平台之一,该模型为X公司的聊天机器人Grok提供图像生成功能。尽管面临版权和内容审核的挑战,Fal.ai已吸引了包括Perplexity、零售和电子商务企业客户以及Photoroom、Freepik和PlayHT等在内的付费用户。公司目前年收入接近1000万美元,A轮融资后估值达到8000万美元。Fal.ai计划将大部分融资用于升级其推理优化产品,并建立专注于模型优化的研究团队。 #最新研究显示,生成式人工智能的耗水量惊人。加州大学河滨分校的研究发现,使用GPT4生成100字文本需消耗约1.4升水,相当于3瓶矿泉水。这些水主要用于冷却运行AI模型的服务器,耗水量因地区而异,得州最低,华盛顿州最高。 此外,AI还消耗大量电力。如果十分之一的美国上班族每周使用一次GPT4,年耗电量将相当于华盛顿特区20天的用电量。科技巨头Meta在训练大型语言模型LLaMA-3时,耗水量高达2200万升,相当于164名美国人一年的用水量。 对此,OpenAI、Meta、谷歌和微软等公司表示将致力于减少环境需求,但未给出具体方案。微软称正在开发完全不耗水的冷却方法,但细节尚不明确。随着AI技术的快速发展和广泛应用,其环境影响正引起越来越多的关注。
- Daily-AI | 9.19 | 美国加州批准里程碑 AI 法案,要求保护演员数字肖像
0:00 美国加州批准里程碑 AI 法案,要求保护演员数字肖像 1:14 针对全球零工招聘的AI助手来了!基于GPT-4构建,自动化程度大幅提升 2:16 谷歌搜索将整合 C2PA 2.1 标准,标注 AI 生成 / 编辑图片 3:26 生成式AI初创公司Runway与一家主要好莱坞制片厂达成协议 4:34 Mistral推出了一个供开发者测试AI模型的免费计划 5:54 调查显示英国 28% 成年人经历过“AI 拟声”骗局,46% 对此一无所知 6:48 YouTube Shorts将整合Veo,谷歌的AI视频模型 8:31 上海 AI 气象大模型提前 6 天预测“贝碧嘉”台风登陆浦东,已实现多次精准预测 文字版 #美国加州近日批准了一项AI法案,旨在保护演员的数字肖像权。该法案将于2025年1月1日生效,要求工作室和雇主在使用演员的“数字复制品”前必须获得授权。此外,加州州长还签署了AB 1836法案,以保护已故演员的数字肖像权,使用前需获得遗产许可。 新法案覆盖电影、电视、游戏、广告等多个领域,其条款与2023年演员罢工后达成的协议相似。法案明确规定,雇主不得随意使用AI再现演员的声音或形象,以防取代真人表演。“数字复制品”被定义为高度逼真的电子表达,易于识别为个人的声音或视觉相似性。 该法案在加州参议院以37票对1票的优势获得通过。 #全球零工招聘平台Magnit推出了基于GPT4构建的AI助手“Maggi”,并推出了综合劳动力管理平台。该平台连接Magnit的数据集,包括客户数据、公共数据和行业数据,实现了招聘、入职和工资发放流程的自动化。 Maggi能够自动提醒企业当地劳动法规的变更,帮助企业合规。此外,平台还可定制项目计划模板,以协助企业开展新项目。在人力资源数据分析方面,Maggi通过抓取市场数据和分析客户现有数据,提供市场和人才见解。 Magnit成立于1991年,总部位于旧金山,是一家专注于管理临时劳动力的全球性人力资源公司,目前管理着全球超过29.5万名临时工,服务700多家客户,业务遍及124个国家。 #谷歌宣布将在未来几个月内,在其搜索和广告服务中整合C2PA 2.1标准,旨在提高生成式AI内容的透明度。用户在搜索图片时,将能够在“关于此图片”栏目中看到该图片是否通过AI工具创建或编辑。 谷歌已加入C2PA指导委员会,并参与制定了2.1版技术标准。新版本强化了对篡改攻击的防护,确保了更可靠的内容来源数据。谷歌信任与安全副总裁Laurie Richardson表示,公司正致力于开发最新技术,以帮助人们更好地理解内容的创建时间和修改情况。 鉴于谷歌搜索占据全球约90%的市场份额,这一举措可能推动C2PA在数字领域的广泛采用,内容创作者和出版商可能面临更大压力,需要在工作流程中实施C2PA,而用户则可能逐渐期待将来源信息作为可信内容的标志。 #AI视频工具初创公司Runway与电影制片厂Lionsgate达成合作,利用Lionsgate的电影目录训练定制的视频生成模型。Lionsgate副总裁Michael Burns表示,该工作室的电影制作人、导演和其他创意人才将能够使用该模型来增强他们的工作。Runway还正在考虑将模型作为模板授权给个人创作者,以便他们构建和训练自己的定制模型。此次合作是首个公开宣布的生成性AI初创公司与好莱坞大制片厂的合作。此前,《华尔街日报》报道迪士尼和派拉蒙影业与生成性AI供应商有过讨论,但这些讨论尚未有具体成果。值得注意的是,此次合作发生在加利福尼亚州签署限制在电影和电视项目中使用AI数字复制品的法案的第二天,同时Runway正面临一起诉讼,指控其未经许可在受版权保护的作品上训练其模型。 #巴黎初创公司Mistral AI周二宣布,推出新的免费层级,允许开发者通过其AI模型进行微调和构建测试应用。此举旨在吸引开发者使用其AI模型,应对OpenAI、谷歌和Anthropic等竞争对手不断降低的价格。Mistral的新层级通过其API服务平台la Plateforme提供,使开发者能够免费实验、评估和原型设计其AI模型。尽管用户可以下载Mistral的AI模型并在Apache 2.0许可下使用,但搭建托管这些AI模型的基础设施可能较为复杂,而la Plateforme为开发者提供了更便捷的体验,并促使他们在Mistral平台上构建,从而有机会向他们推销更高速率限制的付费服务。此外,Mistral还大幅降低了通过API访问Mistral NeMo、Mistral Small和Codestral的价格,降幅超过50%,Mistral Large的价格则降低了33%。Mistral的首个多模态模型Pixtral 12B现已在le Chat上可用,该模型能够处理图像和文本,允许用户扫描、分析和搜索图像文件。 #英国Starling银行的最新调查显示,AI拟声诈骗已成为普遍问题。超过四分之一的英国成年人在过去一年中成为此类骗局的目标,而近一半的人对此毫不知情。诈骗分子利用AI拟声技术,从短短三秒的音频中复制受害者亲友的声音,以此拨打电话或发送语音信息进行欺诈。 调查还发现,每10人中就有1人表示会在这种情况下发送任何需要的信息,即使感觉可疑。Starling银行呼吁人们与亲友约定暗语以核实身份。去年,英格兰和威尔士的金融欺诈犯罪增长了46%。此外,美国老年人在2022年因诈骗损失高达16亿美元,许多案例也涉及AI拟声技术。 #YouTube在其Made On YouTube活动中宣布,将把Google DeepMind的AI视频生成模型Veo集成到YouTube Shorts中,使创作者能够生成高质量的背景和6秒视频片段。Veo模型在Google I/O 2024开发者大会上首次亮相,能够直接与OpenAI的Sora及其他视频生成模型如Pika、Runway和Irreverent Labs竞争。Veo能够创建1080p的视频片段,并支持多种电影风格。此外,Veo在Shorts中的集成是YouTube AI驱动的“Dream Screen”功能的显著升级,后者于2023年推出,允许创作者使用文本提示生成Shorts背景。YouTube相信Veo模型将进一步增强视频背景生成过程,使创作者能够制作出更令人印象深刻的视频片段。Veo的一个关键优势是其编辑和混音先前生成的视频片段的能力。此外,这将是创作者首次能够为Shorts生成6秒长的独立视频片段。当创作者选择“创建”并输入提示时,Dream Screen将生成四张图片,然后选择一张照片将其转换为视频。这项新功能将帮助创作者在视频中添加填充场景,实现更平滑的过渡并使整个故事更加连贯。例如,创作者可以在观光视频的开头添加纽约市天际线的场景,以增加更多背景。YouTube计划在今年晚些时候将Veo集成到Dream Screen中。 #上海科学智能研究院开发的伏羲气象大模型在预测台风“贝碧嘉”路径方面取得显著成果。该模型于9月10日准确预测台风将在上海浦东新区登陆,提前6天给出精准预报。此外,伏羲模型还成功预测了河南南阳特大暴雨和湖南华容县洞庭湖决堤事件。 另一款名为“风乌”的气象大模型由上海人工智能实验室开发,能将72小时内台风路径预报精度提升25%以上,并在30秒内输出未来10天的全球气象预报结果。该模型已成功预测了多个台风的登陆位置。 目前,这些先进的气象AI模型已在上海市气象局部署,正在应用于灾害性天气的预报工作中。
- Daily-AI | 9.18 | 联想集团将在印度生产 AI 服务器,并设立 AI 研发实验室
0:00 Slack 正在转变为一个 AI 代理中心。应该吗? 1:28 甲骨文的拉里·埃里森表示,AI 将来会追踪你的每一个动作 2:22 英伟达开源 Nemotron-Mini-4B-Instruct 小语言 AI 模型:专为角色扮演设计,9216 MLP、上下文长度 4096 词元 3:37 联想集团将在印度生产 AI 服务器,并设立 AI 研发实验室 4:27 Runway 宣布推出其视频生成 AI 模型的 API 5:49 11x.ai 获得由 Benchmark 领投的 2400 万美元融资,用于构建 AI 数字员工 7:13 AI 江湖“饭局”:马斯克、埃里森晚宴上向黄仁勋求购英伟达 GPU 8:12 消息称 OpenAI 明年调整结构,转变为传统的营利性公司 9:08 消息称字节跳动计划与台积电合作,2026 年前量产两款自主设计 AI 芯片 文字版 #Slack首席执行官Denise Dresser在接受TechCrunch采访时表示,公司正将Slack转型为一个“工作操作系统”,通过集成Salesforce、Adobe和Anthropic的AI应用程序,将Slack打造成AI应用的中心。新推出的Slack AI功能包括AI生成的会议摘要和与Salesforce AI代理的聊天,以及其他第三方工具,如AI网络搜索和AI图像生成。此举是Salesforce在2021年收购Slack后,对AI代理的一次重大转向。Dresser认为,由于用户已习惯在Slack上进行日常工作交流,因此Slack是与AI代理互动的理想场所。此外,Slack还面临着隐私和数据安全方面的挑战,尤其是在其向AI工具转型的过程中。尽管有企业如Klarna宣布将放弃Salesforce等CRM服务,转而使用内部AI工具,但Dresser强调,企业AI解决方案需要是可信和安全的,这是Salesforce努力为客户提供的保证。 #在甲骨文财务分析师会议上,甲骨文创始人拉里·埃里森预测人工智能(AI)未来将驱动大规模的执法监控网络,实现对警察的全面监督。他相信,通过AI的持续监控,可以显著减少犯罪行为,促使公民行为更加规范。然而,这一观点并未得到确凿证据的支持。华盛顿邮报指出,美国警方数据历史上存在偏见,若将这些数据输入AI模型,可能导致AI建议在这些地区增加监控活动,从而形成种族和社会经济地位偏见的反馈循环。2019年,洛杉矶警察局(LAPD)因审计显示其犯罪预测程序导致黑人和拉丁裔人群受到更多监控,而暂停了该项目。 #英伟达最近开源了一款名为 **Nemotron-Mini-4B-Instruct** 的小型AI语言模型。该模型专为角色扮演、检索增强生成和函数调用等任务设计,通过压缩更大的15B模型而来,采用了剪枝、量化和蒸馏等先进技术,使其更加小巧高效,尤其适合设备端部署。 **Nemotron-Mini-4B-Instruct** 的亮点在于可处理4096个上下文词元,能够生成更长、更连贯的回复。其架构包括3072的嵌入尺寸、32个多头注意力和9216的MLP中间维度,采用组查询注意力和旋转位置嵌入技术,进一步提升了文本处理能力。 该模型在角色扮演应用中表现突出,适合嵌入虚拟助手、视频游戏等交互环境。英伟达还提供了特定的提示格式,以确保模型在单轮或多轮对话中输出最佳结果,并针对函数调用进行了优化,适用于需要与API或其他自动化流程交互的AI系统场景。 #联想集团宣布将在印度南部工厂生产人工智能服务器,并在班加罗尔设立AI研发实验室。该公司计划每年在普杜谢里工厂生产5万台AI机架式服务器和2400台GPU服务器,这些服务器主要用于机器学习等资源密集型任务。联想亚太区总裁Amar Babu表示,这些服务器将供应本地市场,并出口海外。 联想印度董事总经理Shailendra Katyal强调,公司的AI服务器制造和研发投资是长期战略,新实验室表明了联想“在印度为世界”开发尖端技术的决心。值得注意的是,联想目前已在普杜谢里工厂生产笔记本电脑等产品。 #AI初创公司Runway宣布推出API,允许开发者和组织将公司的生成性AI模型集成到第三方平台、应用程序和服务中。目前,Runway API仅提供Gen-3 Alpha Turbo模型,分为面向个人和团队的Build计划以及面向企业的Enterprise计划。API的定价为每信用分一美分,一秒视频需五信用分。使用API的平台必须显著展示“Powered by Runway”标识。Runway背后有Salesforce、Google和Nvidia等投资者支持,估值达15亿美元。尽管Runway是首批通过API提供视频生成模型的AI供应商之一,但API的推出并未解决围绕这些模型和生成性AI技术的法律问题。Runway拒绝透露训练数据来源,这可能涉及版权问题。与此同时,其他AI视频生成技术供应商也在采取不同的策略,如Adobe通过向艺术家支付费用来获取训练数据。随着生成性AI视频工具的发展,预计到2026年,超过10万个美国娱乐行业工作岗位将受到冲击。 #11x.ai是一家成立于2022年的AI初创公司,专注于通过其AI代理“自动化数字工人”来自动化端到端的工作流程。该公司最近完成了由Benchmark领投的2400万美元A轮融资,并计划将其总部迁至旧金山。此前,11x.ai已经完成了一轮200万美元的种子轮融资。公司的产品主要面向市场团队,如销售、营销和收入运营,目前已推出AI销售代表Alice和AI电话代表Jordan。11x.ai的AI员工能够以25种语言进行交流,并计划在未来几个月内推出更多数字员工。公司创始人兼CEO Hasan Sukkar表示,公司即将实现1000万美元的年循环收入,并已获得包括UiPath、ServiceNow和Salesforce在内的多家大型竞争对手的关注。投资者对11x.ai的前景持乐观态度,Benchmark的普通合伙人Sarah Tavel加入了公司董事会。公司计划利用新资金进一步开发产品并扩大目前27人的团队规模,同时保留在伦敦的办公室。 #科技巨头们的AI“饭局”引发关注。甲骨文创始人埃里森透露,他与特斯拉CEO马斯克曾在一次晚宴上向英伟达CEO黄仁勋“乞求”购买最新AI GPU。甲骨文随后宣布将打造名为Zettascale AI的超算集群,由13万多个英伟达最新GPU组成,AI性能高达2.4 ZettaFLOPS,超越了马斯克旗下xAI公司的Memphis超算集群。 为支持庞大的AI计划,甲骨文已获准在其设施附近建造三座模块化核反应堆。埃里森预计,未来三年内,前沿AI模型的训练成本将达到1000亿美元。他强调,甲骨文云基础设施(OCI)希望成为AI处理领域的领导者之一,并认为在这场竞赛中抢先一步至关重要。 #OpenAI计划于明年进行结构调整,从非营利组织转变为更传统的营利性公司。这一消息来源于《财富》杂志,称首席执行官山姆·阿尔特曼在最近的公司周会上向员工宣布了该计划。尽管具体细节尚未公开,OpenAI将保留非营利部门,同时主要以营利性组织形式运营。 OpenAI成立于2015年,致力于开发人工智能技术。公司发言人表示,尽管结构发生变化,OpenAI仍将“致力于构建造福所有人的AI”,并强调非营利性是其“使命的核心”。此转变可能是为了更好地应对AI研发所需的巨额资金,OpenAI此前曾表示,仅靠捐款难以满足其核心研究所需的计算能力和人才成本。 #字节跳动计划与台积电合作,预计在2026年前量产两款自主设计的AI芯片。这一举措旨在减少对英伟达昂贵芯片的依赖,并加快在中国AI聊天机器人市场的竞争。字节跳动是抖音和TikTok的母公司,而台积电则是全球最大的芯片代工厂。 据消息人士透露,字节跳动可能会订购数十万枚芯片。早前有传闻称字节跳动与博通公司合作开发5纳米制程的AI处理器,但字节跳动已对此消息予以否认。目前,这一新的合作计划尚未进入“流片”阶段,即尚未开始具体的制造过程。
- Daily-AI | 9.14 | OpenAI o1 新模型登场:模拟人类思考、处理问题
0:00 全球人形机器人约 38% 供应链企业在中国,北京、上海、广东等地已成立具身智能机器人创新中心 1:24 黑客欺骗ChatGPT提供制作自制boom的详细说明 2:16 “最强开源模型”Reflection 被打假,英伟达科学家称现有测试基准已不靠谱 3:19 美国银行谈 AI 热潮:当前仍处早期阶段,才相当于互联网的 1996 年 4:31 Meta 承认使用澳大利亚 Facebook、Instagram 成年用户发布的公开内容训练 AI 模型 5:29 快手:可灵 AI 已累计生成超 2700 万个视频,正内测全新 1.5 版本基础模型 6:19 OpenAI o1 模型登场:开启 AI 通用复杂推理新篇章,模拟人类思考、处理问题 7:31 AI 模型数据处理方式引疑虑,欧洲隐私监管机构对谷歌展开调查 文字版 #全球人形机器人产业链正在加速发展,中国在其中扮演着重要角色。约38%的人形机器人供应链企业位于中国,主要集中在北京、上海和广东等地,已成立具身智能机器人创新中心。在硬件创新和大模型技术的推动下,中国的机器人产业蓬勃发展。人形机器人正逐渐从“炫技”向“服务”转变,逐步进入百姓生活。 目前,部分人形机器人已进入小批量量产阶段,售价甚至低至10万元以内。截至2024年7月,中国持有的机器人相关有效专利超过19万项,占全球比重约2/3。中国连续11年成为全球最大工业机器人市场,近三年新增装机量占全球一半以上,制造业机器人密度达到每万名工人470台,十年间增长近19倍。 2024年中国国际服务贸易交易会将于9月12日至16日在北京举办。 #艺术家兼黑客Amadon通过一系列提示,成功诱导ChatGPT提供制作肥料炸弹的详细指南,这种炸弹与1995年俄克拉荷马城恐怖袭击中使用的类似。尽管ChatGPT通常拒绝提供危险或非法物品的制作指导,但Amadon利用“越狱”技巧,通过构建一个科幻幻想世界,使ChatGPT忽略了其预设的安全限制。专家警告,这些指南足够敏感且准确,不应公开。Amadon向OpenAI报告了他的发现,但得到的回应是模型安全问题不适合bug赏金计划,因为它们不是可以直接修复的个别、离散的错误。OpenAI未在截止时间前对TechCrunch的问题作出回应。 #最近,被誉为“最强开源模型”的Reflection 70B遭到了质疑。该模型由一个小型创业团队开发,声称其性能超越GPT4等先进模型。然而,第三方测评机构Artificial Analysis发现官方公布的测试成绩无法复现。此外,Reflection还被指控套壳Claude(由Anthropic公司开发的AI助手)。面对这些质疑,Reflection团队表示正在调查原因,但未承认造假。 托管平台Hyperbolic的CTO透露,与Reflection合作的过程中,多次尝试部署模型后,发现其表现仍不如预期。英伟达高级科学家Jim Fan指出,现有的一些AI测试基准如MMLU和HumanEval已被严重破坏,模型在这些测试集上造假变得极其容易。他建议应更依赖独立第三方评估或用户投票榜单。 #美国银行最新报告指出,当前的人工智能热潮仍处于早期阶段,发展程度大致相当于互联网的1996年。该报告基于对3000多家公司的分析,认为人工智能是继个人计算机和互联网之后的第三次重大技术周期,始于2022年11月ChatGPT的发布。与前两次技术浪潮不同,AI的影响可能在5到10年内显现,报告预测未来几年AI相关资本支出可能超过1万亿美元。 然而,投资者对AI的态度正在发生变化。一些人认为生成式AI的收入潜力无法证明当前大规模投资的合理性。美国银行提醒,互联网发展初期也面临类似质疑,但最终催生了数千种应用和公司。 报告还指出,投资者往往低估AI的长期影响,同时高估其短期潜力。目前对OpenAI、Anthropic等AI公司的投资仅是开发应用的前提,大多数AI应用仍处于测试阶段。 #Meta公司近日承认,自2007年以来一直在使用澳大利亚Facebook和Instagram成年用户发布的公开内容来训练AI模型。Meta全球隐私总监梅琳达·克莱鲍在澳大利亚政府的AI应用调查中表示,除非用户将帖子设为私密,否则Meta会收集所有公开帖子中的照片和文字。 与欧洲不同,澳大利亚用户无法选择退出这一数据收集过程,因为当地缺乏相关法律法规。澳大利亚参议员大卫·休布里奇对此表示担忧,认为政府未能在隐私保护方面采取行动,导致像Meta这样的公司可能会继续利用用户数据,包括儿童的图片和视频。 Meta表示,他们仅使用公开帖子和评论来训练生成式AI模型,不会使用非公开内容。 #快手高级副总裁盖坤在投资者日上透露,旗下的视频生成大模型“可灵AI”已取得显著成果。截至目前,超过260万用户使用该模型,累计生成超过2700万个视频。 自产品发布以来,“可灵AI”已经进行了9次迭代升级,目前正在内测全新的1.5版本基础模型。该模型是快手自研的,采用类似OpenAI Sora的技术,能够根据文字生成图片和视频。 此外,“可灵AI”于8月底推出了会员订阅计划,首月最低19元起,次月58元,可生成约66个视频或3300张图片,并享受多项会员专属功能。 #OpenAI推出了全新AI模型o1,这是该公司首款具备“推理”能力的模型,能够比人类更快地回答复杂问题。同时,还发布了规模更小、成本更低的o1-mini版本。 o1采用了全新优化算法和定制数据集进行训练,使用强化学习技术自行解决问题,并通过“思维链”处理查询。在处理复杂编程和数学问题方面,o1的表现优于GPT4,能够解释推理过程。在国际数学奥林匹克竞赛资格考试中,o1正确解决了83%的问题,远超GPT4的13%。 不过,o1在世界知识和网页浏览等方面的能力不及GPT4。目前,o1处于“预览”阶段,ChatGPT Plus和Team用户可以率先体验。开发者通过API调用o1的成本较高,输入和输出费用分别是GPT4的2倍和3倍。OpenAI计划未来向所有ChatGPT免费用户开放o1-mini的访问权限。 #欧洲隐私监管机构正在对谷歌展开调查,重点关注其人工智能模型的数据处理方式。爱尔兰数据保护委员会将评估谷歌是否违反了欧盟《通用数据保护条例》,该条例要求在处理可能对个人权利构成高风险的信息前,必须进行数据保护影响评估。 此次调查主要针对谷歌的PaLM 2语言模型,该模型于2023年5月推出,早于目前的核心Gemini模型。谷歌表示将配合调查,并认真对待相关义务。此前,社交媒体巨头Meta也因类似原因暂停了使用欧洲用户数据训练AI模型的计划。
- Daily-AI | 9.13 | 上海AI芯片独角兽启动IPO上市辅导:哈佛高材生打造国产GPU,已融资50多亿
0:00 「Her」主创 Alexis Conneau 宣布从 OpenAI 离职创业 1:01 摩根士丹利策略师迈克・威尔逊:美股投资者对 AI 主题的追捧“过头了” 2:09 Mistral发布Pixtral 12B,这是其第一个多模态模型 3:26 小模型越级挑战14倍参数大模型,谷歌开启Test-Time端新的Scaling Law 4:29 Connectly,现在由阿里巴巴支持,利用AI个性化客户短信 5:47 谢尔盖·布林表示他在谷歌‘几乎每天’都在从事AI工作 6:28 上海AI芯片独角兽启动IPO上市辅导:哈佛高材生打造国产GPU,已融资50多亿 7:30 李彦宏揭开大模型认知误区:开源解决不了效率问题,大模型之间差距越来越大 8:37 苹果对AI持观望态度 9:37 又涨了!传OpenAI估值超1万亿元,微软、苹果、英伟达都想投 文字版 #根据最新的报道,OpenAI的“Her”项目主创Alexis Conneau宣布离职,准备创业。Conneau是GPT4o实时音频技术的重要人物之一,并参与了GPT-5的研发。他在ChatGPT的“Her”模式正式推出不到两个月后选择离开,但尚未透露他的新创业项目。 在此期间,OpenAI计划在两周内推出下一代模型Strawberry,该模型能够在回答问题前进行“思考”。此外,OpenAI可能会为新模型推出每月200美元的定价方案。 这些人员变动和新产品计划反映了AI领域人才竞争的激烈程度,引发了广泛的关注。 #摩根士丹利首席美股策略师迈克·威尔逊指出,美股投资者对人工智能主题的热情已经“过头”,虽然AI可能在长期上提升生产力,但短期内推高股价的做法过于急促。他提到,AI热潮的迹象虽有减弱,但并未结束,尤其是在芯片股的表现上,例如英伟达的股价波动和费城半导体指数本月下跌8.5%。 今年早些时候,AI热潮曾推动标普500指数创新高,但市场现在需要新的催化剂。随着美联储可能在下周开始降息,投资者正在转向其他板块以评估经济状况。 此外,高盛分析师Peter Oppenheimer的报告显示,ChatGPT的流量直线下降,引发了对AI股票的负面情绪。然而,数据分析公司Similarweb的最新数据显示,考虑到域名变更因素后,ChatGPT仍实现了66.2%的同比增长,依然是最受欢迎的生成式AI应用。 #法国人工智能初创公司Mirstral推出了其首个能够同时处理图像和文本的模型Pixtral 12B。该模型拥有约120亿参数,大小约为24GB。Pixtral 12B基于Mirstral的文本模型Nemo 12B构建,能够处理任意数量和大小的图像,无论是通过URLs还是使用base64编码的图像。理论上,Pixtral 12B能够执行包括图像描述和图片中对象计数在内的多模态任务。该模型可以通过GitHub和AI及机器学习开发平台Hugging Face下载,并在Apache 2.0许可下无限制使用。目前尚不清楚Mirstral在开发Pixtral 12B时使用了哪些图像数据。Mirstral在完成一轮由General Catalyst领投的6.45亿美元融资后推出了Pixtral 12B,公司估值达到60亿美元。Mirstral的策略包括发布免费的“开源”模型,为这些模型的托管版本收费,并为企业提供咨询服务。 #谷歌DeepMind最新研究表明,小模型在特定情况下通过优化测试时计算,可以超越参数量大14倍的大模型。研究团队探索了两种主要机制:一是使用过程密集验证器奖励模型进行搜索,二是根据提示自适应更新模型响应分布。 他们提出了“计算最优”扩展策略,根据提示的难度动态分配测试时的计算资源。研究结果显示,对于简单和中等难度问题,增加测试时的计算通常效果优于增加预训练;而在面对较难问题时,增加预训练计算更为有效。 这一发现引发了广泛讨论,有人猜测可能与OpenAI即将发布的新模型“草莓”的方法有关。“草莓”据传会在回答前进行“思考”,响应时间需要10-20秒。然而,也有人指出“草莓”可能采用了其他技术路线。 #Connectly.ai,一家利用人工智能技术帮助零售商和电子商务企业通过消息平台销售产品与服务的初创公司,近日完成了由阿里巴巴领投的2000万美元B轮融资。该公司由Meta前商务Messenger部门主管Stefanos Loukakos和Strava前CTO Yandong Liu于2020年共同创立。Connectly.ai的平台整合了包括WhatsApp、Instagram、短信和基于网络的聊天机器人在内的多种消息应用和服务,使品牌能够创建广告活动并自动与客户进行基本对话。此外,该平台还能根据客户的兴趣自动构建受众群体,例如在客户放弃购物车时发送折扣码或低成本运输优惠。尽管市场调研显示多数人更愿意等待与真人交流而非即时与AI聊天,但Connectly.ai的技术仍被许多品牌视为良好的投资。目前,公司已有超过300个付费客户,预计2024年收入将增长100%。此次融资将用于扩展平台功能和增加旧金山团队的员工人数。 #谷歌联合创始人谢尔盖·布林在洛杉矶All-In峰会上表示,他已重返谷歌,几乎每天都在工作,因为他认为当前AI领域的快速进展令人兴奋,不想错过。布林是Alphabet前总裁,此前有报道指出他回归谷歌总部参与AI项目,但这是他首次公开确认。布林认为AI是一个快速发展的领域,对人类具有巨大价值。对于AI训练是否需要大规模增加计算资源,布林表示怀疑,他认为近年来算法的改进可能已经超过了对计算能力的需求增长。 #国产AI芯片独角兽壁仞科技正式启动IPO上市辅导。该公司由哈佛法学博士张文创立于2019年,专注于开发原创通用计算体系和智能计算解决方案。壁仞科技已完成超过50亿元的融资,投资方包括启明创投和IDG资本等知名机构。 在产品方面,壁仞科技于2022年发布了首款通用GPU芯片,并近期公布了自主研发的异构GPU协同训练方案HGCT,标志着中国在异构多GPU芯片算力训练技术领域的突破。目前,壁仞科技的客户已涵盖通信运营商和人工智能等多个领域的行业龙头。此次IPO上市辅导由国泰君安证券负责,这也是继燧原科技之后又一家国产芯片公司启动A股上市流程。 #百度创始人李彦宏在内部讲话中指出了大模型领域的三个认知误区: 1. **大模型差距扩大**:尽管新模型在测试集上表现良好,实际应用中仍存在明显差距。 2. **开源模型效率问题**:开源模型难以解决商业应用中的效率问题,而闭源模型通过资源共享能实现更高效率。 3. **智能体发展方向**:李彦宏强调智能体是大模型最重要的发展方向,有助于降低应用门槛。 他还提到,百度的文心智能体平台AgentBuilder已吸引20万开发者和6.3万企业,智能体的日均分发次数在7月超过800万,较5月翻倍。李彦宏认为,当前大模型行业正进入洗牌期,具备自研能力的企业将向头部聚集,未来百度将更加重视智能体构建应用生态,以吸引更多开发者和企业加入。 #苹果在“Glowtime”发布会上推出了其AI技术,但该技术并未如预期般带来突破性变革。尽管苹果声称其AI技术具有“突破性能力”,并将对iPhone使用体验产生“难以置信的影响”,但实际功能与市场上现有的AI工具相差无几,主要提供本地和私密的便捷服务。苹果AI技术在功能上缺乏创新,与发布会上的宣传相比,实际效果显得平淡无奇。此外,苹果AI技术的一些功能甚至未能在iPhone 16上首发,而是计划在未来的更新中推出。业界对苹果AI技术的期待与实际表现之间存在明显差距,苹果的宣传策略也受到了质疑。尽管AI技术在某些领域可能具有变革性,但在消费者层面,苹果的AI技术并未展现出预期的革命性进步。 #人工智能独角兽OpenAI正在寻求新一轮融资,估值已飙升至1500亿美元,较年初翻番。公司计划筹集65亿美元的股权融资和50亿美元的债务资金,由风投公司Thrive Capital领投,微软跟投,苹果和AI芯片公司英伟达也在洽谈投资。如果此次融资成功,OpenAI将超越SpaceX,成为全球第二大独角兽。 OpenAI此前已完成7轮融资,累计融资额达到113亿美元,微软投资超过110亿美元,成为其最大股东。新资金将主要用于算力和运营开支。此外,OpenAI计划在2024年下半年允许员工出售部分股份。 目前,OpenAI仍是私有公司,尚未公开上市的计划。
- Daily-AI | 9.12 | 曝OpenAI神秘大模型“草莓”两周内发布
0:00 字节再试硬件:探索 AI 耳机、眼镜等产品,与豆包大模型联动 1:29 让不足百元的AI数字人替人打工,风平智能获近亿元A轮系列融资 2:35 曝OpenAI神秘大模型“草莓”两周内发布 3:36 突破!面壁联合梧桐科技,高效端侧模型落地芯算一体AI 座舱 4:50 317笔融资告诉你,谁是中国AI投资之王? 6:04 美国商务部公布新规要求AI公司报告模型训练进展,声称将阻止外国使用美国技术 文字版 #字节跳动正在探索将大模型与硬件结合,计划自主开发AI硬件并寻求外部合作。公司正在开发一款与豆包大模型和豆包App联动的智能耳机,由AI硬件团队负责人Kayden带领,该团队主要由字节去年收购的智能耳机公司大十未来科技的人员组成。 除了耳机,字节还在探索AI眼镜方向,可能通过投资或组建内部团队来研发,已投资AI眼镜研发商“李未可”,持股20%。此外,字节旗下的VR头显品牌PICO也在研发多款搭载豆包大模型的穿戴设备。 字节在硬件领域的多次尝试未果,包括收购锤子科技、推出教育硬件和VR头显等,分析认为字节擅长的互联网产品开发方法不适用于硬件研发。在AI时代,科技巨头纷纷布局硬件,视其为大模型落地的重要方向。此次选择耳机和眼镜品类,或有助于降低市场接受门槛。 #风平智能公司最近完成了近亿元A轮系列融资,由璀璨者资本和华为系企业家华鲲资本基金共同投资。该公司专注于AI数字人技术,推出了“保险查查”和“1号AI”等产品。“1号AI”平台结合数字人、AI和RPA技术,帮助用户创建专属AI数字人,主要应用于金融和医疗领域。 风平智能的数字人价格从几千到几万元不等,To C端甚至有不足百元的选择。公司已达到盈亏平衡,利润持续增长。创始人林洪祥表示,融资将主要投入To C端业务和国际市场拓展。在电商直播领域,风平智能的AI数字人在公私域直播中曾带来单日超过一亿元的商品交易总额(GMV)。公司计划继续加强核心技术研发,优化AI数字人应用产品和AI营销解决方案。 #OpenAI即将推出新一代大语言模型“草莓”(Strawberry),预计将在两周内作为ChatGPT服务的一部分发布。该模型被认为是此前传闻中的神秘Q*模型,声称在解答数学问题和复杂编程方面表现出色。 与现有AI不同,“草莓”会在回答前进行10-20秒的“思考”,这有助于避免错误并提供更全面的解答。初代版本仅支持文本输入输出,无法处理图像等多模态信息。 在定价方面,“草莓”可能会采用速率限制收费模式,限制用户每小时发送的最大消息数。与GPT4相比,“草莓”在处理复杂多步骤问题时更为出色,无需用户输入额外提示词。 不过,“草莓”也存在一些问题,例如在简单问题上可能花费过多时间思考,且其记忆整合前面对话的能力仍有待提升。 #面壁智能与梧桐科技达成合作,将其MiniCPM端侧多模态大模型首次应用于汽车智能座舱系统。这一进展将显著提升人车交互体验。 MiniCPM模型具备复杂意图理解、模糊语义理解和上下文记忆等能力,支持更自然的多轮对话。它还可以学习车内外的多模态数据,实现场景驱动的自动响应和主动服务。 梧桐科技是国内智能空间领域的先行者,已与多家主机厂合作,产品装机量超过300万辆。此次合作将MiniCPM模型集成到梧桐科技的芯算一体AI座舱方案中,实现舱驾协控相关功能。 端侧模型在智能座舱中具有显著优势,包括无网络延迟、全时域适用和保护隐私等。随着智能座舱渗透率快速提升,大模型在此领域的应用前景广阔。面壁智能的MiniCPM系列模型以其高效性能闻名,此次"上车"标志着其进入全新应用领域。 #今年以来,中国AI领域共发生317笔融资,产业资本成为最积极的投资者。头部AI公司如智谱AI、科大讯飞等频繁出手,互联网巨头阿里巴巴和百度也在积极布局。风险投资(VC)机构如奇绩创坛、卓源亚洲和源码资本表现活跃,而私募股权(PE)机构则相对谨慎,仅有红杉中国等少数几家参与大模型投资。 地方产业基金成为重要的投资力量,北京表现尤为突出。中关村科技城、顺禧基金等北京本地基金频频出手。由于清华大学的人才优势及互联网巨头的人才储备,北京已成为中国AI发展的中心,今年前8个月AI项目数量达107起,远超广东和上海。 值得注意的是,VC和PE在大模型投资上出现分歧。VC更愿意承担风险以追求高回报,而PE则更看重确定性和盈利模式,这反映了不同类型投资机构对AI产业前景的不同判断。 #美国商务部工业与安全局(BIS)近日发布新规,要求AI公司每季度报告大模型和计算集群的开发进展。该规定适用于训练参数超过 \(10^{26}\) 次运算或拥有传输速度超过 300 Gbit/s 的计算集群的公司,预计将涉及约15家美国AI企业。 BIS表示,这一举措旨在落实拜登去年10月签署的AI行政令,以确保AI技术的安全性和可靠性,并抵御网络攻击。新规要求企业报告网络安全措施和测试结果,以评估AI系统的潜在危险能力。 此外,BIS强调,收集这些信息对于确保军民两用基础模型可供国防工业使用至关重要,有助于美国政府了解AI系统的能力和安全性,并防止外国利用美国的AI技术。 新规将在10月11日前向公众征求意见。美国商务部长指出,这将帮助政府跟上AI的发展,加强国防并维护国家安全。对此,中国商务部对美方限制对华AI发展表示严重关切,认为这违背了两国元首的共识,并影响正常的经贸合作。
- Daily-AI | 9.11 | AMD放弃旗舰游戏显卡,专注AI,新统一架构挑战英伟达CUDA生态
0:00 比尔・盖茨:与电动汽车相比 AI 用电量小得多,不担心它影响气候 1:17 对话腾讯云VP许华彬:AI搜索还在早期阶段,AI成为云计算第二增长点 2:33 百度文心一言市场负责人张全文否认放弃通用大模型:将持续加大研发投入 3:40 研究发现,生成式 AI 可提升软件开发的学习效果 4:40 AMD放弃旗舰游戏显卡,专注AI,新统一架构挑战英伟达CUDA生态 5:57 LIama 3+Mamba强强联手!蒸馏到线性RNN,推理速度提升1.6倍 6:46 心脏病是世界上最大的杀手 —— 这家剑桥大学衍生公司正在利用人工智能寻找新治疗方法 8:06 Smartcat 为其 AI 驱动的翻译平台获得 4300 万美元融资 9:27 iPhone 16全系上车最强3nm芯片!首款AI原生手机,按键竟成最大亮点 文字版 #微软联合创始人比尔·盖茨近日接受了科技媒体The Verge的专访,谈及人工智能、气候变化等热点话题。他指出,AI的用电量远低于电动汽车,因此不会对气候产生显著影响。盖茨认为,AI将在健康和教育等领域发挥积极作用,未来十年许多行业的生产力将大幅提升。 对于AI可能加剧虚假信息传播的担忧,盖茨表示,AI实际上可能有助于减少虚假信息。在气候技术方面,他坚信核能是解决气候危机的关键,创立的泰拉能源公司正在开发更安全、更便宜的核裂变技术。同时,他还投资了五家核聚变公司,尽管实现时间较远,但他相信核聚变将在未来发挥重要作用。盖茨呼吁在应对气候变化挑战时展现创新精神。 #在2024腾讯全球数字生态大会上,腾讯云副总裁许华彬表示,人工智能(AI)已成为云计算的第二增长点。腾讯的新一代大模型“混元Turbo”在多个基准测试中对标GPT4,其推理效率提升了100%,同时成本降低了50%。目前,近700个腾讯内部业务已接入该模型,AI产品覆盖了超过400家互联网头部企业。 许华彬提到,生成式AI带来了更大规模的数据交互、更高的能耗和新的运维体系。云行业的客户需求已经从早期的视觉领域扩展到数字人应用等多个方面。腾讯云在AI基础设施上的能力也在不断提升,以满足行业发展的需求。 此外,值得买科技的CTO王云峰指出,AI搜索仍处于早期阶段,能够在这一领域脱颖而出的公司需要对产品有极强的追求,并具备丰富的信息检索经验。腾讯选择MOE架构构建混元大模型,旨在平衡参数规模、知识储备和推理成本。 #近日,有关百度放弃通用大模型研发的传言引发了广泛关注。对此,百度旗下的人工智能对话系统“文心一言”市场部负责人张全文在朋友圈进行了否认,称这些消息纯属谣言。他表示,文心一言刚完成全面功能升级,百度将继续加大在通用大模型领域的研发投入。 此次升级后,文心一言在创作、问答和文件处理等方面都有显著提升,能够生成更专业的内容,提供更全面的问答,支持处理上百种格式的文件,并具备一键关联网盘文档、智能翻译和图片理解等功能。 百度创始人李彦宏在今年4月曾透露,自去年3月16日发布以来,文心一言的用户数已突破2亿,日均API调用量达到2亿次,服务客户数达8.5万。此外,利用百度AI开发平台“千帆”开发的AI原生应用数量超过19万。 #韩国东洋未来大学的研究人员近日发表了一项论文,探讨了ChatGPT在计算机科学教育中的影响。研究选取了36名计算机专业学生,进行为期四周的软件开发竞赛,并允许使用ChatGPT作为辅助工具。结果显示,大量使用ChatGPT的学生在项目完成率和得分上表现更佳。 调查中,78%的参与者认为AI帮助他们更深入理解复杂主题,75%的学生表示ChatGPT显著提升了他们的实践技能和职业发展。研究人员指出,生成式AI能够与开发人员密切合作,在解决代码问题和加快编写速度等方面发挥重要作用,实现优势互补。ChatGPT是由OpenAI开发的大型语言模型,近年来在教育和软件开发领域引起了广泛关注。 #AMD近日宣布了两项重大战略转变:一是放弃旗舰游戏显卡,专注于中低端市场;二是统一现有的两种GPU微架构,重点发展AI领域,以挑战英伟达的CUDA生态系统。AMD计算和图形主管Jack Huynh表示,这一策略旨在扩大生态规模,只有达到40%的市场份额,开发者才会为AMD优化。 新的统一架构UDNA将融合面向消费市场的RDNA和面向数据中心的CDNA,预计将为桌面GPU提供完整的张量运算支持。AMD的目标是打造一个类似CUDA的400万开发者生态。 目前,AMD在桌面独立显卡市场的份额仅为12%,而英伟达则高达88%。分析认为,AMD放弃高端市场将使英伟达在下一代旗舰游戏卡的定价上拥有更大的自由度。 AMD的新一代RDNA 4架构RX 8000系列显卡预计将在今年晚些时候或明年发布,具体规格尚未明确。 #Together AI公司最新研究成果显示,将Llama 3模型蒸馏到Mamba架构中,可以将推理速度提升1.6倍。Mamba是一种新型神经网络架构,由斯坦福大学的Tri Dao等人提出,特别擅长处理长序列数据。 研究团队采用了三阶段蒸馏流程,将Transformer模型的知识迁移到Mamba中,并设计了推测解码算法以进一步加速推理。测试结果表明,混合模型在多项任务上的表现与原始Llama 3相当,甚至在某些任务上更为出色。特别是在单轮和多轮对话、零样本NLP任务等评测中,混合模型展现了不俗的性能。 #CardiaTec,一家由剑桥大学衍生出的初创公司,正在利用人工智能技术来加速心血管疾病(CVD)药物的发现。该公司近日宣布完成了650万美元的种子轮融资,以支持其研发工作。心血管疾病是全球死亡的主要原因,每年导致近1800万人死亡。CardiaTec由生物技术和生物工程毕业生(CEO)Raphael Peralta和(COO)Thelma Zablocki创立,由剑桥大学AI药物发现讲师Namshik Han(CTO)支持。公司已经与英国和美国的65家医院建立了合作关系,收集心脏组织样本,以构建所谓的“最大的人类心脏组织多组学数据集”。CardiaTec的目标是解码心血管疾病的生物学基础,并通过计算模型识别新的、针对性的治疗方法。尽管AI辅助药物尚未上市,但早期的潜力已经引起了广泛关注,许多初创公司因此筹集了大量资金。CardiaTec的种子轮融资由Montage Ventures领投,Continuum Health Ventures、Laidlaw Ventures、Apex Ventures和一些天使投资者参与。 #尽管AI翻译在准确性上取得了进展,但它们通常缺乏人类翻译的词汇丰富性。AI模型基于概率而非实际经验做出选择,因此翻译可能缺乏生活气息。尽管如此,对于许多公司而言,准确性是首要需求,这使得AI翻译领域颇具吸引力。Smartcat是提供自动化翻译工具的供应商之一,其联合创始人兼首席执行官Ivan Smolnikov表示,公司业务良好,拥有超过1000家企业客户,包括20%的财富500强企业。Smartcat提供工具、应用程序和托管服务,帮助公司将书面和口头内容翻译成约280种语言。Smartcat通过“匹配引擎”运行内容,以确定哪种第三方模型最适合内容和目标输出语言。此外,Smartcat还提供人工翻译和编辑服务,以优化AI翻译。公司最近完成了4300万美元的C轮融资,由Left Lane Capital领投,总融资额达到7000万美元。这笔新资金将用于扩大团队、产品开发以及持续的市场营销和销售努力。 #苹果最近发布了iPhone 16系列新品,所有型号均搭载最新的A18芯片,采用第二代3nm工艺,性能显著提升。新机型增加了拍照键,支持拍摄空间照片和视频。iPhone 16 Pro系列配备4800万像素主摄和超广角摄像头,Pro Max机型的屏幕增至6.9英寸。此外,苹果推出了Apple Intelligence功能,支持自然语义搜索和智能剪辑等AI应用,但中文版需等到明年发布。 同时,Apple Watch Series 10的屏幕面积增加了30%,机身更加轻薄,并新增了睡眠呼吸暂停检测功能,可以分析用户在睡眠期间的呼吸情况。AirPods 4推出了两个版本,其中一款支持主动降噪,而AirPods Pro 2则升级了听力健康功能,能够进行听力测试并作为助听器使用。 iPhone 16系列将于9月20日正式开售,起售价为5999元;Apple Watch Series 10起售价为2999元,AirPods 4基础款售价为999元。
- Daily-AI | 9.06 | 三星高管剧透GPT-5:3-5万亿参数,7000块B100训练
0:00 支付宝将发布 AI 独立 App 支小宝 1:18 三星高管剧透GPT-5: 3-5万亿参数,7000块B100训练 2:17 短系列应用My Drama通过新的AI伙伴与Character.AI展开竞争 3:19 马斯克4个月建成世界最强超算!10万块H100,将训练Grok-3 4:31 苹果智能如何改变你在iPhone上使用Siri的方式 5:57 著名配音演员詹妮弗・黑尔谈人工智能:正利用技术剥夺我们养活孩子的能力 6:53 OpenAI 阿尔特曼被曝启动全球 AI 基建计划:先期在美国多地砸下数百亿美元 7:57 Ilya新公司融资10亿美元!被曝估值50亿美元,公司现仅有10人 9:07 Claude 企业计划上线:上下文窗口 50 万词元、原生集成 GitHub,强调不拿数据训练 AI 10:21 消息称智谱完成新一轮数十亿元融资:国资入局,投前估值达 200 亿元 文字版 #支付宝即将推出全新AI独立应用“支小宝”,这一消息由蚂蚁集团总裁韩歆毅在2024 Inclusion・外滩大会上透露。支小宝是国内首个服务型AI原生应用,基于蚂蚁百灵大模型开发,能够通过对话完成订票、点餐、查询公交码等多项生活服务。 蚂蚁集团以支付宝为核心,正在加速AI应用的布局,已在出行、政务、医疗、理财等领域服务亿级用户。支小宝是蚂蚁推出的三款新AI产品之一,旨在进一步拓展AI在日常生活中的应用场景。 本届外滩大会由多家知名高校和机构联合主办,聚焦“AI产业新实践”、“科技人文新思考”和“金融科技新探索”三大方向,汇聚了10多位中外院士和500多位全球行业领袖,共同探讨科技如何创造可持续未来。 #在最近的一场峰会上,三星高管透露了关于GPT-5的一些参数,预计其将拥有3-5万亿的参数,并需要7000块英伟达B100芯片进行训练。同时,OpenAI日本负责人表示将在今年推出“GPT Next”,其性能将比GPT4强大100倍。此外,OpenAI新开设了一个新闻账号,暗示将会有许多新消息发布。 网友们从OpenAI的域名更新中发现了涉及新产品测试的迹象,其中可能包括与视频生成相关的项目Sora。这些消息引发了对GPT-5即将发布的广泛猜测和期待。有分析认为,如果GPT-5的能力提升2-3倍,可能意味着采用了新架构,从而在不增加计算量的情况下实现能力增长,但也有人对此表示担忧,认为这可能只是炒作。 #乌克兰媒体科技公司Holywater推出了My Drama,一个拥有超过30部短剧系列的应用,其中多数采用肥皂剧格式以吸引观众。My Drama不仅提供剧集观看,还推出了AI聊天机器人,允许用户与剧中角色深入互动,增强沉浸式叙事体验。自4月推出以来,My Drama迅速获得了100万用户和300万美元的收入。Holywater计划年底前发布100部作品,并推出AI角色互动功能,用户将能够与虚构角色进行更个性化的对话。此外,My Drama利用AI技术降低制作成本,提高内容生产效率,目标是到年底将成本降低至少40%。My Drama应用可在网页和iOS及Android设备上使用,部分剧集免费,但大部分内容需要购买币包解锁。 #马斯克旗下的AI公司xAI最近宣布,其超级计算机“Colossus”已于上周末上线。这台超级计算机搭载了10万块英伟达H100处理器,被誉为世界上最强大的AI训练系统。Colossus的设计和建设仅用了122天,主要用于训练xAI的大语言模型Grok。 马斯克提到,如果能获得5万块更先进的H200芯片,Colossus的算力将在几个月内翻倍。他还计划在12月发布Grok-3。此外,xAI通过特斯拉获得了芯片供应的优势,马斯克表示,特斯拉今年将在AI相关支出上投入约100亿美元,其中一半用于内部开发,并考虑向xAI投资50亿美元。 Colossus的规模超越了Meta用于训练其最大AI模型的集群,但如此庞大的系统也给孟菲斯市带来了压力,每天需消耗100万加仑水和150兆瓦电力。马斯克强调,快速行动对避免落后至关重要。 #苹果公司承诺将在秋季推出一个更智能的Siri版本,这是对多年来关于Siri缺乏创新的讨论的回应。新的Siri将通过集成苹果智能(Apple Intelligence)和与OpenAI的合作,获得一系列新功能和更新。用户将能够通过Siri发送图片或文档查询,而无需拥有ChatGPT账户。Siri将能够根据用户的个人上下文提供个性化服务,例如,用户可以询问Siri找到朋友Alice几天前发送的食谱,或者在预订航班时让Siri从电子邮件或图片中找到护照号码。此外,Siri现在能够更好地理解自然语言,即使用户在说话时结巴,Siri也能理解。用户还可以在不重复上下文的情况下提出后续问题。Siri现在还支持打字输入,方便在需要保持安静或在嘈杂环境中使用。Siri现在对苹果的产品和服务有更多了解,能够提供如何使用iPhone、iPad和Mac上新功能的指导。此外,Siri能够理解屏幕上的内容,并根据用户当前查看的内容采取行动,例如将朋友发送的新地址添加到他们的联系卡中,或者在Apple TV+上打开朋友推荐的电视节目。 #知名游戏配音演员詹妮弗·黑尔近日就人工智能对行业的影响发表看法。她认为AI是一把双刃剑,既能造福人类,也可能对其造成伤害。黑尔指出,AI技术正在剥夺演员们的生计,并呼吁对使用演员声音和形象的AI应用进行规范。她举例提到,自己早期为《合金装备》配音时仅获1200美元报酬,而该游戏总收入高达1.76亿美元。 目前,美国演员工会正就AI使用问题进行罢工,涉及16万名成员,影响众多游戏开发商。罢工的核心争议在于如何保护演员的数字复制品和声音不被滥用。全美配音演员协会已向国会提出“NO FAKES”法案,旨在保护演员的权益。 #OpenAI首席执行官萨姆·阿尔特曼正在启动一项全球AI基础设施计划。据彭博社报道,该计划将在美国投资数百亿美元,旨在建设AI所需的机器和系统等基础设施。阿尔特曼自年初以来寻求美国政府的支持,意在组建全球投资者联盟,为AI快速发展提供资金。 计划包括建设数据中心、增加能源容量和传输、以及扩大半导体制造。潜在投资者来自加拿大、韩国、日本和阿联酋,同时OpenAI也考虑让其他私营公司参与,其中微软可能成为合作伙伴。 此举恰逢OpenAI即将完成新一轮融资,预计公司估值将超过1000亿美元,参与的投资者包括Thrive Capital、微软、苹果和英伟达等。OpenAI发言人表示,建设更多基础设施对推进AI发展至关重要。 #OpenAI前首席科学家Ilya Sutskever的新公司SSI(Safe SuperIntelligence)宣布完成10亿美元融资,估值高达50亿美元。SSI成立仅3个月,目前只有10名员工,专注于构建安全的超级智能。参与投资的机构包括NFX、a16z、红杉资本等知名风投。 SSI计划利用这笔资金购买算力并招募顶尖人才。他们在招聘上非常谨慎,只招认同公司理念、致力于为AI超越人类智能做准备的人才。联合创始人表示,他们会花数小时审查候选人的品格。 Ilya表示SSI将以不同于OpenAI的方式继续扩展AI能力。他强调要关注“我们在扩展什么”这个问题,而不仅仅是盲目扩大规模。 与此同时,Ilya的前东家OpenAI也正在洽谈新一轮10亿美元融资。OpenAI目前已有1700多名员工,近一年来扩张迅速。 #AI公司Anthropic推出了Claude Enterprise计划,专为企业用户设计,旨在提升AI模型与内部知识库的兼容性。该计划的上下文窗口可达50万个词元,相当于数百份销售日志或数十份百页文档的信息量。Claude Enterprise与GitHub代码托管平台原生集成,并提升了使用限制,以更好地处理完整代码库。 在安全性方面,Claude Enterprise提供单点登录、基于角色的权限和管理工具,确保企业数据和团队安全。此外,Anthropic承诺Claude不会利用用户的对话或内容来训练AI,并将在未来几周推出审计日志和SCIM(跨域身份管理系统)。 尽管Claude Enterprise能够处理大量信息,但企业仍需谨慎,避免过分依赖其对大型文档的精确处理,因为大型语言模型可能出现“中间丢失”现象,即忽视文档中间的信息或过分强调开头的内容。具体的定价信息需要直接联系Anthropic公司获取。 #智谱AI近日完成了新一轮融资,投前估值达到200亿元,领投方为中关村科学城公司。这是智谱在2024年的第三笔融资,股东包括高瓴资本、美团和阿里等知名机构。 在近期,智谱AI在KDD 2024大会上发布了新一代基础模型,并免费开放了GLM-4-Flash API。此外,智谱还与手机品牌荣耀签署了战略合作协议,旨在共同探索端侧AI智能体验。智谱专注于大规模预训练模型及自然语言处理技术的研发。
- Daily-AI | 9.04 | MiniMax不藏了,大秀视频/语音/文本全模态模型家族
- Daily-AI | 9.03 | 清华系 AI 公司无问芯穹完成近 5 亿元 A 轮融资,投资方含联想创投、小米等
0:00 韩国警方将调查 Telegram 涉嫌放任“深度伪造”造成性犯罪的行为 1:40 消息称苹果、OpenAI 成为台积电 A16 制程首批客户 3:05 微软副总裁 Vik Singh:AI 聊天机器人需“学会求助”而非“制造幻觉” 4:16 陶哲轩力荐,哈佛反向学习法火了:教会AI就是教会自己 5:36 又有AI创始人卖身大厂!带走25%员工留下空壳,为吴恩达第一位博士生 6:53 大模型应用新战场:揭秘终端侧AI竞争关键|智在终端 8:58 清华系 AI 公司无问芯穹完成近 5 亿元 A 轮融资,投资方含联想创投、小米等 10:24 前Riot Games员工利用生成AI为新视频游戏中的NPC赋能 11:49 ‘情感人工智能’可能是商业软件的下一个趋势,这可能会带来问题 文字版 #韩国警方正在对即时通讯应用Telegram进行立案前调查,原因是该平台被指控放任使用深度伪造技术(Deepfake)制作并传播的性犯罪内容。这一决定是在韩国警察厅国家调查总部部长禹钟洙在例行记者会上宣布的,他表示,这项调查与首尔警察厅的行动相一致,旨在打击通过Telegram传播的虚假视频等犯罪行为。禹钟洙指出,虽然Telegram在合作上存在障碍,如不提供账户信息等调查资料,但这并不意味着犯罪无法被侦破。韩国警方正尽力调查,并计划与法国等国家和国际组织合作,以找到解决方案。 此次调查发起的背景包括Telegram创始人帕维尔·杜罗夫最近在法国被逮捕,理由是涉嫌放任和共谋在线性犯罪、毒品流通等犯罪活动。韩国“国家调查本部”透露,上月底,当地共收到涉及Deepfake和性犯罪的举报88起,锁定了24名犯罪嫌疑人。当前,警方还在调查8个通过深度伪造技术自动生成性剥削物的Telegram机器人(Bot),并广泛调查利用这些程序合成并传播内容的Telegram群组。 #台积电,全球领先的半导体制造公司,将于2026年下半年量产其最新的A16工艺,这一消息点燃了科技领域的热情。苹果和OpenAI,两大科技巨头,已成为该先进制程的首批客户,预示着未来科技发展的新方向。 A16工艺标志着一项重大技术突破,采用下一代Nanosheet纳米片GAA晶体管技术,首次应用Super Power Rail超级电轨背面供电解决方案,为高性能计算(HPC)产品提供了更高的效率和性能。这一制程技术的应用,将使得未来的电子设备在性能上有质的飞跃。 苹果,作为台积电的长期合作伙伴,其对首批产能的预定并不令人意外,而OpenAI的加入则显示了人工智能领域对高性能芯片的迫切需求。OpenAI在AI芯片领域的合作伙伴为博通、Marvell(美满电子)两大定制ASIC设计企业,预计其定制AI芯片将陆续在台积电3nm系列制程和未来的A16上投片生产。 随着A16工艺的量产,我们期待见证更多创新技术的诞生,推动科技界的持续进步。 #微软公司副总裁Vik Singh近日发表了对当前生成式人工智能(AI)的深刻见解,强调了AI聊天机器人在面对不确定答案时,应学会求助而非“制造幻觉”。这一观点在科技界引起了广泛关注。随着微软、谷歌等科技巨头纷纷投入生成式AI应用,例如ChatGPT和Gemini,这些AI能够按需生成内容,给用户一种“无所不知”的错觉。然而,这些应用有时会提供错误的答案,甚至是危险的信息,被称为“AI幻觉”。 Vik Singh坚信,解决这一问题的关键在于使聊天机器人能在不知道正确答案时,勇敢地承认并寻求帮助。与此同时,云端软件巨头Salesforce的首席执行官Marc Benioff也表达了对微软Copilot误导性表现的担忧,反映了行业对这一问题的普遍关注。 造成“AI幻觉”的根源在于训练数据的不准确、泛化能力的不足,以及数据采集过程中的副作用。 #数学大家陶哲轩推荐了一种新型的学习方法,称之为“哈佛反向学习法”,这种方法通过让学生尝试教AI解决数学问题,进而促进学生自身的学习和理解。这一创新教学法由哈佛应用数学和应用物理学教授Michael P. Brenner提出,他将这种方法应用于自己的课程中,鼓励学生在平时的作业中使用生成式AI工具箱中的聊天机器人来解决数学问题,并通过构建有效的提示词来教授这些机器人。 在这个过程中,学生需要将问题分解为小步骤,这不仅是对他们理解问题的一种锻炼,也能帮助他们掌握如何有效地使用提示词。期末时,学生们还需要让这些AI参与考试,来检验它们的学习成果。据Brenner教授介绍,这种方法不仅提高了学生解决问题的能力,还帮助他们在AI应用中学会提问,最终学生们构建了一个能够解决复杂数学问题的开箱即用的数学模型,并取得了不错的成绩。 这种反向学习法的实践表明,通过教会AI,学生们能够以一种新的方式理解和掌握知识。 #最近,亚马逊从机器人AI系统初创公司Covariant挖走了三名联创者——Pieter Abbeel、Peter Chen(陈曦)和Rocky Duan(段岩),这三位在创业之前均为OpenAI的研究员。特别地,Pieter Abbeel是强化学习领域的知名人物,也是吴恩达教授的第一位博士生。除了这三位联创者,还有四分之一的员工被亚马逊带走,公司研发的模型技术也被授权给了亚马逊。 此次人才和技术的转移,让外界对大厂收购初创公司的方式展开了讨论。一些人认为,通过挖角关键人物和技术,大厂实际上在进行变相的收购。Covariant并非个例,此前,包括谷歌、微软在内的科技巨头也有类似的操作,例如Transformer主要贡献者Noam Shazeer创立的Character.AI的核心团队被谷歌收归旗下。 随着核心人员和技术的离开,这些初创公司虽然名义上独立运营,但实际情况并不乐观,面对投资者的退投,以及运营压力的增加,这些公司的未来充满了不确定性。 #随着2024年进入最后一个季度,AI技术尤其是大模型的应用领域迎来新战场——终端侧AI竞争。业界共识认为,AI的真正价值在于其普惠性,这意味着没有实际应用场景,基础模型也将难以发挥价值。因此,从互联网大厂到手机制造商,各方都在寻求AI技术的“杀手级应用”。 重点关注的问题是如何在算力有限的终端设备上,如智能手机等,更流畅地部署AIGC(生成式AI)应用。高通作为在终端侧AI加速领域的领导者,与多家Android手机制造商深度合作,其技术的演示和论文在顶级学术会议如ICML和CVPR上受到广泛关注。 高通展示了在安卓手机上实现的多模态大模型(LLaVA)本地部署,以及音频驱动的3D数字人版AI助手,这些都预示着终端侧AI应用的新玩法和新可能即将走入大众生活。而背后的关键技术,如模型量化、编译优化和硬件加速等,都在推动着AI应用从云端向终端迁移。 高通的一系列技术创新不仅包括在已有模型上的优化,如通过量化感知训练(QAT)实现的INT4模型,能显著提高计算性能和内存效率,还包括针对特定应用需求的研究,如高效多视图视频压缩和针对终端侧AI的视频生成架构优化。 此外,高通AI软件栈的开发,旨在提升AI应用在各种智能终端上的兼容性和效率,使得大模型应用能更快地融入到我们的手机、汽车、XR设备、PC和物联网设备中。 #今日,清华系AI公司无问芯穹宣布成功完成近5亿元A轮融资,自成立以来1年4个月内,累计融资接近10亿元。本轮融资引领者为社保基金中关村自主创新专项基金(由君联资本管理)、启明创投以及洪泰基金。此外,跟投方包括联想创投、小米、软通高科等知名战略投资方,以及国开科创、上海人工智能产业投资基金(临港科创投担任管理人)、徐汇科创投等国资基金,还有顺为资本、达晨财智、德同资本、尚势资本、森若玉坤、申万宏源、正景资本等财务机构参与。 无问芯穹源自清华NICS-EFC实验室,该实验室自2008年成立,专注于电子工程领域的研究,并由无问芯穹的创始人、清华电子系主任汪玉领导。公司致力于AI技术的研发,今年7月,在世界人工智能大会AI基础设施论坛上,无问芯穹展示了其大规模模型的异构分布式混合训练系统,该系统的算力利用率高达97.6%,展示了公司在AI领域的强大实力和创新能力。 #Jam & Tea Studios,一家新兴的游戏初创公司,正在通过生成式人工智能(AI)技术改变玩家与视频游戏中非玩家角色(NPCs)的互动方式。该公司由来自Riot Games、Wizards of the Coast和Magic: The Gathering等知名游戏公司的资深人士创立,其首款游戏《Retail Mage》利用生成式AI工具,为玩家提供更自然、更多样化的游戏体验。在《Retail Mage》中,玩家扮演一位在魔法家具店工作的巫师,通过与AI NPC顾客的互动来完成任务,玩家可以自由地与NPC对话,甚至可以在游戏中创造物品。Jam & Tea Studios正与其他几家公司如Artificial Agency、Inworld和Nvidia竞争AI驱动的NPC领域。尽管生成式AI在NPC中的应用具有潜力,但也存在诸如AI不可预测性和回答错误等问题。公司表示,将通过持续改进AI引擎和玩家反馈来解决这些问题。Jam & Tea Studios已经完成了一轮315万美元的种子轮融资,并计划在今年晚些时候进行新一轮融资。《Retail Mage》预计将于今年秋季向公众发布。 #随着企业在各个领域尝试嵌入人工智能,一个意外的新趋势是公司利用AI帮助机器人更好地理解人类情感,这一领域被称为“情绪AI”。根据PitchBook的最新企业SaaS新兴技术研究报告,预测情绪AI技术将日益流行。情绪AI被看作是情感分析的更高级版本,它不仅分析文本,还通过视觉、音频等多种输入方式,结合机器学习和心理学,尝试在交互中检测人类情感。主要的AI云服务提供商如微软Azure的认知服务和亚马逊网络服务提供情绪AI功能。情绪AI的兴起与工作场所中机器人数量的增加有关,但同时,其准确性和隐私问题也引发了争议。尽管情绪AI技术并非全新,但随着机器人在工作场所的普及,它在商业世界中的应用前景比以往任何时候都要广阔。然而,情绪AI是否真的能够像人类一样理解情感,以及它是否会受到即将到来的AI法规的限制,仍有待观察。
- Daily-AI | 9.02 | 美国加州AI法案即将“转正”,科技圈炸锅
0:00 谷歌正在研发一种能够听到疾病迹象的AI 0:57 超越GPT-4o!阿里发布最强开源多模态模型Qwen2-VL,支持实时视频对话 2:17 美国加州AI法案即将“转正”,科技圈炸锅,担心伤害开发者 3:38 瑞典支付巨头 Klarna 计划裁掉一半员工:靠 AI 便可维系 5:15 国内运营商最大单集群智算中心在哈尔滨投用,可训练万亿参数大模型 6:41 米哈游蔡浩宇新 AI 公司曝光:挖 Llama 3 科学家坐镇大模型,图形学大佬、基础设施老将加入 8:00 Perplexity AI 搜索测试 PPLX 支付系统:网购仅需点 2 下 9:28 上线不到一年,Meta AI月活跃用户达4亿 10:48 格莱美CEO表示音乐行业也面临AI顾虑 11:41 GPT-4o mini排名雪崩,大模型竞技场规则更新,奥特曼刷分小技巧无效了 文字版 #谷歌正在利用人工智能技术进入疾病早期诊断领域。该公司已经训练了一个基础的AI模型,通过分析包含咳嗽、抽鼻子和呼吸困难等声音的3亿个音频片段,来识别例如结核病等病症。现在,谷歌与印度的呼吸健康AI初创公司Salcit Technologies合作,将这项技术整合到智能手机中,以便在医疗资源不足的地区帮助高风险人群。这并非谷歌首次尝试将人类感官数字化,其风险投资部门还支持了至少一家使用AI技术来“嗅探”疾病的初创公司。 #阿里巴巴发布了新一代多模态大模型Qwen2-VL,在图像和长视频理解任务上取得了突破性进展。该模型在多项指标上超越了GPT4V等闭源模型,展现出强大的综合能力。Qwen2-VL支持实时视频对话,能够读取摄像头或电脑屏幕进行交互。它还可以作为Agent与环境交互,自主操控手机等设备。 在多模态能力方面,Qwen2-VL可操纵机械臂进行物体操作,识别多种语言文本、手写字体和复杂数学公式。视频分析方面,它能处理20分钟以上的视频内容,支持总结和细节提问。 Qwen2-VL有2B、7B、72B三个版本,其中2B和7B已开源免费商用。创新之处包括支持原生动态分辨率和多模态旋转位置嵌入(M-ROPE),提升了模型的多模态处理和推理能力。这一突破为开源多模态大模型的发展树立了新的标杆,展现了人工智能在视觉语言理解和交互方面的最新进展。 #美国加州人工智能法案SB-1047即将成为正式法律,引发科技圈广泛争议。该法案要求具有一定规模的AI系统建立安全标准,若AI系统或基于其的产品给用户造成严重伤害,开发者需承担法律责任。法案规定,若AI系统造成人身伤害或财产损失,开发者可能面临高达业务总营收10%至30%的罚款。 科技巨头如OpenAI、谷歌等纷纷表示反对,担心法案会阻碍AI创新并迫使企业迁出加州。开源AI开发者尤其不满,认为法案要求他们对无法控制的用户行为负责。此外,法案中关于责任界定的模糊性也引发争议,可能给小型AI创企带来巨大风险。 然而,也有支持者如马斯克的xAI等,希望通过立法约束AI发展。目前,州长Newsom需在9月30日前决定是否签署该法案。无论结果如何,这项法案都可能对美国其他州乃至全球AI立法产生深远影响,引发了人们对AI监管与创新平衡的深思。 #瑞典支付巨头Klarna正计划大幅裁员,将员工人数从目前的3800人减少至2000人左右,这一决策背后的主要驱动力是人工智能技术的应用。Klarna首席执行官Sebastian Siemiatkowski表示,通过在客户服务和营销等领域使用AI,公司能够以更少的人力完成更多工作。 这一裁员计划是Klarna为上市做准备的一部分。该公司已经通过招聘冻结和自然减员开始缩减员工队伍。值得注意的是,Klarna在过去一年中已将员工人数从5000人减少到3800人,而这次裁员将进一步削减近一半的workforce。 Siemiatkowski强调,由于裁员和AI技术的应用,Klarna每名员工的平均年收入从一年前的约40万美元提高到了现在的70万美元(约合496.8万元人民币)。然而,他也表示AI导致的就业减少应该是政府需要关注的问题,而非企业的责任。 这一决策背景是Klarna在第二季度财报中净亏损大幅收窄,从去年同期的8.54亿瑞典克朗减少到1000万瑞典克朗。尽管如此,Klarna的估值仍从2021年的460亿美元高点跌至67亿美元,但公司希望通过这些措施在上市时实现150亿至200亿美元的估值。 #国内运营商最大单集群智算中心日前在哈尔滨正式投产使用,这一中国移动智算中心的建成标志着我国在人工智能基础设施领域取得重大突破。该中心以其单集群算力规模最大、国产化网络设备组网规模最大等特点引人注目。 这座智算中心采用了100%国产AI芯片,首次通过国产网络设备探索1.8万张智算卡单集群部署规模上限。它可提供每秒690亿亿次半精度浮点运算的智能算力,融合分级存储容量达150P。中心还创新应用了GSE1.0、天池SDN等多项中国移动自主研发技术。 智算中心通过先进的智算网络技术,将上万块GPU芯片像"积木"一样拼接在一起,大幅提升了GPU节点间的通信效率,使数据训练完成时间缩短20%。这一超级算力集群能够满足万亿参数大模型的训练要求,为人工智能领域的发展提供了强大的硬件支持。 此次智算中心的投产使用,不仅展示了中国在AI基础设施建设方面的实力,也为未来大规模AI应用和研究奠定了坚实基础。 #米哈游创始人蔡浩宇的新AI公司Anuttacon近期引发业界关注。该公司旨在利用AI为游戏玩家创造前所未有的体验,突破互动娱乐的界限。公司注册地与米哈游新加坡总部Hoyoverse在同一地址,主要在旧金山湾区招聘,在圣克拉拉设有办事处。 Anuttacon已吸引多位业界大牛加盟。微软亚洲研究院25年元老、计算机图形学专家童欣担任研究合伙人。前Meta高级研究科学家吴箫剑负责大模型研究团队。前字节跳动高级研究科学家Yunzhe Tao也加入从事大模型应用。此外,米哈游基础设施专家叶理灯和前B站直播负责人王宇阳也在团队中。 蔡浩宇近期发表"暴论"称AIGC已彻底改变游戏开发,大部分从业者可考虑转行。他认为AI时代游戏行业将走向两极分化,只有顶级团队的作品和个人自制游戏能存活。Anuttacon的成立似乎印证了蔡浩宇对AI改变游戏行业的判断,也显示出他对AI领域的野心。 #AI搜索网站Perplexity正在测试一项名为PPLX的内部支付系统,旨在简化用户的网购体验。这个新系统在Perplexity的Discover信息流中展示产品卡片,不仅提供产品摘要,还包含"通过PPLX购买"的选项。 这种创新的购物方式类似于联盟营销模式,Perplexity可通过引导用户购买产品来获取佣金。用户首次使用时需填写支付信息,之后只需点击两下即可完成购物,无需离开当前页面,大大提高了购物效率。 Perplexity成立于2022年8月,获得了包括OpenAI和Meta内部AI负责人在内的投资。该公司并未自主研发大语言模型,而是选择对GPT-3.5等现有模型接口进行微调,致力于打造一个无广告的"AI版谷歌搜索"。 值得一提的是,NVIDIA CEO黄仁勋曾在今年3月表示,他几乎每天都在使用Perplexity,这无疑为该平台带来了不小的关注度。随着PPLX支付系统的引入,Perplexity正在探索将AI搜索与电子商务相结合的新途径,可能会为用户带来更加便捷的在线购物体验。 #Meta AI自推出以来迅速成长为全球领先的AI助手之一,月活跃用户已达4亿,日活跃用户4000万。这款AI助手已被整合到Facebook、Instagram、WhatsApp和Messenger等Meta旗下多个平台,并推出了独立网站。 Meta AI由Llama 3.1-405B模型驱动,具备强大的推理能力,特别是在数学和编程方面。Meta CEO扎克伯格雄心勃勃,计划在2024年投入高达400亿美元用于AI基础设施建设,希望年底前超越ChatGPT成为"使用最广泛的AI助手"。 然而,Meta AI的推广策略也引发了一些争议。部分用户抱怨其在应用中的推广方式过于激进,如在搜索栏添加AI功能导致误触等。Meta已针对用户反馈进行了一些调整,以提升用户体验。 尽管Meta AI发展迅速,但要赶超ChatGPT仍面临挑战。OpenAI最新数据显示,ChatGPT周活跃用户已超2亿,是去年的两倍。Meta将继续优化产品,努力实现其雄心勃勃的目标。 #格莱美奖组织者Harvey Mason Jr. 宣布,该奖项将接受使用人工智能创作音乐的作品,但仅限人类提交。此举引发了音乐行业对AI技术在音乐创作中角色的广泛讨论。一些人担心AI可能取代人类艺术家,而其他人则对AI带来的创新持乐观态度。Mason强调,尽管AI可以辅助创作,但格莱美奖旨在庆祝人类创造力。他参与发起了“人类艺术运动”,旨在为AI使用设立更多保护措施,并支持相关立法,如ELVIS法案,以保护艺术家的声音不被未经授权使用。同时,他也关注AI技术在音乐行业中的公平使用,确保艺术家得到适当的认可和报酬。 #大模型竞技场规则最近进行了重大更新,这一变化对多个知名AI助手的排名产生了显著影响。新规则旨在更准确地反映模型解决问题的实际能力,而非仅仅是输出的风格和形式。 OpenAI的GPT4o mini受到的冲击最为明显,其排名从之前的榜首位置骤降至前十名之外。同样,马斯克的Grok-2系列和谷歌的Gemini-1.5-flash小模型也出现了明显的排名下滑。相比之下,Anthropic的Claude系列和Meta的Llama-3.1-405b等大模型的得分有所上升。 这次规则调整主要针对AI回答的长度、格式排版等特征进行了降权处理。此前,一些模型通过增加小标题数量、美化排版等方式来讨好用户、提高排名,但这些技巧在新规则下已经失效。 Lmsys组织(即大模型竞技场的运营方)采用了统计学中的Bradley-Terry回归方法,将回答长度、markdown小标题数量等因素纳入考虑,以更好地区分模型的实际能力和输出风格。 这一变化引发了业内的广泛讨论。许多用户认为新的排名更符合他们的主观体验,同时也有观点认为这种评估方法与模型开发商之间的博弈有助于推动整个AI领域的进步。 总的来说,这次规则更新标志着大模型评估正朝着更加科学、客观的方向发展,有望为用户和开发者提供更有价值的参考标准。
- Daily-AI | 8.30 | 千亿美元AI巨无霸即将诞生!曝OpenAI洽谈数十亿美元融资
0:00 比GPU性价比高百倍!Cerebras推出新AI推理服务,号称“全球最快” 1:51 谷歌将重新开放 Gemini 生成人物图像功能,此前因“种族描述不当”引争议 3:12 陶哲轩最新演讲:AI时代,数学研究将进入前所未有的规模 4:05 AI 图像生成公司 Midjourney 宣布进军硬件领域,苹果前硬件经理加盟 5:35 马斯克 AI 公司 xAI 被指未经许可在数据中心使用燃气涡轮机,污染空气质量 7:00 千亿美元AI巨无霸即将诞生!曝OpenAI洽谈数十亿美元融资 8:28 Meta专心搞AI!将关停第三方AR工作室 9:58 谷歌推世界首个 AI 游戏引擎 GameNGen:0 代码生成《毁灭战士》,有望颠覆 2000 亿美元产业 文字版 #人工智能芯片独角兽公司Cerebras Systems推出了全新的AI推理服务Cerebras Inference,号称"全球最快"。该服务在速度和性价比方面表现突出,对AI行业可能产生重大影响。 Cerebras Inference服务由公司自主研发的第三代晶圆级芯片WSE-3提供支持。与英伟达GPU相比,WSE-3的内存带宽高达21PB/s,是前者的7000倍。在推理速度上,Cerebras声称比基于英伟达GPU的解决方案快20倍,同时价格仅为GPU的1/5,性价比提升了100倍。 该服务提供三个层级:免费层、开发者层和企业层,以满足不同规模用户的需求。值得一提的是,Cerebras在整个推理过程中保持16位精度,确保高速的同时不牺牲模型精度。 Cerebras还与Docker、LangChain等多家公司建立战略合作,共同构建AI应用生态系统。这一举措旨在为开发者提供从模型训练到部署的一站式服务。 尽管Cerebras在性能和价格上颇具竞争力,但在生态系统成熟度、模型支持广度和市场认知度方面,英伟达仍占优势。随着AI推理市场持续增长,Cerebras的创新可能会推动整个行业向更高效、更经济的方向发展。 #谷歌即将重启旗下AI模型Gemini的人物图像生成功能,此前因种族描述争议而暂停。新版功能将首先向Gemini Advanced英语用户和企业客户开放,预计在未来几天内上线。 谷歌产品管理高级总监戴夫·西特伦表示,公司在人物描绘方面取得了重大进展,通过技术改进、评估集优化和红队练习等措施提升了功能质量。然而,他也坦言每张生成的图像可能仍有瑕疵,公司将持续听取用户反馈并不断改进。 为避免此前争议重演,新版功能将限制用户创建逼真图像、可识别个人、未成年人形象以及血腥、暴力或色情场景。这些限制旨在平衡创新与责任,确保AI技术的健康发展。 今年2月,Gemini因生成的历史人物图像出现不符史实的种族描述而引发争议,随后谷歌紧急叫停该功能。此次重启标志着谷歌在AI伦理与技术平衡方面迈出了重要一步,也凸显了大型科技公司在推进AI技术时所面临的挑战与责任。 #陶哲轩最新演讲中表示,人工智能正在改变数学研究的方式和规模。他指出,借助AI技术,未来数学家可以同时处理1000个问题,以前所未有的规模进行数学研究。陶哲轩详细介绍了机器辅助计算的历史演变,以及当前AI在数学领域的三大应用:证明助手、机器学习和大语言模型。他强调,虽然AI还无法直接解决复杂的数学问题,但在辅助人类研究方面发挥着越来越重要的作用,如生成有价值的猜想、发现不同数学对象之间的联系等。陶哲轩认为,未来数学家仍需以传统方式证明定理,但AI工具将极大地扩展研究的广度和深度,开启数学研究的新纪元。 #知名AI图像生成公司Midjourney正式宣布进军硬件领域,引发业界广泛关注。该公司近日在社交媒体上发布招聘信息,寻求人才加入其新成立的硬件部门。值得注意的是,Midjourney创始人David Holz拥有丰富的硬件经验,曾担任Leap Motion的首席技术官。 更令人瞩目的是,Midjourney成功招募了前苹果公司硬件经理Ahmad Abbas加盟。Abbas在苹果工作五年,参与了备受关注的Vision Pro头显研发,这一背景为Midjourney的硬件计划增添了不少想象空间。 虽然Midjourney尚未透露具体的硬件产品类型,但公司表示目前有多个项目正在进行中,并强调"肯定有更多形态的可能性"。这一动向表明,作为AI领域的领先企业,Midjourney正积极探索AI技术与硬件设备的融合,有望为用户带来全新的AI驱动硬件体验。 随着AI技术的快速发展,越来越多的科技公司开始将目光投向AI硬件领域。Midjourney此次跨界之举,不仅展现了公司的雄心,也预示着AI与硬件融合的新趋势正在加速到来。业界普遍期待Midjourney能够凭借其在AI图像生成领域的优势,推出令人耳目一新的硬件产品。 #马斯克旗下AI公司xAI因环保问题再次引发争议。该公司在田纳西州孟菲斯市的数据中心被指在未获得必要许可的情况下使用燃气涡轮机,导致当地空气质量恶化。南方环境法律中心向当地环保部门发出警告,称xAI安装了近20台燃气涡轮机,总容量约100兆瓦,足以为5万户家庭供电,但似乎未申请任何空气许可证。 环保组织呼吁当地卫生部门核实情况并采取执法行动,强调这些涡轮机排放大量气体,进一步恶化了孟菲斯本已糟糕的空气质量。值得注意的是,马斯克曾将该数据中心称为"世界上最强大的AI训练集群",用于训练xAI的Grok AI模型。 xAI成立于去年,今年5月估值已超240亿美元,被视为OpenAI、谷歌等AI巨头的有力竞争者。然而,这次环保争议可能会给公司带来负面影响,也引发了人们对AI发展与环境保护之间平衡的思考。此事再次凸显了科技创新在追求突破的同时,也应当充分考虑社会责任和可持续发展的重要性。 #千亿美元AI巨头即将诞生!OpenAI正在洽谈一轮数十亿美元的新融资,估值有望突破1000亿美元大关。据《华尔街日报》报道,美国风投公司Thrive Capital将领投约10亿美元,微软也可能参与其中。这将是OpenAI自2023年1月获得微软100亿美元投资以来的最大一笔外部融资。 OpenAI目前年化收入达34亿美元,但为了保持在生成式AI领域的领先地位,公司需要持续投入巨资。仅开发GPT4模型就花费了超过1亿美元,下一代模型的成本预计更高。这笔新融资将为OpenAI实现通用人工智能的雄心壮志提供关键支持。 尽管与微软的关系日益复杂,但双方合作依然牢固。微软持有OpenAI 49%的利润分成权,可能会继续投资。与此同时,OpenAI也在拓展新的合作伙伴,如与苹果合作开发iPhone的AI功能。 随着谷歌、Meta等科技巨头和众多AI初创公司加入竞争,OpenAI需要巨额资金来维持其在AI领域的领先地位。这轮融资将为OpenAI注入强劲动力,助力其在激烈的AI竞争中继续领跑。 #Meta公司宣布将于2025年1月14日关闭其第三方AR创作平台Meta Spark,并将资源全力转向AI领域。Meta Spark是该公司2017年推出的增强现实制作和发布平台,允许第三方开发者为Facebook、Instagram和Messenger等应用创建AR特效。 关闭后,平台上的第三方AR效果将被移除,包括计算机生成的滤镜、面具和3D物体等。然而,Meta自身的AR效果仍将在其社交平台上提供。公司表示,未来将把资源投入到"下一代体验"的开发中,可能包括眼镜等新形态产品。 这一决定反映了Meta优先考虑AI产品和元宇宙投资的战略调整。今年5月,该公司已宣布关闭Workplace应用程序,进一步聚焦AI和元宇宙领域。 此举引发AR创作者的失望,他们正在寻找替代方案,如Snapchat的Lens Studio或Unity平台。尽管如此,用户仍可使用现有的第三方AR效果卷轴或故事,但无法再访问Meta Spark Studio和Hub中的文件。 这一变化标志着Meta进一步收缩非核心业务,全力押注AI和元宇宙技术,以期在下一代互联网革命中占据先机。 #谷歌推出全球首个AI游戏引擎GameNGen,实现零代码生成《毁灭战士》游戏,有望颠覆2000亿美元游戏产业。GameNGen是一个完全由神经模型驱动的游戏引擎,能在单个TPU上以每秒20帧的速度生成实时可玩的游戏。该技术不仅可以减少游戏开发时间和成本,还可能使游戏创作民主化,让小型工作室和个人创作者也能创造出复杂的互动体验。 GameNGen的模拟质量令人惊叹,在人工评估中,60%的1.6秒和3.2秒游戏片段被误认为是真实游戏。这种技术不仅适用于游戏领域,还可能在虚拟现实、自动驾驶汽车和智能城市等行业带来变革。 然而,GameNGen也面临一些挑战,如需要更大算力来运行图形密集度更高的游戏,以及目前仅针对特定游戏量身定制。尽管如此,它为未来游戏开发和交互式体验开辟了新的可能性,标志着我们正进入一个由AI驱动创造力的新时代。
- Daily-AI | 8.29 | 奥特曼招人查自家员工,“GPT-5”要来了:新旗舰模型曝光
0:00 谷歌发布 3 款 Gemini 实验 AI 模型:1.5 Pro 冲榜第二、1.5 Flash 从第 23 蹿升至第 6 1:29 大脑存在内部“世界模型”,快速眼动睡眠期间就会运行 2:45 奥特曼招人查自家员工,“GPT-5”要来了:新旗舰模型曝光,“草莓”或将秋季上线 3:59 AI 威胁菲律宾外包呼叫中心,5 年内或取代 30 万个岗位 5:17 零一万物回应核心成员加入字节跳动:公司正进行架构调整,使业务更聚焦 6:37 美国加州通过人工智能训练数据透明度法案,要求企业披露 AI 模型数据来源 8:04 就离谱!AI马斯克深夜直播,引万人在线围观打赏 9:51 亚马逊被曝 10 月发布 Alexa AI 订阅版:月费 10 美元,梳理、汇总用户感兴趣的信息流 11:15 Anthropic 向所有 Claude 用户开放 Artifacts AI 功能 12:38 消息称 OpenAI 正开发“草莓”项目:前身为神秘 Q * 算法,最快今年秋季推出 13:58 马斯克力挺加州 AI 安全法案,OpenAI 曾公开反对 文字版 #谷歌近日发布了三款Gemini实验性AI模型,展现了其在人工智能领域的持续创新。其中,Gemini 1.5 Pro实验版本表现尤为亮眼,在LMSYS排行榜上一举冲至第二名,仅次于OpenAI的GPT4。 另一款新模型Gemini 1.5 Flash也有显著进步,在LMSYS排名从第23位跃升至第6位。此外,谷歌还推出了参数量为80亿的小型模型Gemini 1.5 Flash-8B,专门针对多模态任务进行了优化。 值得注意的是,这些模型已通过Google AI Studio和Gemini API向开发者开放使用。从9月3日起,谷歌将把旧版Gemini 1.5 Pro的请求自动重定向到新版本,并在平台中移除旧版本。 这次发布不仅展示了谷歌在AI模型性能上的突破,也反映出科技巨头之间在AI领域的激烈竞争。随着AI技术的快速发展,我们可以期待更多创新应用在不久的将来涌现。 #近日,加州大学旧金山分校的两位神经科学家发表了一项引人注目的研究,揭示了大脑在快速眼动(REM)睡眠期间运行内部"世界模型"的惊人发现。研究表明,即使在睡眠状态下,大脑也会模拟与外界的互动,表现出与清醒时类似的脑活动模式。 实验重点关注了小鼠大脑中的上丘和丘脑前背侧核两个区域。结果显示,REM睡眠中上丘的活动与清醒状态极为相似,仍在发出类似于清醒时的运动指令。更令人惊讶的是,尽管动物保持静止,大脑中的头部方向内部表征仍在发生变化,呈现出"虚拟头部转动"的现象。 研究人员推测,这种模拟可能依赖于大脑内部的模型,而非外部感觉反馈。这一发现不仅为我们理解睡眠和梦境提供了新的视角,还可能解释人类在REM睡眠期间的一些认知活动。这项研究引发了学界的广泛讨论,有学者认为这种自由模拟的能力可能是我们在睡眠状态下进行创造性思维和梦境生成的基础。 #OpenAI新一代旗舰模型即将亮相,代号"猎户座",被认为是GPT4的继任者。与此同时,神秘模型"草莓"也有望于今年秋季推出。据悉,"草莓"不仅能解决复杂的数学推理和编程问题,还被用来为"猎户座"生成高质量的训练数据。这种合成数据的使用有望减少AI模型的"幻觉"问题。 值得注意的是,OpenAI正在招聘"技术内部风险调查员",职责包括检测和分析潜在的内部威胁,这被解读为公司正在加强内部控制。这一举动让人联想起GPT4发布前的类似操作,暗示新模型的推出可能已经临近。 与此同时,OpenAI内部也出现了一些变动。据前员工透露,曾专注于超强AI长期风险的安全团队近半数成员已经离职。这一消息引发了对公司AI安全策略的关注和讨论。 随着新模型的开发和即将发布,AI领域的竞争态势可能将再次升温,业界对OpenAI的下一步动作充满期待。 #菲律宾外包呼叫中心行业面临人工智能的巨大挑战。据外包咨询公司Avasant估计,未来5年内,菲律宾可能有多达30万个业务流程外包岗位被AI取代。这对菲律宾经济影响重大,因为外包行业是当地私营部门最大的就业来源和GDP贡献者。 然而,AI也带来了机遇。预计可能创造多达10万个新岗位,如AI训练和数据管理等。许多公司正积极拥抱这一技术变革,将AI工具整合到现有业务中。例如,有公司利用ChatGPT培训新员工,将培训时间从90天缩短到1个月。 尽管如此,变革带来的焦虑已经显现。一些员工担心失业,而政府和行业正努力通过培训计划来提高员工技能。然而,也有观点认为菲律宾可能未做好充分准备来应对这一冲击。 总的来说,AI正在重塑菲律宾的外包行业。虽然短期内可能造成就业动荡,但长远来看,适应这一变革可能是保持竞争力的关键。行业未来将更多依赖于高技能人才和AI协作,而非单纯的人力成本优势。 #人工智能初创公司零一万物近期传出了核心成员加入字节跳动的消息,引发业界关注。对此,零一万物官方回应称,公司正在进行架构调整,以使业务更加聚焦。他们表示,已有来自国内外的顶尖模型训练和产品高阶负责人到岗履职,进一步落实"模应一体"战略。 零一万物成立于2023年5月,由原百度元宇宙负责人马杰担任副总裁,核心团队来自多家科技巨头。今年5月,公司推出了生产力工具"万知",展现了其在AI领域的探索。 与此同时,字节跳动方面否认了成立独立"大模型研究院"的传闻,但承认公司有加强大模型相关研究的长期计划。知情人士透露,原零一万物核心成员黄文灏已加入字节团队,负责技术项目管理和规划。 这一人才流动反映了AI领域的激烈竞争,也凸显了大型科技公司对AI人才的渴求。零一万物表示将继续专注于"模应一体"战略,并暗示即将推出新的产品和解决方案,展现了初创公司在AI浪潮中寻求突破的决心。 #美国加州立法机构近日通过了一项颇具争议的"人工智能训练数据透明度法案",该法案将提交给州长加文·纽瑟姆审批。这项由议员雅克·欧文提出的法案(AB 2013)主要针对生成式人工智能,如OpenAI开发的ChatGPT等能够生成文本、图像和类似内容的AI模型。 法案要求AI公司在开发和训练模型时,必须更加透明地披露其使用的数据集信息,包括数据来源、类型和处理方式等关键细节。这一举措旨在加强数据隐私保护,防止数据滥用,并帮助公众更好地理解AI技术。 然而,该法案也引发了业界担忧。一些人认为,过于严格的透明度要求可能会对企业的商业机密和技术创新产生不利影响。尽管如此,这项法案的通过仍然标志着政府在AI监管方面迈出了重要一步,反映了公众对AI技术发展的关注和期待。 随着AI技术的快速发展和广泛应用,如何在保护隐私、促进创新和维护公共利益之间取得平衡,将成为未来AI治理的重要课题。加州作为全球科技创新中心,此次立法无疑将对全球AI行业产生深远影响。 #深夜直播引发轰动!一位酷似马斯克的年轻主播在网上吸引了上万名观众,甚至还与粉丝进行了实时连麦互动。这位"20多岁的马斯克"不仅模仿火箭发射手舞足蹈,还捏脸卖萌自证身份。然而,这并非真人马斯克,而是利用最新的Deepfake深度伪造技术制作的AI版本。 这一事件引发了人们对AI技术发展的惊叹和担忧。有网友感慨,曾经只存在于科幻概念中的深度换脸技术如今已成为现实。与此同时,也有人对AI发展速度之快、真假难辨的现状表示忧虑。 事实上,这类AI换脸技术正变得越来越成熟。目前GitHub上已有相关开源项目获得了3万多星标,只需一张照片就能实现换脸直播。除了直播,还有人利用这项技术制作了马斯克的TikTok视频,内容包括在车内演唱和推广特斯拉汽车。 然而,这种技术的普及也带来了新的风险。据报道,已有诈骗分子利用AI制作马斯克宣传投资的视频,导致一位82岁的美国退休老人损失了69万美元。调查显示,马斯克出现在近四分之一的深度伪造诈骗视频中,其中90%与加密货币相关。 面对这一挑战,一些平台已开始采取措施。例如,YouTube更新了政策,要求创作者披露AI使用情况,并禁止欺诈和篡改视频。尽管如此,假视频仍然层出不穷,凸显了AI时代内容真实性验证的重要性和难度。 #亚马逊即将推出一款名为"Remarkable Alexa"的全新AI订阅服务,预计于今年10月正式发布。这项服务每月收费10美元,约合71.2元人民币,旨在为用户提供更智能、个性化的信息服务。 "Remarkable Alexa"的核心功能是帮助用户梳理、汇总和探索感兴趣的资讯内容。它将分析用户的兴趣爱好,生成定制化的新闻流,这一功能被称为"Smart Briefing"。这意味着用户将能够更轻松地获取到与自己相关的重要信息,无需在海量资讯中费时寻找。 值得注意的是,这项服务是亚马逊内部代号为"Project Banyan"项目的成果。它不仅仅是对现有Alexa功能的升级,更是亚马逊进军AI竞争领域的重要一步。通过这一举措,亚马逊显然是希望在日益激烈的AI市场中占据一席之地,与其他科技巨头展开竞争。 对于消费者来说,这意味着他们将有机会体验更加智能、个性化的虚拟助手服务。然而,这也引发了人们对AI隐私和数据使用的关注。随着AI技术的不断发展,如何在提供便利服务的同时保护用户隐私,将成为科技公司面临的重要挑战。 #AI公司Anthropic宣布向所有Claude用户开放Artifacts功能,这是一项重要的AI创新。Artifacts功能可以在iOS和安卓版Claude应用中使用,它创建了一个动态工作区,让用户能够实时查看、迭代和创建AI生成的内容。 自今年6月推出预览版以来,用户已创建了数千万个Artifacts。这项功能极大地提高了工作效率,简化了工作流程。无论是开发人员、产品经理、设计师、营销人员还是销售团队,都可以利用Artifacts快速将想法转化为现实。 例如,开发人员可以绘制代码架构图,产品经理可以创建交互式原型,设计师可以快速制作可视化原型,营销人员可以设计包含性能指标的仪表板,而销售团队则可以可视化销售管道并获得预测见解。 Artifacts的开放标志着AI辅助创作工具进入了一个新阶段,它不仅提高了个人工作效率,还增强了团队协作的能力。这一功能的普及可能会对各行各业的工作方式产生深远影响,推动AI在日常工作中的应用进一步普及。 #OpenAI正在开发一个代号为"草莓"的神秘AI项目,这可能是人工智能领域的一次重大突破。据The Information报道,这个项目的前身是名为Q*的算法,最快可能于今年秋季推出。"草莓"项目的目标是增强OpenAI模型的推理能力,特别是在处理复杂的科学和数学问题方面。 据悉,"草莓"能够解决它以前从未遇到过的数学问题,这是现有AI系统难以实现的feat。虽然它主要针对编程问题进行训练,但据称能够回答任何技术方面的问题。更令人惊叹的是,它不仅能生成查询答案,还能提前规划,以便自主、可靠地浏览互联网,进行OpenAI所定义的"深度研究"。 OpenAI已经在今年夏天向美国国家安全官员展示了这项技术,显示出其潜在的重要性。如果"草莓"项目如期在今年秋季推出,它很可能会作为ChatGPT的一部分,为用户提供更强大的AI助手服务。这一进展标志着AI技术向着更高级的推理和问题解决能力迈进了一大步,可能会在科研、教育等多个领域带来革命性的变化。 #特斯拉和xAI首席执行官埃隆·马斯克近日表态支持加州AI安全法案SB 1047,这一立场与OpenAI等AI公司形成鲜明对比。该法案旨在对AI行业实施更严格的监管,要求开发成本至少1亿美元的大型AI模型必须报告安全问题并提交风险评估报告。 马斯克在社交平台X上发文称,尽管这是一个艰难的决定,可能会让一些人感到沮丧,但他认为加州应该通过这项法案。他强调,20多年来一直倡导对AI进行监管,就像监管任何对公众有潜在风险的产品或技术一样。 值得注意的是,OpenAI(一家领先的AI研究公司)此前公开反对该法案,认为它可能会威胁加州的未来增长,拖慢创新步伐,并赶走优秀的工程师和企业家。斯坦福大学教授李飞飞和前百度首席科学家吴恩达等AI领域知名人士也对该法案表示反对。
- Daily-AI | 8.28 | 智谱 AI 宣布 GLM-4-Flash 大模型免费开放:支持 26 种语言
0:00 消息称字节成立大模型研究院,“氪金”招揽 AI 人才 1:11 Llama3.1根本卖不动!业内人士:开源模型成本反而更高 2:12 iPhone 16最全猛料!史上最大屏、独享AI大招,按键又增加了…… 3:14 太难了!谷歌系AI创业者大撤退 4:34 8岁女孩玩转AI编程,45分钟打造聊天机器人,Karpathy都看呆了 5:51 防止黑客重建人脸,浙大 & 阿里推出人脸隐私保护新方案 FaceObfuscator 6:46 智谱 AI 宣布 GLM-4-Flash 大模型免费开放:支持中文、英语、日语、韩语等 26 种语言 8:12 陈天桥与《科学》杂志联手,3万美元悬赏AI驱动科学研究,获奖论文发Science 9:33 马斯克展示特斯拉新超级计算机“Cortex”,仍未完全准备就绪 11:00 Anthropic 公开 Claude AI 模型的系统提示词 12:18 3分钟千人被裁,IBM中国大败退 13:42 苹果被曝另起炉灶,独立于 Siri 为桌面机器人开发拟人个性化 AI 文字版 #字节跳动正在秘密筹备成立大模型研究院,并积极招揽人才。据报道,已有外部AI专家加入该研究院,直接向公司创始人张一鸣汇报。这一举措标志着字节在AI领域的战略升级,不同于以往主要依靠内部人才的做法,新研究院将大手笔从外部招募顶尖人才。去年8月,字节推出了自研底层大模型"云雀"和AI对话产品"豆包"。今年5月,公司又发布了"豆包大模型"家族,并在定价上发起了挑战。目前,原面壁智能和零一万物的核心成员已加入字节大模型团队。这一系列动作表明,作为中国互联网巨头的字节跳动正全力以赴地投入AI大模型领域的竞争,试图在这场技术革命中占据有利位置。 #Meta开源大模型Llama 3在市场上遇冷,难以获得企业客户青睐。据报道,在亚马逊AWS平台上,企业更倾向于使用Anthropic的闭源模型Claude。微软内部人士也透露,Llama并非其销售首选。百度智能云AI与大模型平台总经理忻舟表示,开源模型虽然免费,但在实际应用中总体成本可能更高。他指出,大模型应用涉及"技术+服务"的完整解决方案,企业需要计算总账。忻舟认为,开源模型更适合学术研究,而非大型商业项目。在严肃的商业项目中,闭源模型仍是主角。这一现象凸显了开源大模型在商业化过程中面临的挑战,也反映出企业在选择AI模型时更注重效果、性能、安全和价格等因素,而非单纯考虑开源与否。 #苹果即将于9月10日凌晨1点召开秋季发布会,iPhone 16系列将成为焦点。新机型预计将有多项升级:Pro系列屏幕尺寸增大至6.3英寸和6.9英寸;标准版摄像头布局改为垂直排列;全系列搭载"操作按钮",并新增"拍摄按钮";搭载新一代A18芯片,配备升级版神经引擎。AI功能方面,部分尖端功能可能仅限iPhone 16使用。此外,新机还将采用三星高性能M14 OLED面板,Face ID系统可能大改造。AirPods系列也将迎来更新,包括两个价位的AirPods 4和可能的AirPods Max 2。Apple Watch方面,或推出十周年纪念款,Ultra系列更新平淡。这次发布会被视为苹果首款AI iPhone的登场,从硬件到软件都将被AI重构。 #多家谷歌系AI创企近期陷入经营困境,不少创始人选择离开自己创办的企业或回归大厂。上周六,法国AI创企H的创始团队分裂,3名来自谷歌DeepMind的联合创始人出走。今年已有至少5家谷歌系AI创企传出寻求收购的消息,包括Inflection AI、Adept、Character.AI等。另有5家创企可能面临资金问题,成为大厂潜在收购对象。 这些创企面临多重挑战:创始人多为科研背景,缺乏创业经验;AI开发成本高昂,需要持续融资或快速盈利;去年的盲目投资热潮助长了一些准备不足的创业项目。如今,投资热潮消退,这些创企不得不另谋出路。 一些大型科技公司如微软、亚马逊、谷歌等通过变相收购方式,获取这些创企的技术和人才。虽然部分创始人因此成为亿万富翁,但对风投机构而言,回报率可能微乎其微。未来可能会有更多AI创业者选择回归大厂,但这些创企的实际价值和估值仍有待商榷。 #AI编程工具Cursor正在引发编程界的革命。一个8岁女孩利用Cursor在45分钟内搭建了一个聊天机器人,这一壮举获得了180万人的在线围观,连OpenAI创始成员Karpathy都对此赞叹不已。Cursor是由4名MIT学霸创办的Anysphere公司开发的AI代码编辑器,被誉为"迄今为止最好的AI代码编辑器"。 Cursor支持多个AI模型,包括GPT4和Claude 3.5 Sonnet,能通过与大模型对话生成代码。它的独特功能如光标位置预测和多行编辑,大大提高了编程效率。目前,Cursor的流量已超过GitHub Copilot,用户数量超过30000家。 Anysphere公司最近完成了6000万美元融资,估值达到4亿美元。值得一提的是,虽然OpenAI是Cursor的主要投资方,但Cursor默认使用的是Anthropic的Claude模型,因为效果更好。随着Cursor的走红,据传国内已有对标项目立项,AI编程工具市场竞争或将进一步加剧。 #浙江大学与阿里安全部联手推出新型人脸隐私保护方案FaceObfuscator,有效防止黑客从人脸特征重建原始人脸图像。该方案通过删除人脸图像中的冗余视觉信息,并利用随机性干扰人脸特征到图像的逆映射,从根源上防御重构攻击。实验表明,FaceObfuscator能有效保护人脸隐私,同时保持高精度人脸识别。与其他方案相比,它具有强隐私保护、高精度识别和高效运行三大优势。该技术可广泛应用于监控识别、刷脸支付、门禁考勤等场景,助力解决人脸隐私安全难题。这项研究成果已发表于安全领域顶级会议USENIX Security Symposium 2024。 #智谱AI宣布免费开放GLM-4-Flash大模型,这是一款适用于简单垂直、低成本、需要快速响应的任务的AI模型。GLM-4-Flash具备多项先进功能,包括多轮对话、网页浏览、函数调用和长文本推理等,支持最大128K上下文。该模型支持26种语言,包括中文、英语、日语和韩语等。 GLM-4-Flash的生成速度高达72.14 token/s,约等于每秒115个字符。智谱AI通过多种技术创新,如自适应权重量化、并行化和投机采样等,显著提升了模型的效率和性能,同时降低了推理成本。在预训练方面,GLM-4-Flash使用了10T高质量多语言数据,是ChatGLM3-6B模型数据量的3倍以上。 该模型现已通过智谱AI大模型开放平台向公众免费开放,用户可以通过官方提供的体验地址和API文档进行试用和开发。这一举措将为AI应用开发者和研究人员提供更多可能性,推动人工智能技术的普及和创新。 #陈天桥携手《科学》杂志推出"AI驱动科学大奖",悬赏3万美元奖励AI赋能科研的青年科学家。该奖项面向全球征集1000字论文,聚焦于利用AI技术在自然科学领域取得突破性进展的研究者。获奖者不仅将获得丰厚奖金,还将有机会在《科学》杂志上发表论文。 天桥脑科学研究院创始人雒芊芊表示,这一低门槛的申报形式旨在鼓励更多青年科学家参与。陈天桥本人对AI驱动科学充满期待,希望未来诺贝尔奖得主中能涌现更多AI科学家,甚至AI本身有朝一日也能成为科学大奖得主。 作为全球最大私人脑科学研究机构之一,研究院近年来在AI+科学领域布局日益深入。陈天桥呼吁关注"甘于寂寞"的AI科学家,并透露研究院正在建设服务AI人才的社区,未来将通过多种形式持续招募和扶持致力于科学研究的AI人才。 此次大奖不仅彰显了AI对科研的巨大推动作用,也为青年科学家提供了难得的国际舞台,有望激发更多AI驱动的科学创新。 #特斯拉CEO埃隆·马斯克展示了公司新的超级计算机"Cortex",这台计算机有望成为全球最大的超级计算机之一。然而,目前Cortex尚未完全准备就绪。马斯克表示,这个项目对特斯拉至关重要,特别是在公司近年来将重点转向人工智能领域的背景下。 据报道,特斯拉原计划在8月前在得州超级工厂建成一个100兆瓦的计算集群,以配合其机器人出租车项目。马斯克透露,公司最终计划将集群扩大到超过500兆瓦,并使用一半英伟达处理器和一半自家的AI硬件。特斯拉的目标是利用这种强大的计算能力来训练神经网络,以实现长期承诺的自动驾驶功能。 虽然马斯克发布了展示Cortex一小部分的视频,但知情人士透露,该集群目前正在使用临时冷却系统,需要等到冷水机组完工后才能完全投入运行。此外,特斯拉还需要更多的网络馈线。有人预计,该集群可能要到10月才能完全准备就绪,这与特斯拉机器人出租车项目的新发布时间相吻合。 这一超级计算机项目凸显了特斯拉在人工智能和自动驾驶领域的雄心,也反映了高性能计算在推动AI技术发展中的关键作用。 #Anthropic公司近日公开了其Claude AI模型的系统提示词,这一举措在AI行业引发关注。系统提示词是人工智能模型的重要组成部分,用于设定对话背景、提供指导和规定规则。通常情况下,AI公司会对系统提示词保密,以防止不良用户绕过安全防护。 Anthropic此举旨在塑造自身更道德、更透明的企业形象。该公司已在Claude iOS和Android应用程序以及网页版上公布了最新模型(Claude 3.5 Opus、Sonnet和Haiku)的系统提示。Anthropic开发者关系负责人亚历克斯・艾伯特表示,公司计划在未来更新和微调系统提示的过程中定期公布相关信息。 这一决定反映了AI行业在透明度和道德方面的新趋势。通过公开系统提示词,Anthropic不仅展示了自身的技术实力,也为用户提供了更多了解AI运作机制的机会。这可能会推动整个行业朝着更加开放和负责任的方向发展,同时也为AI安全和伦理问题的讨论提供了新的素材。 #IBM中国研发业务全线关闭,标志着一个时代的落幕。在一次仅持续三分钟的全员会议上,IBM全球企业系统开发部副总裁Jack Hergenrother宣布了这一决定,涉及IBM中国开发中心(CDL)和IBM中国系统中心(CSL)两大业务线,影响约一千多名员工。 IBM表示将研发工作转移至海外其他基础设施基地,但仍会继续在中国提供技术咨询和销售服务,重点转向服务中国民营企业和部分在华跨国公司。受影响员工将获得N+3的赔偿方案。 这一决策与IBM全球范围内的"劳动力再平衡"战略相呼应。今年早些时候,IBM已在全球裁员3400人,并计划在未来五年内用人工智能取代8000个岗位。同时,公司正加大对AI领域的投资,如推出WatsonX平台和设立5亿美元的AI创投基金。 IBM进入中国市场已有数十年历史,曾在人工智能、云计算等前沿领域做出重要贡献。此次撤离标志着蓝色巨人在中国最具竞争力市场的时代落幕,也反映出全球科技格局的变迁。 #苹果正在独立于 Siri 开发新一代拟人个性化 AI。据彭博社记者马克・古尔曼报道,苹果公司正在为其未来的桌面机器人和其他设备开发一种全新的 AI 界面,这个项目独立于现有的语音助手 Siri。 这个新的 AI 系统将采用生成式人工智能技术,旨在创造更具个性化的用户体验。虽然苹果已宣布在即将推出的 iOS 18 系统中引入 Apple Intelligence 功能,整合类似 ChatGPT 或 Gemini 的 AI 能力,但这个新项目似乎更进一步,专注于打造独特的拟人化个性。 目前,关于这个项目还存在诸多未知,例如它与 Siri 的关系、采用的具体技术,以及最终的品牌定位等。考虑到苹果首个机器人项目预计要到 2026 年或 2027 年才会亮相,这个全新的 AI 系统可能还需要相当长的时间才能与公众见面。 这一举措显示出苹果在 AI 领域的野心,以及其对未来人机交互方式的全新构想。通过开发更具个性化的 AI 系统,苹果似乎正在为下一代智能设备和用户体验铺平道路。
- Daily-AI | 8.27 | “AI程序员”疯狂揽金:20个月,融资近10亿美元
0:00 商汤科技:元萝卜 AI 下棋机器人“国际象棋专业版”9 月下旬上市 1:23 “AI程序员”疯狂揽金:20个月,融资近10亿美元 2:40 《大都会》预告片风波:虚假影评人引言系 AI 生成 4:09 消息称 AI 大牛吴恩达将辞去 LandingAI 公司 CEO 一职 5:14 “并购狂魔”英伟达 6:35 三星宣布将 Bixby 语音助手引入 BESPOKE AI 家电,语音控制更智能 7:58 索尼旗下工作室顽皮狗拥抱 AI,正招聘相关人才 文字版 #商汤科技旗下家用机器人品牌"元萝卜"宣布推出 AI 下棋机器人"国际象棋专业版",预计于 9 月下旬正式上市。这款机器人针对国际象棋立体棋子的特点,设计了肩部、肘部、小臂和爪子四个自由度的灵活结构,具备 0.5 毫米的极高精度和稳定度,能够精准抓取各种形状的棋子。相比此前推出的象棋版和围棋版,国际象棋版在机械臂设计上有了重大突破,可以应对更复杂的棋局操作。 作为商汤科技在家用 AI 机器人领域的又一力作,元萝卜 AI 下棋机器人系列不断扩展,从最初的中国象棋版,到围棋版,再到如今的国际象棋版,体现了商汤在人工智能与传统文化结合方面的持续探索。这些产品不仅可以陪伴用户学习下棋,还能锻炼思维、保护视力,甚至进行专业等级评测,展现了 AI 技术在教育娱乐领域的广阔应用前景。 #AI编程工具正在成为生成式AI领域的"杀手级应用",吸引了大量投资和用户。根据英国《金融时报》报道,自2023年1月以来,AI编程辅助工具行业已吸引了9.06亿美元投资。GitHub Copilot等工具用户数量激增,目前拥有近200万付费用户,超过77000个机构采用。 这些工具显著提高了软件开发效率,有企业报告生产力提升20-35%。麦肯锡分析称AI对软件工程生产力的直接影响可能相当于当前年支出的20%-45%。许多资深开发者已将AI编程工具整合到日常工作流中,不仅提高效率,还激发创意。 然而,专家认为AI工具是强大助手而非替代品。软件架构设计等高层次思考仍需人类完成。未来,软件工程所需技能或将转向代码和架构设计。有公司甚至表示将停止雇用不会使用AI编程的人,凸显了AI编程工具在行业中日益重要的地位。 #备受瞩目的科幻电影《大都会》(Megalopolis)近日因其预告片中的虚假影评人引言引发争议。经调查证实,这些虚假引言是由人工智能(AI)生成的。预告片在发布数小时后被撤下,负责宣传材料的负责人 Eddie Egan 也因此被撤职。 调查显示,这些引言并非有意伪造,而是 AI 生成的结果。这些虚假内容声称是影评人对导演弗朗西斯·福特·科波拉过往作品的负面评价,例如将《教父》称为"松散、自恋的电影",将《现代启示录》称为"一部史诗级的垃圾"。然而,事实恰恰相反,这些评论原本对这些电影给予了高度赞扬。 此事件再次凸显了 AI 生成内容的局限性。AI 系统虽能生成流畅、自信的文本,但往往缺乏事实准确性。类似的问题已在多个领域引发争议,如法律文件中出现不存在的案例,以及音乐人因律师提交 AI 生成的结案陈述而败诉等。 这一事件提醒我们,在使用 AI 生成内容时需要保持警惕,特别是在涉及事实性信息的场合。同时,它也反映出人们对 AI 能力的认知还有待提高,以避免过度依赖或误用 AI 技术所带来的潜在风险。 #AI界知名学者吴恩达即将卸任其创立的计算机视觉平台LandingAI的CEO职务,转任执行董事长一职。这位曾在谷歌大脑、Coursera和百度等科技巨头任职的AI大牛,今年4月刚被任命为亚马逊董事会成员。业内分析认为,此次职位调整可能意味着吴恩达将把精力转向投资领域。他的AI基金会最近宣布计划再筹集1.2亿美元资金,约合8.55亿元人民币。作为深度学习领域的领军人物,吴恩达1976年出生于英国伦敦,拥有卡耐基梅隆大学和麻省理工学院的学位,并在加州大学伯克利分校获得博士学位。他还是DeepLearning.AI的创始人,以及斯坦福大学的客座教授。此次职务变动反映了AI行业领袖的战略重心转移,或将对全球AI发展格局产生深远影响。 #英伟达正以"并购狂魔"的姿态快速扩张其技术版图。过去25年间,英伟达至少收购了27家企业,其中19笔具有重大战略意义的收购勾勒出英伟达全栈式的扩展蓝图。 近期英伟达的收购步伐明显加快,过去4个月以每月1家的速度收购AI和数据中心相关企业。这些收购涵盖了从软件到硬件的全栈技术,旨在为客户提供端到端解决方案,降低总拥有成本和运营成本。 英伟达的收购策略经历了三个阶段:早期专注于3D图形领域,中期尝试进军移动市场,近期则重点布局AI、数据中心和云计算。其中2019年以69亿美元收购Mellanox是英伟达历史上最大规模的收购,为其数据中心业务的高速增长奠定了基础。 通过持续收购,英伟达不断拓展CUDA生态系统的优势,同时针对性地补强数据中心业务。软硬件兼顾的策略和对端到端解决方案的追求,正让英伟达的技术护城河不断加宽、加深,巩固其在AI和高性能计算领域的领先地位。 #三星宣布将其人工智能驱动的语音助手 Bixby 引入 BESPOKE AI 系列家电产品。这一升级后的语音助手具备理解上下文的能力,可以处理包含多个命令的自然语言指令,记忆之前的对话内容,并获取设备相关信息。Bixby 将扩展至多款家电,包括 Bespoke AI Combo、Bespoke AI Family Hub 冰箱、Bespoke AI Steam 吸尘器和 Bespoke AI Wind-Free Gallery 空调。 用户可以通过简单的语音指令来控制多个设备,例如同时设置空调温度和安排洗衣时间。Bixby 还能回答连续的问题,如询问本月节能情况和电费情况。此外,Bixby 还整合了各种家电的用户手册信息,可为用户提供使用技巧和故障排除指导。 三星还将生成式人工智能技术引入 BESPOKE AI Family Hub 冰箱,新增的生成式壁纸功能可创建自定义背景,这项功能此前首次亮相于 Galaxy S24 系列智能手机。这些升级旨在为用户提供更智能、更便捷的家电使用体验,进一步提升三星在智能家居领域的竞争力。 #索尼旗下知名游戏工作室顽皮狗正在积极拥抱人工智能技术,并开始招聘相关人才。近期发布的招聘信息显示,顽皮狗正在寻找一名动画程序员,负责开发可供AI、设计师和脚本使用的动画系统。这一举动表明,尽管工作室负责人Neil Druckmann此前声称索尼误解了他关于AI的言论,但顽皮狗实际上正在推进AI工具的开发。 AI技术目前是游戏行业的热门话题。今年早些时候,Druckmann曾表示AI将"彻底改变内容的创作方式",并可以"降低成本和技术障碍"。然而,AI在游戏中的应用也引发了争议。最近,美国演员工会SAG-AFTRA宣布罢工,其中一项重要诉求就是保护演员权益,防止AI在游戏中的过度使用。演员们担心AI可能会取代他们的工作。 顽皮狗此次招聘动画程序员的举动,反映出游戏行业正在积极探索AI技术的应用,以提高开发效率和创新能力。但同时,如何平衡技术创新与从业者权益,将是行业面临的重要课题。