AI Buzzwords EP.79 下一代模型的商业化能力远超预期?小平的IO

AI Buzzwords EP.79 下一代模型的商业化能力远超预期?

49分钟 ·
播放数0
·
评论数0

本次分享围绕网络安全、AI 公司招聘与策略、技术进展、模型训练、AI 安全、企业任务管理等多个领域展开讨论,分享了行业最新动态和研究成果,为参会者提供了全面的行业信息。内容如下:

  • 网络安全形势犯罪增长情况:AI 网络犯罪呈激增态势,年增长率达 1.5%,从 2025 年 11 月到 12 月期间讨论增加 1500 倍。这表明黑客发现了全栈自动攻击方法,导致犯罪活动增多。
    软件供应链攻击:近期发生多起软件供应链攻击事件,如 Axio 库被攻击。该库是广泛使用的 HTTP 访问库,黑客可利用其创建诱饵、负载等,企业需检查程序依赖中 Axio 库版本在 1.141 等范围内的情况,及时整改。
    防御挑战与对策:去年漏洞公开后多在一天内被利用,企业安全防护压力巨大,需依靠 AI 进行防御。
    AI 网络犯罪激增
    攻击手段转变
    :攻击手段从传统的社会工程学(如冒充老板骗财务密码)转变为获取人类信任和身份,这对安全领域既是机遇也是挑战。
  • AI 公司招聘与策略AI 成功工程师等岗位:AI 成功工程师面向企业内部 AI 转型,合作伙伴 AI 部署工程师、AI 解决方案架构师等岗位需求增加,智谱等公司也有相关需求。
    强化学习岗位:强化学习相关岗位是亮点,包括强化学习算法和强化学习环境构建岗位,如全局强化学习环境工程师。
    OpenAI 与 DeepMind 布局硬件:OpenAI 有 21 个定制芯片相关开放岗位,DeepMind 与 xreal 合作做眼镜,两家都在招聘机器人相关岗位,可能在研发有灵巧手的人形机器人。
    Anthropic 依赖外部合作:Anthropic 几乎没有硬件相关岗位,通过专门岗位与外部合作伙伴共同监督数据中心设计和建设,以获取稳定算力支持。
    招聘比例变化:OpenAI、Anthropic 等 AI 公司销售岗招聘猛增,OpenAI 从 18%涨到 28%,Anthropic 从 17%到 31%,尤其集中在帮助客户将 AI 应用到企业的技术岗位,如前向部署工程师。
    背后策略考量:这意味着这些公司可能发现下一代模型有巨大商业机会,先加强销售体系建设,再推出重磅模型以提高市场占有率。
    销售岗位招聘猛增
    不同公司硬件策略差异
    新兴岗位需求
  • 技术进展与应用量化模型:有公司将模型量化到 1 比特,可在低算力边缘设备上运行,如 PRISM 公司的 1B 模型性能不错。
    其他模型:Holo3 模型在 CUA 类项目中表现出色;微软的 five 4 模型在科研类场景效果较好;北大的 Echo 模型用于炒股预测;Google 的 Times FM 模型通过添加 skills 可用于时序数据预测;Gemini3.1 Flash live 多模态模型可语音输入,能现生成应用。
    Tellus 芯片:Tellus 将大模型硬编码到芯片上,功耗低、效率高。可运行千问 27B 模型,速度达 10000 TPS,甚至能达到 15000 - 16000 TPS,成本仅几百刀。
    数据存储新方式:将数据刻在玻璃里,玻璃具有防水、防火、防尘等特点,可保存一万年。该技术克服了快速大规模读数据的难点,通过显微镜和相机读取数据。
    NVIDIA Dynamo:NVIDIA Dynamo 到 1.0 版本,集成推理引擎和 KV CACHE 优化技术,能加快推理速度,已渗透到字节、美团、腾讯云等大企业,是算力中心全栈解决方案提供者。
    模型进展
  • 模型训练成本不同公司成本占比:OpenAI、Minimax 和智谱 AI 最后一轮训练算力成本占研发支出比例不同,OpenAI 不到 10%,Minimax 接近 20%多,智谱占百分之十几。
    成本占比与公司地位:研究认为离前沿较远的公司最后一轮训练成本占比应更大,Minimax 符合预期,智谱不完全符合追赶假说。

  • AI 安全与可解释性评测 AI 操纵人类方法:有研究提出评测 AI 对人类操纵的方法,将操纵分为有意说服和有害操纵(PUA),AI 在健康相关话题操纵效果最差。
    供应链攻击风险:Axio 库被朝鲜黑客攻击,包含远程访问木马,企业需检查程序依赖版本。
  • 企业任务管理多程任务概念:提出 Multi - horizon task(MHTES)多程任务概念,更贴近企业实际场景,考验不同 agent 间任务转手和多任务负载下的任务完成能力。
    传统 agent 问题:传统 agent 在多任务情况下准确率急降,Cropgen 引入多层规划等方法。
    微软 Cropgen
    微软 UFO 项目:旨在解决任务在不同设备间分配问题,使任务能在合适平台环境下运行,目前该领域设计较少。
  • Claude code 分析源码泄露影响:Claude code 源码泄露后被放到 IPFS 上,难以撤销,且向操作系统层面演进,能分析用户情绪和使用习惯。
    数据遥测问题:Claude code 遥测范围超过 copilot 定义,大量用户使用数据被传到服务器,企业需关注员工使用情况。
    开发特点:CC 未用自家 SDK,直接调 API,内部工程师可根据统计数据指引系统开发功能方向。
  • 开源项目合规:该项目可帮助企业合规使用开源项目,避免版权问题,通过模型重写开源代码,利好信创。
  • 后续工作计划下周分享:下周将分享一些有意思的小 AI 实验室,如 Adenlab 等,以及相关应用案例。
    建议尝试:建议在工作中使用 CC 跑 Autoresearch 优化机器学习算法;关注利用 AI 做彭博终端的开源项目;考虑出海电商纯 AI 化的可能性。