AI Buzzwords EP.79 下一代模型的商业化能力远超预期？

本次分享围绕网络安全、AI 公司招聘与策略、技术进展、模型训练、AI 安全、企业任务管理等多个领域展开讨论，分享了行业最新动态和研究成果，为参会者提供了全面的行业信息。内容如下：

网络安全形势犯罪增长情况：AI 网络犯罪呈激增态势，年增长率达 1.5%，从 2025 年 11 月到 12 月期间讨论增加 1500 倍。这表明黑客发现了全栈自动攻击方法，导致犯罪活动增多。
软件供应链攻击：近期发生多起软件供应链攻击事件，如 Axio 库被攻击。该库是广泛使用的 HTTP 访问库，黑客可利用其创建诱饵、负载等，企业需检查程序依赖中 Axio 库版本在 1.141 等范围内的情况，及时整改。
防御挑战与对策：去年漏洞公开后多在一天内被利用，企业安全防护压力巨大，需依靠 AI 进行防御。
AI 网络犯罪激增
攻击手段转变：攻击手段从传统的社会工程学（如冒充老板骗财务密码）转变为获取人类信任和身份，这对安全领域既是机遇也是挑战。

AI 公司招聘与策略AI 成功工程师等岗位：AI 成功工程师面向企业内部 AI 转型，合作伙伴 AI 部署工程师、AI 解决方案架构师等岗位需求增加，智谱等公司也有相关需求。
强化学习岗位：强化学习相关岗位是亮点，包括强化学习算法和强化学习环境构建岗位，如全局强化学习环境工程师。
OpenAI 与 DeepMind 布局硬件：OpenAI 有 21 个定制芯片相关开放岗位，DeepMind 与 xreal 合作做眼镜，两家都在招聘机器人相关岗位，可能在研发有灵巧手的人形机器人。
Anthropic 依赖外部合作：Anthropic 几乎没有硬件相关岗位，通过专门岗位与外部合作伙伴共同监督数据中心设计和建设，以获取稳定算力支持。
招聘比例变化：OpenAI、Anthropic 等 AI 公司销售岗招聘猛增，OpenAI 从 18%涨到 28%，Anthropic 从 17%到 31%，尤其集中在帮助客户将 AI 应用到企业的技术岗位，如前向部署工程师。
背后策略考量：这意味着这些公司可能发现下一代模型有巨大商业机会，先加强销售体系建设，再推出重磅模型以提高市场占有率。
销售岗位招聘猛增
不同公司硬件策略差异
新兴岗位需求

技术进展与应用量化模型：有公司将模型量化到 1 比特，可在低算力边缘设备上运行，如 PRISM 公司的 1B 模型性能不错。
其他模型：Holo3 模型在 CUA 类项目中表现出色；微软的 five 4 模型在科研类场景效果较好；北大的 Echo 模型用于炒股预测；Google 的 Times FM 模型通过添加 skills 可用于时序数据预测；Gemini3.1 Flash live 多模态模型可语音输入，能现生成应用。
Tellus 芯片：Tellus 将大模型硬编码到芯片上，功耗低、效率高。可运行千问 27B 模型，速度达 10000 TPS，甚至能达到 15000 - 16000 TPS，成本仅几百刀。
数据存储新方式：将数据刻在玻璃里，玻璃具有防水、防火、防尘等特点，可保存一万年。该技术克服了快速大规模读数据的难点，通过显微镜和相机读取数据。
NVIDIA Dynamo：NVIDIA Dynamo 到 1.0 版本，集成推理引擎和 KV CACHE 优化技术，能加快推理速度，已渗透到字节、美团、腾讯云等大企业，是算力中心全栈解决方案提供者。
模型进展

模型训练成本不同公司成本占比：OpenAI、Minimax 和智谱 AI 最后一轮训练算力成本占研发支出比例不同，OpenAI 不到 10%，Minimax 接近 20%多，智谱占百分之十几。
成本占比与公司地位：研究认为离前沿较远的公司最后一轮训练成本占比应更大，Minimax 符合预期，智谱不完全符合追赶假说。

AI 安全与可解释性评测 AI 操纵人类方法：有研究提出评测 AI 对人类操纵的方法，将操纵分为有意说服和有害操纵（PUA），AI 在健康相关话题操纵效果最差。
供应链攻击风险：Axio 库被朝鲜黑客攻击，包含远程访问木马，企业需检查程序依赖版本。

企业任务管理多程任务概念：提出 Multi - horizon task（MHTES）多程任务概念，更贴近企业实际场景，考验不同 agent 间任务转手和多任务负载下的任务完成能力。
传统 agent 问题：传统 agent 在多任务情况下准确率急降，Cropgen 引入多层规划等方法。
微软 Cropgen
微软 UFO 项目：旨在解决任务在不同设备间分配问题，使任务能在合适平台环境下运行，目前该领域设计较少。

Claude code 分析源码泄露影响：Claude code 源码泄露后被放到 IPFS 上，难以撤销，且向操作系统层面演进，能分析用户情绪和使用习惯。
数据遥测问题：Claude code 遥测范围超过 copilot 定义，大量用户使用数据被传到服务器，企业需关注员工使用情况。
开发特点：CC 未用自家 SDK，直接调 API，内部工程师可根据统计数据指引系统开发功能方向。

后续工作计划下周分享：下周将分享一些有意思的小 AI 实验室，如 Adenlab 等，以及相关应用案例。
建议尝试：建议在工作中使用 CC 跑 Autoresearch 优化机器学习算法；关注利用 AI 做彭博终端的开源项目；考虑出海电商纯 AI 化的可能性。