AI编码、论文转代码、粗鲁提问更准？本周科技前沿速递

AI编码新范式：从Vibe Coding到Vibe Engineering

近日，多位资深开发者在接受访谈时表示，尽管AI辅助编程日益普及，但他们并未完全依赖AI生成全部代码，而是更倾向于使用代码补全、Chat/Ask等交互模式。

有观点指出，“Vibe Coding”（凭感觉编程）是一种不负责任的软件构建方式——像掷骰子一样生成代码，却不在乎其质量。而真正高效的做法是“Vibe Engineering”，即由顶尖工程师负责任地使用AI工具来加速开发工作。

重磅发布：DeepCode——从论文到完整软件的全自动AI工具

一款名为DeepCode的全自动AI开发工具引发关注。它能根据一篇论文或产品需求，自动完成写代码、测试、文档撰写的整条开发流水线，特别适合研究人员快速复现算法，或产品经理快速生成Demo。

核心功能与技术亮点：

Paper2Code：读取论文并提取算法，生成可复现的代码+测试+文档

Text2Web：自动生成前端界面

Text2Backend：自动生成后端服务

采用多智能体协作，模拟完整软件开发团队

结合向量检索与图谱分析，从海量代码库中智能选择最佳实现

支持MCP（Model Context Protocol），无缝集成外部工具

具备高效内存机制，可管理大规模项目上下文，确保逻辑连贯

该项目支持网页与CLI操作，最终交付完整的项目包，包含测试用例与说明文档，极大提升研发效率。

惊人发现：对AI越粗鲁，回答越准确？

一项研究显示：向AI提问时，语气越粗鲁，回答准确率越高！

研究人员使用ChatGPT的Deep Research功能，针对数学、科学、历史等领域的50道多项选择题，用5种不同语气提问。结果发现：

整体准确率随语气“粗鲁化”而提升

“最粗鲁”比“最客气”准确率高出约4个百分点

表现最差的是“过于客气”的语气

趋势一致：越不礼貌，模型越准确

虽然原因尚不明确，但这一现象挑战了“礼貌提问更有效”的传统认知，值得进一步研究。

Claude最新System Prompt曝光：近30K Token，工具定义占大头

Anthropic近日公开了Claude-Sonnet-4.5的官方system prompt，长达2743行，近30K token，揭示了通用AI聊天应用的底层设计逻辑。

核心内容解析：

工具功能定义为主：最大占比为各类工具接口定义，包括：
- Web搜索（web_search, web_fetch）
- Google Drive文档操作
- Gmail邮件读取
- Google Calendar事件管理
- 历史对话检索

行为准则简洁精炼：强调避免奉承、不盲目认同用户、指出错误与不足，跳过“这是个好问题”等客套话

Meta大模型团队膨胀：Llama3贡献者达236+318人

有网友统计Meta从Llama1到Llama3的论文贡献者人数：

Llama1:14人

Llama2:68人

Llama3:236+318人（论文作者+工程贡献者）

这一数字反映出GenAI领域“大力出奇迹”的研发趋势，也引发对“人力堆砌是否可持续”的讨论。作者表示更期待Meta的开放权重模型能搅动行业格局。

小模型新王者：Qwen 3 Instruct 2507 Unsloth登顶本地SOTA

在最新更新的gpu-poor-llm-arena榜单中，Qwen 3 Instruct 2507 Unsloth (30B, 4-bit) 成为32B以下小模型的新王者，无论是综合排名还是Elo加权排名均位列第一。

Elo榜单对小模型更友好（越小越占优），因此该成绩意味着它在本地部署场景下已成SOTA。作者表示自己已在本地用该模型处理数据清洗和定时任务。

论文速递：无需微调，提升大模型智能的新方法

斯坦福新论文提出“代理式上下文工程”（Agent-based Context Engineering）——一种更高效的上下文管理方法。

传统方法在上下文过长时会压缩信息，而新方法则像人类阅读长文档一样，通过持续整理笔记，智能决定保留或删除哪些内容。实验显示，相比普通GPT-4 Agent，性能提升10.6%。

其他值得关注的AI动态

AI生成动漫OP：有用户分享使用Sora 2生成动漫片头的方法，并可通过上传首帧图片控制风格。

Claude Agent SDK：开发者基于此构建类似v0.dev的Coding Agent，输入提示词即可生成网页并实时预览，预计下周开源。

AI恶搞引警方关注：美国青少年用Snapchat AI生成“家中流浪汉”照片吓父母，引发大量报警，警方警告此举浪费警力且危险。

Hugging Face限制Pro用户公共存储：此前无限量的公共存储空间开始设限，引发用户讨论。

引用来源：

MapleShaw - Vibe Engineering

AIGCLINK - DeepCode介绍

小互 - AI越粗鲁越准

karminski-牙医 - Llama团队人数

karminski-牙医 - Claude System Prompt

karminski-牙医 - 小模型竞技场

karminski-牙医 - 代理式上下文工程

宝玉 - Claude Agent SDK应用

The Verge - AI恶搞报警事件

Hugging Face - Early Experience论文

Hugging Face - MM-HELIX-100K论文

Hugging Face - MemMamba论文