AI编码新范式:从Vibe Coding到Vibe Engineering
近日,多位资深开发者在接受访谈时表示,尽管AI辅助编程日益普及,但他们并未完全依赖AI生成全部代码,而是更倾向于使用代码补全、Chat/Ask等交互模式。
有观点指出,“Vibe Coding”(凭感觉编程)是一种不负责任的软件构建方式——像掷骰子一样生成代码,却不在乎其质量。而真正高效的做法是“Vibe Engineering”,即由顶尖工程师负责任地使用AI工具来加速开发工作。
重磅发布:DeepCode——从论文到完整软件的全自动AI工具
一款名为DeepCode的全自动AI开发工具引发关注。它能根据一篇论文或产品需求,自动完成写代码、测试、文档撰写的整条开发流水线,特别适合研究人员快速复现算法,或产品经理快速生成Demo。
核心功能与技术亮点:
- Paper2Code:读取论文并提取算法,生成可复现的代码+测试+文档
- Text2Web:自动生成前端界面
- Text2Backend:自动生成后端服务
- 采用多智能体协作,模拟完整软件开发团队
- 结合向量检索与图谱分析,从海量代码库中智能选择最佳实现
- 支持MCP(Model Context Protocol),无缝集成外部工具
- 具备高效内存机制,可管理大规模项目上下文,确保逻辑连贯
该项目支持网页与CLI操作,最终交付完整的项目包,包含测试用例与说明文档,极大提升研发效率。
惊人发现:对AI越粗鲁,回答越准确?
一项研究显示:向AI提问时,语气越粗鲁,回答准确率越高!
研究人员使用ChatGPT的Deep Research功能,针对数学、科学、历史等领域的50道多项选择题,用5种不同语气提问。结果发现:
- 整体准确率随语气“粗鲁化”而提升
- “最粗鲁”比“最客气”准确率高出约4个百分点
- 表现最差的是“过于客气”的语气
- 趋势一致:越不礼貌,模型越准确
虽然原因尚不明确,但这一现象挑战了“礼貌提问更有效”的传统认知,值得进一步研究。
Claude最新System Prompt曝光:近30K Token,工具定义占大头
Anthropic近日公开了Claude-Sonnet-4.5的官方system prompt,长达2743行,近30K token,揭示了通用AI聊天应用的底层设计逻辑。
核心内容解析:
- 工具功能定义为主:最大占比为各类工具接口定义,包括:
- Web搜索(web_search, web_fetch)
- Google Drive文档操作
- Gmail邮件读取
- Google Calendar事件管理
- 历史对话检索 - 行为准则简洁精炼:强调避免奉承、不盲目认同用户、指出错误与不足,跳过“这是个好问题”等客套话
Meta大模型团队膨胀:Llama3贡献者达236+318人
有网友统计Meta从Llama1到Llama3的论文贡献者人数:
这一数字反映出GenAI领域“大力出奇迹”的研发趋势,也引发对“人力堆砌是否可持续”的讨论。作者表示更期待Meta的开放权重模型能搅动行业格局。
小模型新王者:Qwen 3 Instruct 2507 Unsloth登顶本地SOTA
在最新更新的gpu-poor-llm-arena榜单中,Qwen 3 Instruct 2507 Unsloth (30B, 4-bit) 成为32B以下小模型的新王者,无论是综合排名还是Elo加权排名均位列第一。
Elo榜单对小模型更友好(越小越占优),因此该成绩意味着它在本地部署场景下已成SOTA。作者表示自己已在本地用该模型处理数据清洗和定时任务。
论文速递:无需微调,提升大模型智能的新方法
斯坦福新论文提出“代理式上下文工程”(Agent-based Context Engineering)——一种更高效的上下文管理方法。
传统方法在上下文过长时会压缩信息,而新方法则像人类阅读长文档一样,通过持续整理笔记,智能决定保留或删除哪些内容。实验显示,相比普通GPT-4 Agent,性能提升10.6%。
其他值得关注的AI动态
- AI生成动漫OP:有用户分享使用Sora 2生成动漫片头的方法,并可通过上传首帧图片控制风格。
- Claude Agent SDK:开发者基于此构建类似v0.dev的Coding Agent,输入提示词即可生成网页并实时预览,预计下周开源。
- AI恶搞引警方关注:美国青少年用Snapchat AI生成“家中流浪汉”照片吓父母,引发大量报警,警方警告此举浪费警力且危险。
- Hugging Face限制Pro用户公共存储:此前无限量的公共存储空间开始设限,引发用户讨论。
引用来源:
- MapleShaw - Vibe Engineering
- AIGCLINK - DeepCode介绍
- 小互 - AI越粗鲁越准
- karminski-牙医 - Llama团队人数
- karminski-牙医 - Claude System Prompt
- karminski-牙医 - 小模型竞技场
- karminski-牙医 - 代理式上下文工程
- 宝玉 - Claude Agent SDK应用
- The Verge - AI恶搞报警事件
- Hugging Face - Early Experience论文
- Hugging Face - MM-HELIX-100K论文
- Hugging Face - MemMamba论文
