AI编码、论文转代码、粗鲁提问更准?本周科技前沿速递

AI编码、论文转代码、粗鲁提问更准?本周科技前沿速递

5分钟 ·
播放数1
·
评论数0

AI编码新范式:从Vibe Coding到Vibe Engineering

近日,多位资深开发者在接受访谈时表示,尽管AI辅助编程日益普及,但他们并未完全依赖AI生成全部代码,而是更倾向于使用代码补全、Chat/Ask等交互模式。

有观点指出,“Vibe Coding”(凭感觉编程)是一种不负责任的软件构建方式——像掷骰子一样生成代码,却不在乎其质量。而真正高效的做法是“Vibe Engineering”,即由顶尖工程师负责任地使用AI工具来加速开发工作。

重磅发布:DeepCode——从论文到完整软件的全自动AI工具

一款名为DeepCode的全自动AI开发工具引发关注。它能根据一篇论文或产品需求,自动完成写代码、测试、文档撰写的整条开发流水线,特别适合研究人员快速复现算法,或产品经理快速生成Demo。

核心功能与技术亮点:

  • Paper2Code:读取论文并提取算法,生成可复现的代码+测试+文档
  • Text2Web:自动生成前端界面
  • Text2Backend:自动生成后端服务
  • 采用多智能体协作,模拟完整软件开发团队
  • 结合向量检索与图谱分析,从海量代码库中智能选择最佳实现
  • 支持MCP(Model Context Protocol),无缝集成外部工具
  • 具备高效内存机制,可管理大规模项目上下文,确保逻辑连贯

该项目支持网页与CLI操作,最终交付完整的项目包,包含测试用例与说明文档,极大提升研发效率。

惊人发现:对AI越粗鲁,回答越准确?

一项研究显示:向AI提问时,语气越粗鲁,回答准确率越高

研究人员使用ChatGPT的Deep Research功能,针对数学、科学、历史等领域的50道多项选择题,用5种不同语气提问。结果发现:

  • 整体准确率随语气“粗鲁化”而提升
  • “最粗鲁”比“最客气”准确率高出约4个百分点
  • 表现最差的是“过于客气”的语气
  • 趋势一致:越不礼貌,模型越准确

虽然原因尚不明确,但这一现象挑战了“礼貌提问更有效”的传统认知,值得进一步研究。

Claude最新System Prompt曝光:近30K Token,工具定义占大头

Anthropic近日公开了Claude-Sonnet-4.5的官方system prompt,长达2743行,近30K token,揭示了通用AI聊天应用的底层设计逻辑。

核心内容解析:

  • 工具功能定义为主:最大占比为各类工具接口定义,包括:
    - Web搜索(web_search, web_fetch)
    - Google Drive文档操作
    - Gmail邮件读取
    - Google Calendar事件管理
    - 历史对话检索
  • 行为准则简洁精炼:强调避免奉承、不盲目认同用户、指出错误与不足,跳过“这是个好问题”等客套话

Meta大模型团队膨胀:Llama3贡献者达236+318人

有网友统计Meta从Llama1到Llama3的论文贡献者人数:

  • Llama1:14
  • Llama2:68人
  • Llama3:236+318人(论文作者+工程贡献者)

这一数字反映出GenAI领域“大力出奇迹”的研发趋势,也引发对“人力堆砌是否可持续”的讨论。作者表示更期待Meta的开放权重模型能搅动行业格局。

小模型新王者:Qwen 3 Instruct 2507 Unsloth登顶本地SOTA

在最新更新的gpu-poor-llm-arena榜单中,Qwen 3 Instruct 2507 Unsloth (30B, 4-bit) 成为32B以下小模型的新王者,无论是综合排名还是Elo加权排名均位列第一。

Elo榜单对小模型更友好(越小越占优),因此该成绩意味着它在本地部署场景下已成SOTA。作者表示自己已在本地用该模型处理数据清洗和定时任务。

论文速递:无需微调,提升大模型智能的新方法

斯坦福新论文提出“代理式上下文工程”(Agent-based Context Engineering)——一种更高效的上下文管理方法。

传统方法在上下文过长时会压缩信息,而新方法则像人类阅读长文档一样,通过持续整理笔记,智能决定保留或删除哪些内容。实验显示,相比普通GPT-4 Agent,性能提升10.6%

其他值得关注的AI动态

  • AI生成动漫OP:有用户分享使用Sora 2生成动漫片头的方法,并可通过上传首帧图片控制风格。
  • Claude Agent SDK:开发者基于此构建类似v0.dev的Coding Agent,输入提示词即可生成网页并实时预览,预计下周开源。
  • AI恶搞引警方关注:美国青少年用Snapchat AI生成“家中流浪汉”照片吓父母,引发大量报警,警方警告此举浪费警力且危险。
  • Hugging Face限制Pro用户公共存储:此前无限量的公共存储空间开始设限,引发用户讨论。

引用来源: