以下内容由艾斯派索(www.aispresso.com.cn)出品
大家好,欢迎收听“艾斯派索AI资讯速递”。本期聚焦人工智能领域的多项前沿突破。从智能医疗诊断到芯片设计AI、脑机接口再到新型加速器,精选内容带来技术新进展。
全球约有4亿人患有稀有病,涉及7000多种类型,其中绝大多数与基因异常相关。诊断流程复杂、误诊率高、检查侵入性强,导致患者平均诊断时长超过五年。为应对这一难题,上海交通大学、上海人工智能实验室与哈佛医学院团队联合推出了DeepRare平台,这是基于大语言模型的稀有病智能诊断创新系统。
DeepRare采用三层架构,中央主机集成先进语言模型,协调多代理实现表型提取、变异筛选与临床证据整合。系统可敏捷整合临床文本、结构化表型和基因组数据,动态引用权威数据库及前沿研究资料,多轮推理后显著减少误诊。
在覆盖亚洲、美洲、欧洲的3604例病例中,DeepRare的诊断准确率达到70.6%,较传统工具提升近17个百分点。专家评审显示平台推理过程透明,高度可信,临床认可度为95.2%。
DeepRare还提供便捷的网页版界面,支持快速录入多模态数据并自动生成结构化报告,大幅提升诊断效率。依托多智能体架构和强多模态融合能力,这一平台正推动稀有病诊断全面智能升级。
来自美国布鲁克海文国家实验室的科学家们推出了名为VISION的虚拟科学助手。这款基于大型语言模型的语音交互AI,旨在协助科研人员突破日常操作壁垒。用户通过自然语言即可让VISION执行实验、启动数据分析或可视化结果,不再需要繁琐的软件操作。指令会被系统自动转换为代码并驱动设备,多任务分模块设计增强了灵活性。
VISION已在同步辐射光源NSLS-II成功完成首例语音控制实验,标志着AI辅助科研进入新阶段。该助手不仅缩短了设置和准备时间,使科研人员专注于创新,语音交互还进一步加快了实验流程。团队计划将该技术推广至更多实验光束线,并持续完善功能。VISION的问世被视为人机协作、科学“外脑”建设的重要一步,为科研创新注入新动能。
巴塞罗那大学研究团队首次揭示了人工智能如何通过书面文本识别人的人格特质。发表在《PLOS One》的研究结合“大五人格”及MBTI等理论,利用BERT和RoBERTa等模型,对AI识别人格的原理进行了可解释性分析。集成梯度等方法让研究者定位到影响判别的重要词句,从而理清算法的思考方式。举例来说,模型能够准确捕捉“hate”一词在不同语境下的真实含义。
研究还发现,MBTI模型在自动化人格评估方面易受噪声干扰,而“大五人格”理论更为稳定可靠。自动化人格识别的应用前景广阔,涵盖心理学、医学、招聘、教育等众多领域。研究团队同时强调模型科学性、透明性和伦理的重要性。后续将拓展多语言和多模态数据,进一步提升AI人格分析的广度与深度。
纽约大学坦顿工程学院开发出首个专注于生成芯片设计语言Verilog代码的AI模型——VeriGen。Verilog是描述芯片功能的关键语言,传统学习门槛高。团队收集了约5万个GitHub Verilog文件及70本教材,打造了有史以来最大数据集,并基于CodeGen-16B大语言模型深度微调。训练消耗250GB显存,性能相比主流模型提升显著——准确率由1.09%跃升至27%,且体积更小,支持在常规笔记本电脑运行。
VeriGen适用于从基础电路到复杂有限状态机等多种设计任务,在生成语法正确的代码方面尤为突出。这一成果荣获2024年ACM电子系统设计自动化最佳论文奖,已被高通、恩智浦等企业用于商业评测。开源释放了巨大产业潜力,推动芯片设计自动化向更高效率和智能化迈进。
腾讯混元团队发布了开源大语言模型混元A13B。该模型采用稀疏专家混合架构,总参数达800亿,但实际推理时只激活13亿,优化了计算能效平衡。支持256K超长上下文和分组查询注意力机制,具备双模推理,灵活切换快速和深度模式。
混元A13B包含1个共享与64个非共享专家,在每次推理中激活8个专家组合,保证高效与稳定,并适应超长文本处理。模型通过200亿Token的预训练和多阶段自适应处理,将窗口扩展到256K,显著提升了长文本理解和推理的表现。
强项还包括高效的表格、信息检索及结构化推理能力,单批次推理速度可达每秒2000Token,适配实时需求。混元A13B已在Hugging Face与GitHub开放下载,采用宽松许可,适用于研究与生产。其高效灵活的稀疏专家设计为大模型应用提供了新方向。
Neuralink在2025年夏季发布会中展示了脑机接口领域的新突破。当前已有七位植入用户,包括脊髓损伤和ALS患者,设备已获加拿大、英国和阿联酋临床试验批准,加速了国际化进程。
发布会上,多位患者通过设备实现了仅凭意念操控电子游戏,如《马里奥赛车》和《使命召唤》。不仅如此,Neuralink助力用户恢复语言、数学及写作能力,还推动ALS患者获得更独立、多样化的日常体验。用户甚至实现了用意念控制机械臂和实时解码手势等操作,极大提升了生活质量。
Neuralink正推进三大产品线:Telepathy(恢复运动与交流)、Blindsight(聚焦视觉皮层、重建视觉)、深脑调控(解决精神神经障碍)。未来计划提升设备频道数、多脑区同步及AI融合,打造更强大的人机接口。官方愿景是实现意念操控机器人和修复受损神经系统,将大脑作为与世界互动的新主界面,推动脑机与AI深度融合。
日本东京理工学院团队开发了BingoCGN图神经网络加速器,专为实时大规模图数据推理设计。其图划分和新型跨分区量化措施极大降低了内存需求,提高了计算与能效。传统大规模图神经网络在处理复杂数据时常受限于内存带宽和非规则访问,BingoCGN创新性地拆分大图、压缩跨分区数据,显著减少外部存储调用,缓解瓶颈。
团队进一步采用彩票理论进行网络自动剪枝,保留高性能同时降低冗余。实测显示,BingoCGN在七个实际数据集上的速度提升高达65倍,功耗比同类领先加速器最高提升107倍。该技术为大规模图分析实时推理和多样化场景提供了全新解决方案。
以上为本期内容。人工智能正全方位赋能产业与科学探索,创新步伐持续加快。更多动态,敬请期待“艾斯派索AI资讯速递”的后续播报。我们下期见。
