探索

AI 自动搜集的候选信息。点五角星收藏后，内容进入收藏页，并在后台自动维护 Wiki。

OncoAgent：一个用于隐私保护肿瘤临床决策支持的双层多智能体框架

研究团队发布了开源肿瘤临床决策支持系统OncoAgent。该系统采用双层多智能体框架，结合LangGraph拓扑与四阶段Corrective RAG流程，检索超过70份权威临床指南。系统根据查询复杂度，将任务路由至9B参数的速度优化模型或27B参数的深度推理模型，两者均通过QLoRA在AMD MI300X硬件上使用包含26万余病例的数据集进行微调。系统强制执行严格的零受保护健康信息政策，并通过三层反射安全验证器确保安全，支持完全本地部署以保护患者数据主权

Hugging Face：Blog · 05-10 02:09 AI资讯论文

菲尔兹奖得主称 ChatGPT 5.5 Pro 在无人帮助下两小时内完成"博士级"数学研究

菲尔兹奖得主蒂莫西·高尔斯让 ChatGPT 5.5 Pro 尝试解决数论中的开放性问题。该模型在不到一小时内，将一个问题中的指数界限改进为多项式界限。一位参与的 MIT 研究员认为其核心想法"完全具有原创性"。高尔斯总结指出，未来数学贡献的门槛将变为证明某些是大语言模型无法完成的工作

The Decoder：AI News · 05-09 22:32 AI资讯论文

非常抽象：一群AI研究员给模型制造了让它们上瘾的毒品

一项关于 AI 主观体验评估的研究测试了 56 个模型，尝试衡量模型在特定刺激下表现出的“开心”和“痛苦”等反应，并公开了相关代码与数据。

zhuanlan.zhihu.com · 05-09 19:09 AI资讯AI研究模型评估

研究称主流 AI 回答常偏向日本和美国

巴斯克大学和卡迪夫大学研究 8 个主流大模型在 24 种语言中回答 31680 个文化问题的表现，发现监督微调后模型更常将答案指向日本和美国，低资源语言则更容易出现本国指向输出。

cybernews.com · 05-09 18:02 AI资讯大模型文化偏见

教克劳德"为什么"

Anthropic公司发布了Claude模型的新研究"Teaching Claude Why"。该研究通过让模型学习解释自身推理过程中的"为什么"，显著提升了其推理能力和输出结果的准确性。实验表明，经过此项训练后，模型在多项基准测试中的表现得到改善，其推理步骤的透明度和逻辑连贯性增强。这项技术旨在推动AI向更可解释、更可靠的方向发展

Hacker News 热门（buzzing… · 05-09 10:57 AI资讯论文

OpenAI分析意外思维链评分对模型影响

思维链监控器是防御AI智能体错位的关键层。为保持可监控性，我们在RL期间避免惩罚错位推理。我们发现少量意外思维链评分影响了已发布模型，现分享相关分析。 https://alignment.openai.com/accidental-cot-grading/

05-09 04:19 AI资讯论文

RVPO：基于方差正则化的风险敏感对齐

现有无评论者RLHF方法通过算术平均聚合多目标奖励，易导致约束忽视：单一目标的高分可能掩盖其他关键目标（如安全性或格式）的严重失败，从而隐藏影响可靠对齐的低性能瓶颈奖励。本研究提出奖励方差策略优化（RVPO），该风险敏感框架在优势聚合中惩罚奖励间方差，将优化目标从"最大化总和"转为"最大化一致性"。分析表明，RVPO能有效识别并提升瓶颈奖励的贡献，在安全性、格式遵循等多目标对齐任务中实现更均衡的策略优化

Apple Machine Learning… · 05-08 08:00 AI资讯论文

Velox：学习4D几何与外观的表示

Velox提出一个学习4D对象潜在表示的框架，该表示具备描述性、压缩性与易获取性。它仅需非结构化动态点云作为输入，通过编码器将时空彩色点云压缩为动态形状标记，并利用两个互补解码器进行监督：4D表面解码器建模随时间变化的表面分布以捕捉几何信息，高斯解码器则负责外观重建。该方法在保持高保真度的同时提升了下游任务的效率

Apple Machine Learning… · 05-08 08:00 AI资讯论文

谷歌研究揭示：结构化问询与可穿戴数据是AI医疗诊断的关键

谷歌团队通过Fitbit对近1.4万名用户进行了为期9个月的AI症状检查测试。在盲评中，临床医生将AI诊断列为首选的比例达53%，显著高于独立医生的24%。研究核心发现并非"AI击败医生"，而是揭示了当前消费级大模型（如ChatGPT）仅凭用户输入直接回答的模式存在缺陷--其诊断准确率较AI主导的结构化访谈下降约27%。同时，可穿戴设备能提前数天监测到心率上升、睡眠紊乱等生理变化，早于用户主动报告症状。这表明，结合主动问询的对话AI与提前预警的传感器，才是未来医疗诊断的发展方向

05-08 02:08 AI资讯论文

GLM-5V-Turbo技术报告发布，迈向原生多模态智能体基础模型

GLM-5V-Turbo 技术报告：迈向原生多模态智能体基础模型本报告总结了GLM-5V-Turbo在模型设计、多模态训练、强化学习、工具链扩展以及与智能体框架集成等方面的主要改进。这些进展使其在多模态编码、视觉工具使用和基于框架的智能体任务中表现出色。 http://arxiv.org/abs/2604.26752

05-08 00:34 AI资讯论文

用于学习语义丰富视觉表征的文本条件JEPA

研究人员提出文本条件联合嵌入预测架构（TC-JEPA），通过引入图像描述文本作为条件信息来降低掩码特征预测中的视觉不确定性。该方法采用细粒度文本调节器，对输入文本标记计算稀疏交叉注意力，从而调制预测的图像补丁特征。与基于掩码特征预测的I-JEPA相比，TC-JEPA能够学习到语义更丰富的视觉表征，解决了原有方法因视觉不确定性导致的语义学习不足问题

Apple Machine Learning… · 05-07 08:00 AI资讯论文