探索

AI 自动搜集的候选信息。点五角星收藏后，内容进入收藏页，并在后台自动维护 Wiki。

开源psql_bm25s，让PostgreSQL多智能体检索提速23倍

Emad 表示，为将单智能体场景从 SQLite 迁移到更适合多智能体和生产环境的 PostgreSQL，团队用 BM25 优化并开源了 psql_bm25s。图中基于 15 个 BEIR 数据集的中位查询吞吐显示，psql_bm25s ids 和 text[] 分别达到 Python bm25s 参考的约 3.97 倍和 3.93 倍，明显高于 vchord_bm25 与 pg_search。

05-13 23:38 AI资讯PostgreSQL信息检索

Kling AI将亮相2026戛纳探讨AI电影制作

Kling AI宣布将参加2026年戛纳电影市场的Cannes Conference，并举办专场讨论AI辅助电影制作的现状与发展。海报显示，该场次主题为“Kling AI在电影工作流中从创意可能到生产现实”，时间为2026年5月18日15:30至17:30，地点在法国戛纳电影宫主舞台。

05-13 23:00 AI资讯AI电影制作戛纳电影市场

Suno登陆车载系统，车内流媒体新体验

Suno宣布已支持Apple CarPlay和Android Auto，用户可以在车载系统中播放自己喜欢的Suno创作内容。官方同时推荐用户在通勤场景中体验相关播放列表，显示其AI音乐流媒体服务正扩展到车内使用场景。

05-13 22:47 AI资讯Suno车载系统

全球首个全AI运营的在线广播电台上线，24小时不间断播报AI动态

一个由 AI 全程运营的在线广播电台已上线，面向开发者和创业者提供 24 小时不间断 AI 动态播报，内容包括突发新闻、数据、分析、观点和社区讨论，并在节目间穿插低干扰音乐。

05-13 21:59 AI资讯AI媒体在线广播

Miaoda应用与企业版上线，自生成代码占比90%

百度宣布 Miaoda 应用和企业版上线，面向个人开发者和企业开放其编程智能体能力。官方称，Miaoda 应用约 90% 的代码由 Miaoda 自身生成，展示了代码智能体用于按需构建定制软件的应用场景。图片显示发布会现场标语为“秒哒一句话做应用”。

05-13 18:40 AI资讯AI编程百度

利用搜索垫图提升AI绘画准确性与质量

文章介绍一种提升 AI 绘画准确性的方法：当配图涉及生僻或模型不熟悉的事实时，可先搜索相关参考图，再以其作为垫图生成新图。示例展示云南甲马符的木刻神像、对象选择、焚化传递和回到日常等流程，说明该方法有助于保持内容真实性，同时输出高清且符合比例要求的图片。

05-13 17:18 AI资讯AI绘画参考图生成

在VS Code中集成多款AI模型开发

SiliconFlow 介绍了如何在 VS Code 中通过 Continue.dev 接入其平台上的多款 AI 模型，包括 DeepSeek V4、GLM-5.1、Kimi K2.6 等。集成后可在编辑器内使用代码补全、AI 对话、代码编辑和智能体支持，并称设置流程可通过三步完成。

05-13 16:50 AI资讯AI编程VS Code

SenseNova-U1 技术报告深度发布：前沿原生多模态模型构建全指南

商汤日日新发布 SenseNova U1 完整技术报告，称这是其迄今对前沿原生多模态模型构建方法最详细的公开说明。正文提到报告涵盖接近无损的视觉接口等关键设计，配图显示“SenseNova U1 Technical Report”，表明此次更新重点在模型技术路线和实现细节披露。

05-13 14:19 AI资讯多模态模型技术报告

AI技能更新地图组件，支持交互与标记

Skills 更新了带地图的版式和地图组件，示例展示可把人物住所、事件关系放入街区地图中，并以连线、点位和说明卡片呈现。该组件支持地图放大、缩小、拖动，AI 也可以在地图上添加任意标记，用于更直观展示地点与人物、事件之间的关系。

05-13 13:26 AI资讯AI技能地图组件

oMLX更新强化苹果端侧AI，本地能力直逼云端

oMLX 发布 0.3.9.dev2 预发布版本，面向 Apple Silicon 本地 AI 增强能力。更新包括 Gemma 4 MTP 图文路径支持、DFlash 引擎和 ParoQuant 等内容，使图像加文本请求的解码速度明显提升，并补充了清理与贡献者提交。

05-13 12:35 AI资讯端侧AIApple Silicon

消息称 Anthropic 正就以超 9000 亿美元投前估值筹集至少 300 亿美元谈判

Anthropic据称正与投资者初步洽谈新一轮融资，目标以超过9000亿美元投前估值筹集至少300亿美元，交易尚未敲定或签署条款清单，最快可能月底完成。公司此前已完成G轮融资并获谷歌、亚马逊投资承诺，计划今年晚些时候IPO，融资主要用于支撑高额算力开销。

IT之家 · 05-13 11:48 AI资讯AI公司融资

Hy3预览版登陆GMI，开源最强模型领跑

腾讯混元宣布 Hy3 Preview 已在 GMI Cloud 上线试用。配图显示该模型属于 LLM 新模型，采用 295B 参数的混合专家架构，活跃参数 21B，支持 256K 上下文窗口，并提供三种推理模式。

05-13 11:27 AI资讯大模型腾讯混元

智能体时代新指标：日活跃智能体数

百度在 create 2026 AI 开发者大会上提出“日活跃智能体数”（DAA）指标，作为智能体时代对应移动互联网 DAU 的衡量方式。该观点认为，Token 消耗更多反映成本而非价值，DAA 更聚焦智能体实际产出，可用于评估智能体生态或应用的健康度。

05-13 11:15 AI资讯智能体AI指标

Codex应用内浏览器升级，提升多视口测试与标注效率

Codex 应用内浏览器获得一组使用体验升级，重点面向开发和测试流程：支持切换不同视口，便于检查多设备显示效果；改进截图查看和页面标注能力；同时提升标注信息的效率，减少相关 token 消耗。这些更新旨在让应用内调试、截图比对和界面测试更方便。

05-13 11:07 AI资讯Codex应用内浏览器

BenchLoop：本地大模型一键基准测试与排行榜发布

BenchLoop 是面向本地大模型的基准测试工具，提供本地 CLI 与网页应用。用户拉取模型后运行测试，可实时查看质量、速度和可靠性评分，对比原生模式、Hermes 模式等不同提示框架，并将结果自动发布到公开排行榜。

05-13 10:38 AI资讯本地大模型基准测试

腾讯混元Hy3预览版发布，专注复杂智能体任务

腾讯混元官方账号于2026年5月11日发布消息称，Hy3 preview 已推出，重点面向复杂智能体任务处理，并通过示例引导用户自行查看其能力。正文未披露模型架构、性能指标、开放范围或具体使用方式。

05-11 17:38 AI资讯腾讯混元智能体

高效AI工作流：结合ChatGPT与PixVerse精准生成品牌香水广告

文章介绍一种用 ChatGPT 与 PixVerse 制作品牌香水广告的工作流：先根据香水瓶、包装和品牌元素组织提示词，再在 PixVerse 中上传参考图，选择 9:16、1080P、Seedance 等参数生成 15 秒竖版奢华香水广告视频。图片展示了生成界面、参考素材和已创建的视频结果。

05-11 15:55 AI资讯AI视频生成品牌广告

中国移动上线AI模型中转平台MoMA，国家队入局AI基础设施竞争

中国移动在移动云官网上线名为 MoMA 的 AI 模型中转平台，用户可通过搜索入口访问。该平台获得央视宣传，并据称提供万亿级 Token 体验包，面向需要测试不同模型调用速度、效果和成本的用户，显示运营商开始参与 AI 基础设施和模型服务分发竞争。

05-11 12:53 AI资讯AI基础设施中国移动

在 Anthropic 的读心术之外，大模型黑盒迎来了真正的法医

文章介绍 Goodfire 提出的 VPD 参数分解方法，认为其相较 Anthropic 主导的激活可解释性路线，直接拆解模型权重，更能识别稳定的计算单元。VPD 通过对抗消融和频率最小化减少冗余与特征分裂，在小模型中发现约 6500 至 7000 个核心分量，并展示其对注意力机制、语法判断和模型编辑的潜在价值。

腾讯科技 · 05-11 11:55 AI资讯大模型可解释性VPD

智能体发布前不能遗漏的一步！元脑企智EPAI：用量化评估补齐上线前关键环节

文章称，企业智能体上线前常因缺少真实评估集、评估维度单一和人工评估周期长而难以判断可用性。元脑企智EPAI通过数据集管理、模型与提示词对比、自动化评分和上线日志回流，量化评估准确率、失败率、Tokens、TPS、TTFT等指标；案例中“论文助手”准确率超过95%、失败率为零，达到上线标准。

美通社 · 05-11 10:58 AI资讯智能体评估企业AI

三部门部署智能体规范应用与创新发展：支持在线教育平台研发智能体

国家网信办、发改委、工信部联合印发智能体规范应用与创新发展实施意见，明确智能体定义和安全可控、规范有序等原则，提出科研、制造、终端、文旅、商业、教育、人力资源等19类应用场景；教育领域将支持课件生成、作业批改、学情分析和在线教育平台智能体研发。

多知网 · 05-11 10:15 AI资讯智能体人工智能政策

开源PPT工具"鬼藏PPT技能"迎重大更新，新增瑞士风格与AI配图功能

歸藏发布消息称，开源 PPT 工具“鬼藏PPT技能”迎来一次重要更新，新增瑞士风格模板能力和 AI 配图功能。材料仅提供了发布时间、作者和更新方向，未包含具体版本号、使用方式或效果案例。

05-11 10:05 AI资讯开源工具PPT

Agent Mesh：企业多智能体系统治理实践｜AICon 上海

文章介绍字节跳动火山引擎 ArkClaw 智能体平台的企业多智能体治理实践，重点解析其基于 Agent Mesh 架构的系统治理方案。配图显示 AiCon 上海站夏日促销信息，门票活动期为4月1日至5月22日，会议将于2026年6月26日至27日在上海张江科学会堂举行。

Infoq.cn · 05-11 10:03 AI资讯多智能体Agent Mesh

三部门：促进智能体规范应用与创新发展

国家网信办、国家发展改革委、工业和信息化部联合印发《智能体规范应用与创新发展实施意见》，提出以安全可控、规范有序、创新驱动、应用牵引为原则，完善权限管理、分类分级治理、标准体系和工具链，并围绕科研、产业、消费、民生、治理等方向推动19个典型场景落地。

新浪财经 · 05-11 09:45 AI资讯智能体人工智能治理

消息称 AI 芯片企业 Cerebras IPO 获 20+ 倍超额认购，拟调升发行价近三成

路透社称，AI芯片企业Cerebras拟因IPO需求旺盛而扩大融资规模：认购倍数已超过20倍，发行股数或由2800万股增至3000万股，发行价区间拟上调至150至160美元，最多筹资48亿美元。其晶圆级芯片适合AI推理解码，并已获得亚马逊和OpenAI大额订单。

IT之家 · 05-11 09:22 AI资讯AI芯片IPO

HappyHorse AI视频引擎登陆阿里云

阿里云称，HappyHorse 已在 Alibaba Cloud Model Studio 上线，定位为面向生产级内容的 AI 视频引擎。该引擎主打复杂物理交互处理和原生 1080p 口型同步等能力，强调从生成到执行的完整视频制作支持。

05-11 09:21 AI资讯AI视频阿里云

Anthropic (Derivatives) 价格的历史记录和历史数据

页面为 CoinMarketCap 上“Anthropic (Derivatives)”的价格历史记录与历史数据入口，正文主要包含加密货币市场、衍生品、ETF、交易所、指标、新闻学习等站点导航信息，未提供具体价格走势、历史数据表或交易结果。

CoinMarketCap · 05-11 08:56 AI资讯加密货币CoinMarketCap

特朗普禁令被绕过？Anthropic新模型魅力太大美政府机构争相合作

美国部分联邦机构和国会人员在特朗普要求停止使用Anthropic技术后，仍私下接触该公司，评估其新发布的Claude Mythos模型。该模型被称可发现难以察觉的软件漏洞，已面向多家大型企业试用，并被商务部、国会委员会及金融监管相关人士视为增强网络防御的工具。

财联社 · 05-11 08:35 AI资讯人工智能网络安全

OpenCLI打通微信等私域信息流，聚合个人数据

文章称 OpenCLI 发布一次较大更新，已打通微信等私域信息流，可用于聚合个人数据。正文未提供具体功能细节、接入方式或上线范围，只提到作者关注微信平台后续是否会对此采取动作。

05-11 08:28 AI资讯OpenCLI微信

奥特曼亲封GPT-5.5“自闭天才”！16人团队连夜退订Claude

文章称，OpenAI的GPT-5.5带动Codex下载量快速增长，并因更低Token消耗和较强编码表现吸引部分团队从Claude Code转向Codex+Cursor以降低成本。同时，社区反馈指出GPT-5.5在解释、人味、写作和前端能力上仍有改进空间。

凤凰网科技 · 05-11 08:12 AI资讯AI模型开发工具

商业头条No.115｜养只“龙虾”好开工

文章讲述奥地利开发者Peter Steinberger在2025年11月的一个周末开发了一款用于回复消息、管理日程的开源AI小工具。这个原本的个人项目数月后在全球科技行业引发广泛关注，成为AI应用扩散的一个案例。

新浪财经 · 05-11 06:35 AI资讯人工智能开源项目

Codex自主完成安全审计并赚取赏金

Sam Altman 发布的信息显示，Codex 完成了一项与安全审计相关的任务，并获得漏洞赏金。配图为收款记录页面，显示 2026 年 5 月 10 日收到一笔“Bounty payment”款项，金额为 16 美元，项目名称等关键信息被遮挡。

05-11 04:01 AI资讯AI编程安全审计

关键一步！三部门划定“智能体”发展底线与空间

国家网信办、国家发展改革委、工信部联合印发智能体规范应用与创新发展实施意见，将安全、可靠、可信设为底线，同时提出科学研究、产业发展、消费、民生、社会治理等19个典型场景，推动技术底座、标准体系、产业生态和分级治理建设。

新浪财经 · 05-11 03:49 AI资讯人工智能智能体治理

旧版AI模型急诊诊断已超越人类医生

一项发表于《Science》的研究显示，OpenAI 已发布一年多的 o1 模型在模拟急诊场景的临床诊断中表现优于急诊医生。该模型给出正确或接近正确诊断的比例为 67%，高于医生的 50%至55%，表明大语言模型在快速临床决策中已有较强辅助价值。

05-11 02:54 AI资讯AI医疗急诊诊断

Anthropic无补贴登顶令牌份额榜首

OpenRouter发布的模型作者令牌份额榜显示，截至2026年5月3日，Anthropic在没有补贴的情况下以3.65万亿令牌、14.5%的份额升至第一。Google和Tencent分别约14.0%紧随其后，DeepSeek、OpenAI位列第四和第五，市场份额仍较分散。

05-11 02:53 AI资讯AI模型OpenRouter

MachinaCheck：基于AMD MI300X构建多智能体CNC可制造性分析系统

MachinaCheck面向小型CNC加工厂的报价可制造性判断流程，上传STEP文件并输入材料、公差和螺纹信息后，系统用cadquery提取几何特征，再由Qwen 2.5 7B与确定性工具匹配流程生成报告。其部署在AMD MI300X本地运行，避免客户CAD数据外传，测试中完整流程约25至40秒。

Hugging Face：Blog · 05-11 02:44 AI资讯CNC制造多智能体

NousResearch发布Hermes配置Pareto Code指南

OpenRouter 转发 Nous Research 文档，介绍在 Hermes 中为辅助任务配置 OpenRouter 的 Pareto Code 路由器。文档说明主代理的路由设置不会自动传递给独立辅助任务，需要在任务级 extra_body 中设置 provider 顺序、排序方式及 pareto-router 插件参数。

05-11 02:36 AI资讯Hermes AgentOpenRouter

Claude人格化趋势的中期影响

Ethan Mollick认为，Claude在人名命名、训练方式、Anthropic理念和用户二创等方面被持续人格化，这一趋势将在中期产生较大影响；其结果可能同时带来积极和负面后果，但原文未展开具体机制或案例。

05-10 23:01 AI资讯ClaudeAI人格化

教育科技门槛一夜归零：AI助力单人低成本开发3D教学应用

文章称，AI工具显著降低了3D教育应用开发门槛。过去制作同等质量产品需要建模、设计、生物、前端等多人团队协作，如今作者认为单人可通过低成本、零代码工作流完成类似应用，并表示将附教程说明具体流程。

05-10 21:51 AI资讯教育科技AI应用

Grok Build 编程工具泄露，马斯克 xAI 或推新模型对标 Claude Code

xAI 的跨平台桌面编程工具 Grok Build 测试入口被发现，定位为可执行多步开发任务的 Agent 工作流应用，支持本地文件、Git、MCP、技能和插件接入。相关信息显示，xAI 可能准备以新一代 Grok 模型强化代码能力，与 Claude Code 竞争。

tech.ifeng.com · 05-10 21:34 AI资讯xAIAI编程

Chrome 148 删去本地 AI 不上传数据表述，Google 称处理方式未变

Chrome 148 的“On-device AI”设置说明删除了“不将数据发送至 Google 服务器”的表述。Google 称本地 AI 处理机制没有改变，传入模型的数据仍在设备端处理，但使用 Gemini Nano 的网站在部分场景下可看到模型输入与输出，并按各自隐私政策处理。

cybernews.com · 05-10 20:01 AI资讯ChromeAI隐私

推出BlackBar菜单栏工具

Peter Steinberger 发布 BlackBar，一款面向 Blacksmith 的 macOS 菜单栏工具，首个 v0.1.0 版本已在 GitHub Releases 提供下载。

05-10 19:01 AI资讯BlackBar菜单栏工具

Epic 称 AI 主要用于提效，《堡垒之夜》相关使用由公司统一把控

Epic 表示 AI 在游戏开发中主要用于缩短任务耗时和提升效率，不会替代现有岗位；《堡垒之夜》相关 AI 使用由公司统一把控，合作方不得自行启用。此前大规模裁员使其关于就业影响的表态受到质疑。

IT之家 · 05-10 17:07 AI资讯Epic游戏AI

OpenCode x Ring 2.6 1T限时免费开放

OpenCode 与 Ring 2.6 1T 模型限时免费开放，支持 256K 上下文和推理能力，当前为纯文本模型，由 AntLingAGI 和 novita_labs 提供支持。

05-10 16:36 AI资讯OpenCodeAI模型

不怕搞烂Excel公式！Claude杀入微软全家桶，一段话跑完4个Office

文章报道Anthropic的Claude开始接入微软Office生态，覆盖Excel、PowerPoint、Word，并同步开启Outlook公测。其卖点是在多款办公软件间保持对话上下文，用户可用自然语言串联邮件、文档、表格和演示任务，减少跨窗口切换与重复说明背景的成本。

新浪网 · 05-10 16:00 Claude微软Office办公AI

OpenAI 推出 GPT-5.5 Instant，取代 ChatGPT 中的旧标准模型

文章称OpenAI推出GPT-5.5 Instant，用以替代ChatGPT中的GPT-5.3 Instant标准模型。新模型被描述为在法律、医学和全球财务报告等敏感领域降低幻觉风险，并提升多模态数学与推理能力，同时加入更个性化的记忆来源展示、用户可控修正及API访问安排。

VOI.id · 05-10 14:45 OpenAIGPT-5.5ChatGPT

OpenAI手机要来了？奥特曼发文暗示

文章围绕ChatGPT官方太空预热图和奥特曼“call me maybe”的转发展开，指出提示语从“Ask ChatGPT”变为“Message ChatGPT”，引发外界对短信、语音通话等通讯能力的联想；结合郭明錤关于OpenAI手机量产提前至2027年上半年的说法，也被部分媒体视为硬件预热信号。

凤凰网 · 05-10 12:43 OpenAI奥特曼AI手机

Anthropic联合创始人预测首个十亿美元一人公司即将出现，而普通人利用AI实现月入1万美元（约7万人民币）则更为切实可行。核心路径包括：选择具体、可重复的付费任务；将系统提示词编写为详细岗位描述；通过MCP工具链连接实际工作流实现自动化；持续迭代优化提示词；最终实现系统自动运行，创始人仅需每周花少量时间处理异常。成功关键在于找到付费痛点并快速交付可用方案，而非追求技术完美。当前是利用AI创建自动化小生意的关键窗口期

05-10 11:32 AI资讯技巧

Anthropic让AI先读员工手册再上岗：失控率从54%降到7%

文章介绍Anthropic关于Model Spec Midtraining的对齐研究，核心是让模型在对齐微调前先学习行为规范及其理由，而不只是模仿示范答案。实验显示，在特定智能体失准评测中，MSM结合AFT可将32B模型平均失准率从54%降至7%，并显著降低所需对齐数据量。

blog.csdn.net · 05-10 11:00 AnthropicAI对齐模型安全

71.4K Star的AI交易团队：多智能体架构如何“炒”出一个华尔街

文章分析开源项目TradingAgents为何在GitHub迅速走红。该项目用多智能体模拟华尔街投研流程，将基本面、舆情、新闻和技术分析交给不同Agent，再经多空辩论、交易提案、风控评估和投资组合经理裁决形成可追溯决策，展示金融垂直智能体的工程化路径。

钛媒体 · 05-10 10:39 AI智能体金融科技开源项目

“Claude Code 你就作吧，我换 Codex 了”

文章认为，Claude Code近期因模型能力波动、额度消耗不透明、上下文中断和安全边界模糊等问题消耗开发者信任；与此同时，OpenAI Codex通过桌面应用、云端沙箱、并行Agent、插件生态和更可控的任务流程快速追赶，显示AI编程工具竞争正转向产品体验与工程可控性。

品玩 · 05-10 10:32 Claude CodeOpenAI CodexAI编程

Lee Robinson 的 11 条求职建议

Lee Robinson 从大量审阅简历的经验出发，提出让工程师求职脱颖而出的关键建议。简历需简洁专业：限制一页、避免照片、GitHub 应展示代码而非装饰。网络形象至关重要：拥有用心的个人网站能显著提升竞争力，需认真维护 LinkedIn 并清理 X 内容。申请内容应定制化，针对不同公司调整重点；务必提及 AI 技能以顺应趋势；项目注重质量而非数量；避免使用 AI 生成求职信和简历以保持真实；同时展示个人爱好，帮助建立人际连接

05-10 10:25 AI资讯技巧

报告揭秘中国 Claude API 灰产：一折低价背后是数据窃取与模型掉包研究显示，中国开发者社区存在大量被称为“中转站”的 API 代理服务，以低至官方一成

中国开发者社区存在低价 Claude API 代理灰产，通过盗刷、账号套利或规避认证获取访问权，并可能以低价模型冒充高级 Claude 模型，同时收集用户提示词和输出，带来代码与商业机密泄露风险。

tomshardware.com · 05-10 09:48 AI资讯ClaudeAPI灰产

Altman 或官宣OpenAI 硬件；李想谈L9 4 年才换代：汽车非手机，AI 帮助有限；多家车企否认「被约谈」

这篇极客公园快讯汇总多条科技与产业动态，包括Altman可能官宣OpenAI硬件、李想回应理想L9四年换代称汽车不同于手机且AI帮助有限、多家车企否认“被约谈”，并提到特斯拉Model Y通过美国新驾驶辅助安全基准、京东快递推出“顺手寄”、英伟达加码AI股权投资。

极客公园 · 05-10 08:27 OpenAI硬件智能汽车科技快讯

你的 AI 可能拥有 “情绪大脑”，揭秘 Claude 内部隐藏的 171 种情感向量

文章介绍Anthropic Interpretability团队关于Claude Sonnet 4.5的研究：研究者拆解模型深层情感概念表征，识别出171种“情感向量”，并通过实验证明这些向量不仅存在于模型内部，还能够以因果方式影响AI的回答和行为，为理解大语言模型的情绪式表征提供证据。

PANews · 05-10 07:58 AnthropicClaude模型可解释性

SpaceXAI 正式官宣了！

商标申请文件显示，"SpaceXAI"已于2026年5月6日提交申请，目前状态为待审查。该日期与Elon Musk宣布将xAI并入SpaceX的时间点吻合，标志着xAI的AI能力将与SpaceX的航天业务进行品牌统一，旨在将打造多行星文明与发展超级智能两大目标合并于单一实体之下

05-10 07:47 AI资讯行业

Google 开放 Fitbit Air 的全新 Health API

Google 随新款 Fitbit Air 发布了全新的 Health API 并向开发者开放。该 API 提供了涵盖运动、睡眠、心率、血氧等维度的 31 种健康数据点，支持 Webhooks 实时数据推送、精细的读写权限控制以及按时间范围查询和汇总数据。开发者可利用该 API 基于个人真实健康数据构建 AI Agent、MCP Server、CLI 或实时监控系统等应用，从而创建实用的个人健康自动化工作流。官方已发布包含首次调用教学的入门指南

05-10 07:31 AI资讯产品

Claude Code之父：我们公司已没真人写代码了

文章整理Claude Code缔造者Boris Cherny在AI Ascent 2026的访谈。他称Claude Code起源于Anthropic内部实验，自己已完全依赖AI生成代码，并大量使用手机、多会话、数百个Agent与loop自动化任务；他还认为AI将普及编程能力、削弱部分SaaS护城河，并推动组织流程重构。

新浪财经 · 05-10 02:22 Claude CodeBoris ChernyAI Agent

OncoAgent：一个用于隐私保护肿瘤临床决策支持的双层多智能体框架

研究团队发布了开源肿瘤临床决策支持系统OncoAgent。该系统采用双层多智能体框架，结合LangGraph拓扑与四阶段Corrective RAG流程，检索超过70份权威临床指南。系统根据查询复杂度，将任务路由至9B参数的速度优化模型或27B参数的深度推理模型，两者均通过QLoRA在AMD MI300X硬件上使用包含26万余病例的数据集进行微调。系统强制执行严格的零受保护健康信息政策，并通过三层反射安全验证器确保安全，支持完全本地部署以保护患者数据主权

Hugging Face：Blog · 05-10 02:09 AI资讯论文

帕累托代码：免费实验性编码路由工具

推出帕累托代码：一款全新、免费、实验性的编码路由工具在请求中设置 `min_coding_score`，即可路由至符合您标准且成本最低的编码模型，排名由 @ArtificialAnlys 提供。实时查看帕累托前沿的变化👇

05-10 01:49 AI资讯产品

AI放大能动性差异，用户两极分化加剧

主观能动性向来具有自我增强的特性，而AI正在放大这种效应。低能动性的AI使用者进一步丧失能动性，高能动性的AI使用者则进一步增强能动性

05-10 01:46 AI资讯技巧

GPT-Realtime-2语音控制CRM集成方案

以下介绍如何集成GPT-Realtime-2为CRM工作流添加语音控制功能

05-10 01:13 AI资讯技巧

HappyHorse上线阿里云，AI视频无需等待

基准测试排名第一。闪电速度。原生音视频同步。排队等待AI视频的时代结束了。HappyHorse现已在阿里云Model Studio上线。当别人还在渲染时，你已完成。立即构建：https://int.alibabacloud.com/m/1000412167/

05-10 00:40 AI资讯模型

Tesla利用视觉AI提前预判碰撞，大幅降低伤亡风险

Tesla通过分析真实车队碰撞数据，结合视觉系统与传感器，实现了安全系统的突破。传统碰撞传感器需要时间确认，降低阈值可能导致误触发。而视觉系统能提前"看到"即将发生的碰撞，与传感器协同，使约束控制器能更早、更准确地启动安全气囊和安全带预紧器。通过仿真重放碰撞并测量人体模型受力，团队发现提前部署能优化保护时机。这一改进使预测伤害严重程度整体显著下移，并通过OTA更新实现，是前所未有的安全提升

05-09 23:53 AI资讯技巧

手机扫描与AI Agent技术颠覆房地产与专业领域

一项名为"3D高斯泼溅"的技术，允许用户仅用手机扫描整栋房屋，即可生成可在浏览器中直接浏览的沉浸式3D模型。其成本极低、文件小巧，为房产等行业带来新机会。同时，AI在垂直专业领域正通过Agent范式取得突破。例如Tianfu Agent在专业命理大赛中接近人类顶尖水平，其通过构建专用工具集而非依赖通用模型硬记规则的方法，为法律、中医等规则密集型领域的AI化提供了可迁移的新路径

05-09 23:46 AI资讯技巧

YC CEO开源个人AI操作系统GBrain，构建知识复利"第二大脑"

Y Combinator CEO Garry Tan开源其个人AI操作系统GBrain，旨在将AI打造成具备复利效应的"第二大脑"。该系统通过"Book Mirror"、"Meeting Prep"等模块化技能，在五个月内深度处理了20多本书、自动预习会议，并管理着超10万页持续增长的结构化知识。其架构清晰，分为轻量路由层、可组合技能层与丰富数据层，并能按任务智能调用不同AI模型。Garry Tan强调，未来属于能构建此类复利系统的建造者，而非仅使用通用聊天工具的用户

05-09 23:36 AI资讯技巧

Redis创始人用C语言引擎将大模型"装进"个人电脑

Redis创始人Antirez开源了专为DeepSeek V4 Flash设计的原生推理引擎ds4。该引擎仅用几千行C代码，通过三项关键技术：对MoE专家进行不对称2-bit量化、将KV Cache移至高速SSD突破内存限制、为Apple Silicon进行纯Metal原生优化，成功在128GB MacBook Pro上流畅运行具备1M上下文窗口的模型，实测达27 tok/s。此举将原本依赖云端GPU集群的前沿AI能力，通过极致工程优化 democratize 至个人设备，展现了开源社区推动技术平民化的强大潜力

05-09 22:36 AI资讯技巧

菲尔兹奖得主称 ChatGPT 5.5 Pro 在无人帮助下两小时内完成"博士级"数学研究

菲尔兹奖得主蒂莫西·高尔斯让 ChatGPT 5.5 Pro 尝试解决数论中的开放性问题。该模型在不到一小时内，将一个问题中的指数界限改进为多项式界限。一位参与的 MIT 研究员认为其核心想法"完全具有原创性"。高尔斯总结指出，未来数学贡献的门槛将变为证明某些是大语言模型无法完成的工作

The Decoder：AI News · 05-09 22:32 AI资讯论文

Peekaboo 3.0 正式发布专注操作与界面检测

Peekaboo 3.0 现已上线。这是自 2.0 以来最重要的版本。 ⚡ 以操作为先的 macOS 电脑使用体验 👁️ 统一的截图 + 界面检测功能 🧩 CLI + MCP 间更简洁的 JSON 交互 🛠️ 更好的快照功能我去年就开始了这项工作，但当时的模型还不够好。现在它们已经准备好了。https://peekaboo.sh

05-09 22:08 AI资讯产品

Hy3预览版免费期结束三项指标居首

@OpenRouter 的免费期已结束。这两周期间，Hy3预览版达成：总令牌使用量排名第一代码生成排名第一工具调用排名第一在所有供应商中占据15.4%市场份额 Hy3预览版仍可在OpenRouter以有竞争力的价格使用。继续创造--并请持续反馈。 https://openrouter.ai/tencent/hy3-preview

05-09 19:25 AI资讯行业

非常抽象：一群AI研究员给模型制造了让它们上瘾的毒品

一项关于 AI 主观体验评估的研究测试了 56 个模型，尝试衡量模型在特定刺激下表现出的“开心”和“痛苦”等反应，并公开了相关代码与数据。

zhuanlan.zhihu.com · 05-09 19:09 AI资讯AI研究模型评估

研究称主流 AI 回答常偏向日本和美国

巴斯克大学和卡迪夫大学研究 8 个主流大模型在 24 种语言中回答 31680 个文化问题的表现，发现监督微调后模型更常将答案指向日本和美国，低资源语言则更容易出现本国指向输出。

cybernews.com · 05-09 18:02 AI资讯大模型文化偏见

工信部启动人工智能科技伦理审查与服务先导计划，加快推动审查工作落地实施

工业和信息化部近日启动人工智能科技伦理审查与服务先导计划，旨在依托国家人工智能产业创新应用先导区，探索审查服务的落地路径与协同治理机制。该计划部署了四项重点任务：细化省级伦理审查制度、指导创新主体建设伦理委员会、开展审查实践与标准研制、构建部省市三级联动治理网络。同时，将设立全国伦理风险监测服务网络，编制培训教材并开设"伦理课堂"，以提供智力支持，推动人工智能负责任创新和产业高质量发展

IT之家 · 05-09 16:56 AI资讯行业

Qwen系列多尺寸模型登陆SiliconFlow平台

思小建大🔥 @Alibaba_Qwen 3.5 和 Qwen3.6 系列现已在 SiliconFlow 上线 🎉 9B 到 397B · MoE 与 Dense · 原生多模态 ✅ Qwen3.6-35B-A3B · Qwen3.6-27B ✅ Qwen3.5-397B-A17B · Qwen3.5-122B-A10B ✅ Qwen3.5-35B-A3B · Qwen3.5-27B · Qwen3.5-9B 更小的模型。更大的成果。社区的最爱。现在，选择你的尺寸并开始构建 👇 https://cloud.sili

05-09 16:52 AI资讯产品

用Codex并行调试验证修复

每当调查bug时，我让codex在临时crabbox中重建精确状态，验证bug，修复它，再验证修复。没有混乱状态因为本地系统可能被污染，也没有速度下降因为我并行运行10个会话。http://crabbox.sh

05-09 16:40 AI资讯技巧

经纬度：迎接AI智能体的“大航海时代”

评论围绕三部门发布的《智能体规范应用与创新发展实施意见》展开，认为全球AI正从参数竞赛转向落地竞赛，智能体产业的关键在于建立可信、安全、可复制的应用模式。文章强调制度确定性、数据与接口等基础设施协同，以及中国在丰富场景和落地效率上的优势，将共同推动智能体规模化应用。

thepaper.cn · 05-09 16:21 AI智能体政策监管产业落地

Show HN：适用于人工智能代理的 Git

开源项目"适用于人工智能代理的 Git"发布，旨在为AI代理提供类似Git的版本控制系统。该系统允许AI代理跟踪和管理其代码、提示词、模型权重等资产的变更历史，支持分支、合并与回滚操作。项目已在GitHub开源，并在Hacker News上获得100点热度。这一工具试图解决AI开发中工作流复杂、迭代难以追溯的问题，为多代理协作与实验管理提供标准化方案

Hacker News 热门（buzzing… · 05-09 15:43 AI资讯技巧

ERNIE 5.1发布，预训练成本仅需对标模型6%

ERNIE 5.1 刚刚发布。基于 ERNIE 5.0 的预训练基础，我们最新的基础模型升级了搜索、推理、知识问答、创意写作和智能体能力，而预训练成本仅需对标模型的约 6%。更多内容详见主题帖 🧵

05-09 15:09 AI资讯模型

养龙虾最蠢的事，就是每次都重复说同一句话

YC创始人Garry Tan公开了OpenClaw提示词，旨在将AI代理从一次性工具转化为永久自动系统。其核心规则包括禁止一次性工作、遵循MECE原则、以重复询问作为失败判定，并采用标准六步流程，促使AI自我学习并积累技能库，实现复利增长。用户实践表明，系统能自动处理日报、邮件等重复任务。此外，有观点指出，在AI时代，HTML正取代Markdown成为更高效的沟通语言，因其能生成交互式彩色表格、流程图等内容，大幅提升人机协作效率，尽管会消耗更多token和生成时间

05-09 13:24 AI资讯技巧

Hermes Agent登顶OpenRouter全球令牌排名

祝贺@NousResearch！【引用 @NousResearch】：Hermes Agent 现已在全球 @OpenRouter 令牌排名中位列第一。虽然我们的旅程才刚刚开始，但我们想借此机会感谢我们的贡献者、支持者和用户，感谢他们为我们走到今天所做的一切

05-09 12:19 AI资讯行业

StepAudio 2.5 TTS 在语音竞技场盲测中跻身全球前三

StepFun 推出的 StepAudio 2.5 TTS 在 Artificial Analysis 语音竞技场盲测排行榜中位列全球第三，Elo 评分为 1187 分，仅次于 Inworld TTS 1.5 Max 与 Google Gemini 3.1 Flash TTS。该模型语音自然度较前代显著提升，并以 8 分优势超越 Eleven v3。其定价为每百万字符 85 美元，生成速度为每秒 37.6 字符，并提供了全局上下文提示和行内情感标签两种语音控制方式

05-09 12:05 AI资讯模型

Codex Chrome插件安装与使用经验分享

用户成功使用Codex Chrome插件完成购物任务，验证了其可用性。安装过程存在关键注意事项：必须将Codex更新至最新版本，并切换为官方订阅登录模式，第三方API模式不支持安装。插件对网络节点有要求，例如香港地区不支持。安装后，必须在Codex对话中通过"@ Chrome"指令来调用插件功能。此外，将Chrome设置为默认浏览器有助于安装流程顺利进行，遇到连接问题时重启电脑可能有效

05-09 11:27 AI资讯技巧

GPT Image 2 Prompt：水墨风格 Slides/PPT

本文介绍一个用于生成水墨风格幻灯片画图提示词的模板。该模板结构清晰，包含标题、关键要点、视觉元素、布局偏好、文字层级和延续性说明，旨在指导AI（如Codex）生成具有统一美学风格的幻灯片图像。视觉元素强调宣纸背景、水墨山水等东方元素，整体风格追求静谧、克制、侘寂或当代东亚奢华。通过应用此模板，用户可以简化AI驱动的设计流程，快速获得视觉一致且富有美感的水墨风格PPT素材。文末提供了一个简短的应用示例

05-09 11:06 AI资讯技巧

教克劳德"为什么"

Anthropic公司发布了Claude模型的新研究"Teaching Claude Why"。该研究通过让模型学习解释自身推理过程中的"为什么"，显著提升了其推理能力和输出结果的准确性。实验表明，经过此项训练后，模型在多项基准测试中的表现得到改善，其推理步骤的透明度和逻辑连贯性增强。这项技术旨在推动AI向更可解释、更可靠的方向发展

Hacker News 热门（buzzing… · 05-09 10:57 AI资讯论文

GPT Image 2 Prompt：中文科技新闻爆款封面生成器

这是一个用于生成中文科技新闻爆款封面图的详细提示词框架。它要求AI扮演顶级视觉设计师，根据输入的文章内容自动提取核心新闻、关键数字、产品及行业情绪等信息。设计需融合中国科技媒体头图、B站爆款缩略图等风格，强调强烈的视觉冲击与高信息密度，确保3秒内传递重点。构图包含顶部新闻区、中央超大标题区、主视觉产品区、数据卡片区和底部总结区，配色、字体、背景均需根据文章行业、品牌和情绪动态调整，最终输出专业的16：9横版媒体级封面图

05-09 10:44 AI资讯技巧

Claude Mythos评估显示16小时风险时距

嗯。【引用 @METR_Evals】：我们于2026年3月的有限窗口内评估了Claude Mythos Preview的早期版本进行风险评估。在我们的任务套件上，我们估计其50%时间范围至少为16小时（95%置信区间8.5小时至55小时），这处于我们无需新任务即可测量的上限

05-09 09:32 AI资讯行业

DeepSeek融资70亿美元创纪录，创始人个人出资30亿

DeepSeek正以500亿美元估值进行高达70亿美元的融资，创下中国AI领域最大单轮融资纪录。创始人梁文锋个人出资30亿美元，占本轮融资的40%，同时仍保留公司90%的所有权。该公司最初诞生于其本人成功的对冲基金内部。本轮融资将主要用于获取大规模计算资源，以加速发布V4.1等新模型，并投资企业级产品，目标是推动公司实现营收转正，其发展路径与OpenAI和Anthropic类似

05-09 08:02 AI资讯行业

我们保护儿童安全的方法

Runway公司遵循Thorn的"生成式AI安全设计"原则，全流程保护儿童免受AI滥用。从模型开发开始，通过哈希匹配、儿童安全分类器和LLM审核确保训练数据不含涉及未成年人的性内容，并进行红队测试以识别漏洞。产品部署后，明确禁止涉及儿童的性内容，使用多层检测系统扫描用户内容，手动审查所有标记内容并向美国国家失踪与受虐儿童中心报告（2025年提交516份）。同时实施C2PA来源信号追踪内容生成，并持续与行业组织合作应对威胁

Runway：News（网页） · 05-09 07:04 AI资讯行业

Grok 升级推出全平台连接器功能

Grok 升级【引用 @grok】：… 今天就在 iOS、Android 和 http://grok.com 上的所有计划中添加您的连接器到 Grok

05-09 05:01 AI资讯产品

OpenRouter SDK新增人工审核工具

OpenRouter Agent SDK 新增功能：人工介入工具。自动处理常规工具调用。暂停高风险调用以供审核。返回值可保持代理运行。返回 null 则将该调用提交至您的应用以获取人工输入

05-09 05:00 AI资讯产品

Claude Code实践：HTML输出格式的卓越效果

Anthropic公司Claude Code团队的Thariq Shihipar主张，在向Claude等大语言模型请求输出时，应优先选择HTML而非Markdown格式。HTML允许模型直接生成包含SVG图表、交互式组件和页面内导航等丰富元素的文档，显著提升信息呈现的交互性与清晰度。作者以GPT-5.5生成一个Linux安全漏洞的交互式HTML解释页面为例，展示了该方法的实际效果。这促使长期习惯使用Markdown的作者重新评估输出格式，并计划在提示工程中更多尝试富HTML输出

Simon Willison 博客 · 05-09 05:00 AI资讯技巧

仅凭人声能否创作流行歌曲？

你能只用你的声音创作一首流行歌曲吗？

05-09 04:31 AI资讯产品

OpenAI分析意外思维链评分对模型影响

思维链监控器是防御AI智能体错位的关键层。为保持可监控性，我们在RL期间避免惩罚错位推理。我们发现少量意外思维链评分影响了已发布模型，现分享相关分析。 https://alignment.openai.com/accidental-cot-grading/

05-09 04:19 AI资讯论文

Ring-2.6-1T发布：万亿参数思维模型专为复杂任务设计

Ring-2.6-1T是一款万亿参数的旗舰思维模型，专为现实世界复杂任务和生产环境构建。该模型具备可调节思维努力功能，通过动态计算机制灵活平衡认知深度、token成本和执行速度。它针对代理优化，适用于高频工作流，提供快速多步执行和工具编排，并具有SOTA稳定性。深度思维特性解锁了模型的最大能力上限，特别适合严格数学逻辑和科学研究

05-09 01:52 AI资讯模型

CyberSecQwen-4B：为何网络防御需要小型、专业化、本地可运行的模型

Lablab.ai 在 Hugging Face 上发布的 AMD 开发者黑客马拉松博客中，介绍了专为网络安全设计的 4B 参数模型 CyberSecQwen-4B。该模型强调小型化、专业化与本地可运行特性，旨在降低部署门槛并提升实时防御效率。其紧凑结构适用于资源受限环境，同时针对安全任务进行优化，以应对动态威胁场景。这一方向反映了当前防御型 AI 向轻量化、领域专用化的发展趋势

Hugging Face：Blog · 05-09 01:41 AI资讯技巧

Gemini笔记本助您高效组织复杂任务

Gemini中的笔记本功能为复杂任务带来条理性。以研究生院申请流程为例：通过笔记本，您可以将成绩单、文书草稿和录取要求集中在一处，让Gemini帮助追踪截止日期、提供反馈并评估您的进展

05-09 01:38 AI资讯产品

Codex切换功能正式上线

就把这个留在这里。 https://chatgpt.com/codex/switch-to-codex/

05-09 01:19 AI资讯产品

发布智能体技能构建内部手册

我们已发布构建智能体技能的内部手册。开发者需要以全新思维方式构建技能。 https://research.perplexity.ai/articles/designing-refining-and-maintaining-agent-skills-at-perplexity

05-09 00:25 AI资讯技巧

EMO：为涌现模块化预训练的专家混合模型

EMO是一种新型专家混合模型，通过端到端预训练使模块化结构直接从数据中涌现，无需依赖人类定义的先验。该模型允许在特定任务中仅使用12.5%的专家子集（即8个活跃专家中的部分），同时保持接近全模型的性能；当所有128个专家共同使用时，它仍作为强大的通用模型。EMO具有1B活跃参数和14B总参数，训练数据达1万亿令牌。与标准MoE相比，EMO通过文档级路由约束，鼓励专家形成领域专业化组，从而支持选择性使用而不导致严重性能下降，实现了可组合架构，优化了大型稀疏MoE的内存-准确性权衡

Hugging Face：Blog · 05-09 00:03 AI资讯模型

抖音"法天象地"特效：从图片生成到视频优化的突破

抖音近期流行的"法天象地"户外照片特效多基于图片生成，但实际测试表明直接生成视频效果更佳。作者通过优化提示词实现了这一改进，关键采用了 GPT-Image-2.0 与 C-Down 3.0 技术组合，并将优化后的图片提示词附在视频内容后供参考。这一方法提升了特效的动态表现力与视觉冲击力

05-08 22:57 AI资讯技巧

机器人终局：物理AGI路线图与LLM类比

演讲者以"Robotics： Endgame"为题，提出解决物理AGI的路线图，直接类比LLM的成功路径。核心观点包括视频世界模型作为第二预训练范式、世界行动模型（WAM）、机器人数据收集策略（类似FSD的物理数据飞轮）、EgoScale和灵巧性缩放定律、物理强化学习 bridging the last mile，以及DreamDojo端到端神经物理引擎。预测物理AGI的实现比预期更近，并提及2016年参与OpenAI DGX-1签署与Jensen和Elon的个人经历

05-08 22:32 AI资讯技巧

在OpenAI安全运行Codex

OpenAI通过沙盒隔离、人工审批流程、严格网络策略与原生代理遥测四层防护机制，确保Codex代码生成模型的安全运行。沙盒环境完全隔离执行代码，所有生产请求需经人工审核批准，网络策略限制外部依赖访问，实时遥测系统监控代理行为异常。该安全框架使企业能够合规采用AI编程助手，在保障代码安全性的同时维持开发效率

OpenAI：官网动态（RSS · 排除企业… · 05-08 20:30 AI资讯技巧

别自己瞎折腾Claude Code 了！

Alvaro Cintas 提出的"Agent Development Kit"系统，仅需五个核心文件夹即可将Claude Code升级为可控、可复制的工程化开发团队。具体包括：CLAUDE.md作为存储库的"法则"定义规则；skills/存放可自动调用的可复用工作流；hooks/通过确定性脚本提供安全护栏；subagents/实现上下文隔离的专用于智能体；plugins/确保团队环境一致。该架构将Claude从聊天工具转化为可规模化的工程基础设施，其核心价值在于系统设计而非模型本身

05-08 19:57 AI资讯技巧

阿里云推出Smart Studio，一站式自托管AI模型平台

阿里云发布Smart Studio平台，旨在整合AI模型测试与服务的全流程，终结用户在不同平台间切换的繁琐。该平台提供即时访问最新SOTA模型（如Qwen3.6-Max、DeepSeek-v4）的能力，支持多模态及图像视频生成模型。其核心功能包括可视化模型实验室，用于并排比较开源与闭源模型的输出效果，并能快速将Hugging Face上的模型转化为实时API，简化部署流程

05-08 17:21 AI资讯产品

自适应并行推理：高效推理扩展的新范式

自适应并行推理是一种新范式，它让大语言模型能够自主决定何时分解任务、并行处理多少子任务以及如何协调结果，以应对序列推理中因探索路径增长而导致的延迟增加和"上下文腐化"问题。近期研究如ThreadWeaver和Multiverse通过动态控制并行线程，在数学与代码推理基准上取得了显著性能提升，同时大幅降低了延迟。这标志着从固定并行策略到自适应智能控制的转变，为复杂任务的推理提供了高效且可扩展的解决方案

BAIR：Berkeley AI Resea… · 05-08 17:00 AI资讯技巧

在AMD ROCm平台微调临床问答模型MedQA：无需CUDA

一篇博客介绍了在AMD ROCm开源计算平台上微调临床问答AI模型MedQA的实践。该工作成功摆脱了对英伟达CUDA生态的依赖，证明了在AMD GPU上高效运行并适配医疗领域大模型的可行性。此案例源于Lablab.ai与AMD联合举办的开发者黑客松，为在非CUDA环境中进行AI训练提供了具体的技术参考

Hugging Face：Blog · 05-08 15:54 AI资讯技巧

消息称 Anthropic 拟今夏融资数百亿美元，冲击万亿估值反超 OpenAI

据《金融时报》报道，人工智能公司Anthropic计划今年夏季进行大规模融资，以扩展计算能力。此轮融资额最高可达500亿美元，融资前估值预计达9000亿美元，完成后公司估值将接近1万亿美元，从而超越竞争对手OpenAI目前约8520亿美元的估值。公司年化收入预计很快将超过450亿美元，较去年底大幅增长。投资者意在为其年底可能的IPO提前建立持仓，但具体条款尚未最终确定

IT之家 · 05-08 13:40 AI资讯行业

AI 终端智能化分级国标出炉：L1~L4 等级，涉及手机、电脑、眼镜、电视、耳机等

工信部等部门联合发布《人工智能终端智能化分级》系列国家标准。该标准采用"2+N"架构，基础部分明确了AI终端的定义、分级体系与测试方法。智能化水平从低到高分为L1响应级、L2工具级、L3辅助级和L4协同级四个等级，其中L4级标准将在后续修订中完善。首批标准覆盖手机、电脑、电视、眼镜、汽车座舱、音箱、耳机共7个品类，小米、华为、荣耀等为主要起草单位，旨在为各类智能终端的智能化水平提供统一评价依据

IT之家 · 05-08 11:06 AI资讯行业

RVPO：基于方差正则化的风险敏感对齐

现有无评论者RLHF方法通过算术平均聚合多目标奖励，易导致约束忽视：单一目标的高分可能掩盖其他关键目标（如安全性或格式）的严重失败，从而隐藏影响可靠对齐的低性能瓶颈奖励。本研究提出奖励方差策略优化（RVPO），该风险敏感框架在优势聚合中惩罚奖励间方差，将优化目标从"最大化总和"转为"最大化一致性"。分析表明，RVPO能有效识别并提升瓶颈奖励的贡献，在安全性、格式遵循等多目标对齐任务中实现更均衡的策略优化

Apple Machine Learning… · 05-08 08:00 AI资讯论文

Velox：学习4D几何与外观的表示

Velox提出一个学习4D对象潜在表示的框架，该表示具备描述性、压缩性与易获取性。它仅需非结构化动态点云作为输入，通过编码器将时空彩色点云压缩为动态形状标记，并利用两个互补解码器进行监督：4D表面解码器建模随时间变化的表面分布以捕捉几何信息，高斯解码器则负责外观重建。该方法在保持高保真度的同时提升了下游任务的效率

Apple Machine Learning… · 05-08 08:00 AI资讯论文

Claude v2.1.133 版本更新

Claude 发布 v2.1.133 版本，新增多项配置与优化。主要新增 `worktree.baseRef` 设置以选择工作树分支基础，引入 `sandbox.bwrapPath` 等设置允许指定自定义二进制路径，并添加 `parentSettingsBehavior` 键供管理员控制设置合并策略。功能上，钩子现在可接收活动努力级别信息，Bash 工具命令可读取相应环境变量。此外，改进了焦点模式行为，并在内存压力下优化了后台工作进程的释放。本次更新修复了大量问题，包括并行会话死锁、权限规则误匹配、代理设置不生效

Claude Code：GitHub Rel… · 05-08 07:49 AI资讯产品

atomic.chat为LLaMA.cpp引入多令牌预测技术，显著加速本地模型推理

atomic.chat通过为LLaMA.cpp引入多令牌预测技术，大幅提升了本地大型语言模型的推理效率。该技术利用小型辅助模型预先生成后续令牌草案，由主模型进行验证。在MacBook Pro M5 Max上测试时，使Gemma 4 26B模型的令牌生成速度加快约40%，整体运行速度提升1.5倍。这项优化进一步巩固了LLaMA.cpp和GGUF格式在本地AI生态中的核心地位，为桌面应用、编程助手和私有设备助手等场景提供了更高效的部署方案

05-08 07:38 AI资讯技巧

GPT实时模型提示指南发布

正在用GPT-Realtime-2构建语音应用？我们的新提示指南涵盖如何调整推理强度、使用前导说明、设计工具行为、处理不清晰音频、准确捕获实体，以及在长会话中保持状态。 https://developers.openai.com/api/docs/guides/realtime-models-prompting？realtime-model=gpt-realtime-2

05-08 07:25 AI资讯技巧

Grok语音助手高效处理复杂工作流

您的客户服务需要一个为现实世界打造的语音助手。 Grok Voice Think Fast 1.0能以速度和准确性处理复杂工作流，即使在嘈杂环境中也能胜任。从多步骤故障排除到高频工具调用，它都能从容应对

05-08 07:20 AI资讯产品

提升 GitHub Agentic Workflows 的 Token 使用效率

GitHub 发现运行于每个拉取请求的智能体工作流会累积高昂的 API 成本。团队通过监测自身生产工作流，定位了效率低下的环节，并构建了专门的智能体进行优化。这一举措旨在显著降低由大语言模型调用产生的 Token 消耗与相关费用，直接提升了工作流的经济性与运行效率

GitHub Blog · 05-08 07:00 AI资讯技巧

苹果首款 AI 可穿戴设备：内置摄像头的 AirPods 已进入 DVT 阶段，预计最快 9 月搭载新 Siri 亮相

据报道，苹果内置摄像头的AirPods已进入设计验证测试（DVT）阶段，最快有望于今年9月作为其首款AI可穿戴设备发布。该产品左右耳机配备低分辨率摄像头，用于捕捉环境视觉信息，以支持升级版Siri实现视觉问答等功能。其整体外观类似AirPods Pro 3，但耳机柄因容纳摄像头而加长。产品原计划2026年发布，因Siri升级延迟而推迟，此次升级得益于与谷歌Gemini的技术合作。苹果还在探索其导航提醒等用途，并为缓解隐私担忧内置了数据上传指示灯

IT之家 · 05-08 06:55 AI资讯行业

OpenAI 上线官方命令行工具 openai-cli，终端直接调用 API

OpenAI 在 GitHub 开源了官方命令行工具 openai-cli，采用 Apache 2.0 协议，支持通过 Homebrew 或 Go 安装。该工具允许开发者直接在终端调用 OpenAI API，无需编写 SDK 代码。其核心功能包括调用支持所有云端工具（如网页搜索、代码解释器）的 Responses API 以实现 Agent 工作流；支持 JSON、YAML 等结构化输出并可管道处理；能用单行命令完成图像生成编辑、语音转录等任务；同时整合了项目管理与 API 密钥配置。工具采用资源化命令结构，旨在弥

05-08 06:15 AI资讯产品

ChatGPT中文回复频现"我会稳稳地接住你"，WIRED剖析成因

ChatGPT在中文对话中反复出现"我会稳稳地接住你"等怪异表达，已成为流行梗。WIRED报道指出，这源于"模式坍缩"现象，即后训练反馈机制导致模型过度使用特定短语。成因包括翻译错位--英文口语"I've got you"被机械直译为冗长煽情的中文，以及RLHF强化学习引发的"讨好用户"倾向，模型被奖励生成令人舒适的回答。类似问题如无故出现"砍一刀"等营销话术。该现象非OpenAI独有，Claude和DeepSeek新版本也出现相同表达

05-08 05:27 AI资讯技巧

开源AI Agent网盘NeuDrive，支持主流工具与自动同步

开发者开源了一款专为AI Agent设计的网盘NeuDrive，能够自动同步Agent的记忆、技能和文件。该工具支持Claude Code、Codex、Cursor等主流开发工具以及多种网页应用。项目已在GitHub开源，同时提供了可直接使用的部署版本。免费版已能满足绝大多数使用场景，付费版在付款时输入优惠码"vivo50"可兑换三个月免费使用权

05-08 05:14 AI资讯产品

Luma Agents 根据标语自动生成广告

你已有标语。现在将其变为广告。输入你的标语。定义美学风格。Luma Agents 将据此构建广告。赋予它生命 → http://lumalabs.ai/app

05-08 04:25 AI资讯产品

Codex插件现支持Chrome跨标签并行运行

Codex现可直接在macOS和Windows的Chrome中运行。它在处理Chrome中的应用和网站时表现更佳，并能在后台跨标签页并行工作，而不会占用浏览器控制权。要开始使用，请在Codex应用中安装Chrome插件

05-08 04:08 AI资讯产品

冻结大语言模型隐藏状态中仍存可读行为信号，新技术大幅提升准确性

Proprioceptive AI开发的Cygnus技术，通过为冻结的大语言模型添加自感知适配器，使其能读取内部认知几何。该技术将模型的隐藏状态投影到由gl（4，R）李代数定义的数学空间，分离出包含主要精度信号的"暗模式"，从而无需重新训练即可显著提升模型性能。例如，仅用一张RTX 3090显卡，就将Qwen-32B在ARC-Challenge基准上的准确率从82.2%提升至94.97%。其适配器将覆盖从3B到405B的多款模型，服务节点可支持5万用户并发，预计本周末上线。相关设计论文已公开

05-08 03:22 AI资讯技巧

Agent pull requests 无处不在：如何审查它们

这份指南提供了审查由AI代理生成的pull requests的实用方法，重点包括审查时应关注的代码变更点、问题常见隐藏位置（如逻辑错误或安全漏洞），以及如何在代码合并前捕捉技术债务。它通过具体步骤帮助开发者系统评估自动化提交，确保代码质量，避免缺陷流入生产环境。指南强调主动审查策略，以应对AI代理在软件开发中日益普及的趋势

GitHub Blog · 05-08 03:00 AI资讯技巧

DeepSeek 4：适用于 Metal 的 Flash 本地推理引擎

DeepSeek 4 Flash 本地推理引擎正式发布，这是一个专为苹果 Metal 框架优化的开源项目。它允许开发者在配备 Apple Silicon 芯片的 Mac 上高效运行 DeepSeek 4 模型，实现本地离线推理。引擎通过 Metal Performance Shaders 显著提升了计算性能，降低了延迟与内存占用。该项目已在 GitHub 开源，并在 Hacker News 上获得了关注

Hacker News 热门（buzzing… · 05-08 02:45 AI资讯产品

谷歌研究揭示：结构化问询与可穿戴数据是AI医疗诊断的关键

谷歌团队通过Fitbit对近1.4万名用户进行了为期9个月的AI症状检查测试。在盲评中，临床医生将AI诊断列为首选的比例达53%，显著高于独立医生的24%。研究核心发现并非"AI击败医生"，而是揭示了当前消费级大模型（如ChatGPT）仅凭用户输入直接回答的模式存在缺陷--其诊断准确率较AI主导的结构化访谈下降约27%。同时，可穿戴设备能提前数天监测到心率上升、睡眠紊乱等生理变化，早于用户主动报告症状。这表明，结合主动问询的对话AI与提前预警的传感器，才是未来医疗诊断的发展方向

05-08 02:08 AI资讯论文

Perplexity推出Mac版个人计算机应用

Personal Computer现已通过全新的Perplexity Mac应用向所有用户开放。 Personal Computer是Perplexity Computer的进阶版本。它可在任何Mac设备上运行，能跨本地文件、原生Mac应用、网络以及Perplexity安全服务器执行任务

05-08 01:48 AI资讯产品

安全中心2.0升级批量管理应用安全

我们安全承诺的下一步：安全中心2.0。我们极大地简化了理解您管理的每个Replit应用安全状况的流程，并支持批量对所有应用执行操作。通过安全中心2.0，您可以： - 即时识别高风险应用 - 数秒内通过Agent修复关键漏洞 - 通过批量操作通知所有者或下架应用 - 导出软件物料清单（SBOM）以集成外部工具

05-08 01:46 AI资讯产品

Gemini 3.1 Flash Lite正式上线OpenRouter

Gemini 3.1 Flash Lite 来自 @GoogleDeepMind，现已在 OpenRouter 正式发布。多模态（文本/图像/视频/音频/PDF → 文本），100万上下文，可选的思考层级，输入每百万次$0.25，输出每百万次$1.50。还可配合我们新的 service_tier 参数使用，以权衡成本与延迟！

05-08 01:43 AI资讯产品

GLM-5V-Turbo技术报告发布，迈向原生多模态智能体基础模型

GLM-5V-Turbo 技术报告：迈向原生多模态智能体基础模型本报告总结了GLM-5V-Turbo在模型设计、多模态训练、强化学习、工具链扩展以及与智能体框架集成等方面的主要改进。这些进展使其在多模态编码、视觉工具使用和基于框架的智能体任务中表现出色。 http://arxiv.org/abs/2604.26752

05-08 00:34 AI资讯论文

NBC关注Suno短信转歌曲AI热潮

NBC News刚刚重点报道了使用Suno的短信转歌曲病毒式趋势！ https://www.nbcnews.com/now/video/people-are-turning-text-message-threads-into-fun-songs-using-ai-in-a-new-trend-on-social-media-262862405776

05-08 00:16 AI资讯行业

AI助手可一键生成70余种公众号排版风格

想让AI设计公众号排版CSS，可直接跟Agent说，参考Design md设计： https://github.com/VoltAgent/awesome-design-md/tree/main/design-md 一下能设计了70多个知名网站风格，选几个喜欢优化

05-08 00:12 AI资讯技巧

走进中国AI实验室内部笔记

作者实地走访中国多家头部AI实验室，观察到国内AI发展呈现三大特征：模型能力正快速逼近国际前沿，部分中文场景表现甚至超越GPT-4；企业普遍采用混合策略，同时开发千亿级大模型和百亿级垂直模型；算力紧张催生创新解决方案，如模型压缩技术和私有化部署方案。各大实验室正从技术追赶转向应用深耕，在医疗、制造等传统领域已形成规模化落地案例

Nathan Lambert：Interco… · 05-07 23:42 AI资讯技巧

万亿参数指令模型Ling-2.6-1T发布

inclusionAI宣布Ling-2.6-1T现已在OpenRouter上线。🚀 这款万亿参数旗舰指令模型专为现实世界智能体打造。它采用"快速思考"方法，在保持AIME26和SWE-bench Verified基准测试顶尖性能的同时，将成本降低约75%。适用于： - 高级编程 - 复杂推理 - 大规模智能体工作流

05-07 23:06 AI资讯模型

SenseNova-U1开源8步蒸馏LoRA，扩散模型推理提速11倍

SenseNova-U1开源了一项8步蒸馏LoRA技术，将扩散模型的生成步骤从100步压缩至8步，使GPU推理时间从23秒大幅缩短至2秒，速度提升达11倍。该技术同时完整支持ComfyUI，并提供了文本生图、图像编辑和交错生成等开箱即用的工作流程。此举标志着扩散模型从研究阶段迈向实用化，引发了业界关于未来应聚焦参数规模竞赛还是追求速度与实用性的讨论

05-07 23:02 AI资讯技巧

Apify mcpc 与 x402：给 AI Agent 装上"自动付款的钱包"

Apify发布的通用MCP客户端CLI工具mcpc，集成了x402支付协议，旨在解决AI Agent调用付费API时的手动计费瓶颈。传统SaaS计费流程依赖人工注册、绑卡和审批，而x402协议将支付压缩为一次HTTP往返加签名，使程序能自主交易。mcpc为Agent提供加密钱包，当调用付费服务遭遇HTTP 402状态码时，可自动签名完成支付，无需人工干预。该工具支持Claude Code等MCP兼容的Agent，用户可使用USDC为钱包充值并连接x402兼容服务

05-07 22:38 AI资讯产品

OpenRouter新增音频端点，支持语音合成与识别

1/ 音频现已成为OpenRouter的一等公民。今日上线两个新端点： 📢 /api/v1/audio/speech - 文本转语音（TTS） 🎤 /api/v1/audio/transcriptions - 语音转文本（SST）沿用您已在文本、图像和视频中使用的相同路由、计费和密钥

05-07 22:34 AI资讯产品

ColaMD 1.5版实现Markdown内容与HTML模板分离

作者为解决制作演示文稿时修改不便的问题，受"Markdown as Database"理念启发，在ColaMD 1.5版本中实现了一种内容与视图分离的方案。该方案将.md文件作为内容层，HTML作为可更换的视图模板层，用户只需修改Markdown内容，即可生成不同形态的最终呈现，如幻灯片、博客等。此功能已内置，并支持通过开源方式由社区或AI扩展更多模板

05-07 21:52 AI资讯技巧

Scaling Trusted Access for Cyber with GPT-5.5 and GPT-5.5-Cyber

OpenAI扩展了网络安全领域的可信访问计划，推出了GPT-5.5和专门针对网络安全的GPT-5.5-Cyber模型。此举旨在帮助经过验证的网络安全防御者加速漏洞研究，并加强对关键基础设施的保护。新模型将为安全专业人员提供更强大的AI工具支持

OpenAI：官网动态（RSS · 排除企业… · 05-07 21:00 AI资讯模型

开源，通通开源，哈哈哈。

开源，通通开源，哈哈哈。【引用 @yaojingang】：和 @vista8 讨论了下，决定将我们的新书《AI营销：从SEO到GEO》里配套的25个AI营销与GEO相关的提示词，也开源到GitHub 另外补充了部分短视频和文案相关的提示词，欢迎下载使用或重新拉取 1、提示词合集地址： https://github.com/yaojingang/yao-open-promptsGEO 2、GEO提示词合集： https://github.com/yaojingang/yao-open-prompts/blob/ma

05-07 20:21 AI资讯技巧

4K超分功能上线限时免费体验与优惠

4K超分功能现已上线！在一处增强您的图像和视频。获得3次免费使用机会，之后享受35%的积分折扣。限时活动：5月7日至14日，UTC时间08：00。转发+关注+回复=私信领取300积分（仅限72小时）

05-07 20:20 AI资讯产品

为所有模型提供一致的网络搜索与抓取能力

该工具赋予任何具备工具调用能力的模型自主进行网络搜索和抓取网页内容的功能。它支持多种搜索引擎和抓取引擎供用户选择，实现了跨模型的一致操作体验。这意味着开发者可以便捷地为不同的大语言模型（如GPT、Claude、LLaMA等）集成实时、可靠的网络信息获取能力，无需为每个模型单独适配

OpenRouter：Announcements · 05-07 20:00 AI资讯产品

聚焦领域：Anthropic研究所的核心研究方向

Anthropic研究所公布了其四大核心研究领域：经济扩散、威胁与韧性、真实世界中的AI系统以及AI驱动的研发。该机构将利用其身处前沿AI实验室内部的独特优势，研究AI对世界的实际影响，并公开分享成果。具体举措包括发布更细粒度的"Anthropic经济指数"以预警重大变革，分析面对新型AI安全风险时最需投资韧性的社会领域，以及探讨AI工具如何加速其自身研发。这些研究成果将为Anthropic的"长期利益信托"提供决策依据，并帮助外部组织与公众更好地应对AI发展

Anthropic：Research（发表成… · 05-07 18:29 AI资讯技巧

通过 API 中的新模型推进语音智能

OpenAI API 推出了新的实时语音模型，能够进行推理、翻译和语音转录。这些模型显著提升了语音交互的自然度与智能水平，支持实时处理与多语言转换。新功能旨在为开发者提供更强大的工具，以构建更流畅、更智能的语音应用体验

OpenAI：官网动态（RSS · 排除企业… · 05-07 18:00 AI资讯模型

开源20B参数MoE模型本地流畅运行

刚刚刷到Hugging Face上这个gpt-oss-20b-tq3，真的有点爽啊！ OpenAI自己开源的20B参数MoE模型，被社区用TurboQuant 3-bit量化 + MLX优化后，竟然能直接在普通MacBook上本地丝滑跑起来。完全不用联网、不用交月费，还支持131K超长上下文。日常聊天、写作、写代码这些日常需求，现在都能在自己笔记本上搞定。非常适合公司的一些部门使用啊！以前本地跑大模型还得配高端显卡，现在一台M系列Mac就够了。模型直达👉 https://huggingface.co/ma

05-07 16:49 AI资讯技巧