全球 AI 行业大模型与监管动态

追踪 OpenAI、Anthropic、Google、DeepSeek 等大模型发布、融资与监管事件;含纯 AI 行业热点,不局限于加密,但影响市场情绪与叙事。
ALLAI AgentAI 行业动态AI 代币AI 工具应用

Vals AI 发布金融代理 v2 基准;GPT-5.5 得分 51.76%,在严格评分下所有模型均低于 40%

根据 Beating,AI 评估公司 Vals AI 于 5 月 14 日发布其第二代 Finance Agent v2 基准测试,通过 927 道经专家审核的问题来测试金融分析工作流。GPT-5.5 以 51.76% 的准确率领跑,其次是 Claude Opus 4.7(51.51%)和 Claude Sonnet 4.6(51.03%)。该测试要求模型能够在 10-K 和 10-Q 财务报表的数百页中独立定位相关部分,并使用精确的中间数值完成多步骤计算。 在要求完全正确答案的严格评分标准下,所有领先模型的准确率均降至 40% 以下,最难的类别——金融建模和先例分析——最高也仅达到 23%。在其他模型中,Kimi K2.6 以 44.87% 排名第五,随后是 GLM 5.1(44.79%)和 DeepSeek V4(44.08%)。与上一版本中 Opus 4.7 得分 64.4% 相比,这种显著下滑表明:尽管 AI 能处理简单检索,但在金融领域这类需要严格数值精度的复杂场景中,它仍远未能取代人类分析师。
ALL-4.33%
GateNews·1 分钟前

ChatGPT 法律诉讼再添一桩!遭指秘密泄露用户聊天内容给 Meta 与 Google

美国加州一名女子以違反隐私法为由,对 OpenAI 提起集體訴訟,指控 ChatGPT 在未经用戶同意的情況下,透过追蹤工具將用戶的查詢內容傳送給 Meta 和 Google。此案被认为是聯邦法院首度直接挑戰 AI 聊天机器人數據處理方式的象徵性案件,引发外界对 AI 隐私保護的高度关注。 (ChatGPT 涉青少年自殺案!OpenAI:已強化 GPT-5 心理防護机制) ChatGPT 疑嵌入隐形追蹤碼,聊天內容全被看光光 5 月 13 日,一位以 Amargo Couture 为代表的加州居民,向美国聯邦地方法院南加州分院提起訴訟。 訴狀指出,OpenAI 在 ChatGPT 官網的程式碼中,嵌入了 Meta 的「Facebook Pixel」与 Google 的「Google Analytics」等第三方追蹤工具。这些追蹤碼在用戶毫不知情的情況下自动运作,將用戶输入的查詢內容与个人可识別资訊即时傳送至 Meta 和 Google,包括健康狀況、财務建议、法律问題等高度敏感的私人资訊。 Couture 表示,她在 2025 至 2026 年间多次使用 ChatGPT 查詢个人健康与
鏈新聞abmedia·17 分钟前

三名核心 Grok 模型架构师将于一周内离开 xAI,因马斯克承诺将每两周发布一次

据 Beating 的监测,三名直接负责 Grok 模型开发的技术负责人在过去一周内从 xAI 离职。负责搜索与事实性后训练的田一张已在今天确认离职;负责预训练团队的负责人庄俊堂本月早些时候离开;而负责构建 Grok 语音智能体能力的 David Haxton 则于 5 月 10 日离职。 这些离职瞄准的是核心产品线——分别是负责 Grok 下一代迭代算力的搜索后训练、预训练以及语音。张的团队将 Grok 的事实性错误率降低了 70-80%,使得 Grok 4.2 能够登上 Search Arena 榜首。时机进一步加剧压力:马斯克在 4 月称,Grok 4.4(1T 参数)将于 5 月上旬发布,之后每两周更新一次,但目前仍未公布。当前已公开的 Grok 4.3 只是一个 0.5T 的训练中间版本。
CORE-4%
GROK-3.34%
XAI-4.26%
TEAM-0.42%
GateNews·1小时前

腾讯开源代理记忆系统,将代币用量降低最多 61%

据 Beating 称,腾讯云近期开源了腾讯DB Agent Memory,这是面向 AI 代理的本地优先内存引擎。该系统在复杂工作流中将代币消耗降低 61%——在 WideSearch 任务中从 221.31M 降至 85.64M——同时将任务完成率提升 51.52%。该引擎采用分层内存架构,将长期记忆(对话、原子事实、场景切片和用户画像)与短期任务记忆分离,并将日志外置,同时通过 Mermaid 图表对任务进行可视化,以实现高效检索。
GateNews·2小时前

Grok 搜索负责人在一年内离职,80+ 名员工离开 xAI

蒂安亿·张(Tianyi Zhang),领导 xAI 的搜索与事实性(factuality)后训练团队,今天(5 月 14 日)宣布离开公司。过去一年里,张负责 Grok 的实时搜索与 Agent 能力的开发,作为该系统能够从 X 平台数据中检索准确、实时信息并防止出现错误输出的核心架构师。 这次离职是 xAI 一波离职潮中的最新一例。据《Fast Company》报道,在过去一年中,大约有 80 名员工离开了该实验室,包括最初的所有联合创始人,除马斯克(Elon Musk)外——尤其是 Jimmy Ba、Tony Wu 以及其他人。包括首席财务官(CFO)和基础设施负责人在内的多位高管也已在近期离开。
XAI-4.26%
IN-5.38%
GROK-3.34%
XPB0.07%
GateNews·2小时前

Anthropic 的企业采用率达到 34.4%,在 4 月超过 OpenAI 的 32.3%

根据 Ramp AI 指数,Anthropic 的企业采用率在 4 月达到 34.4%,超过 OpenAI 的 32.3%,这也是该 AI 公司首次在企业采用方面位居首位。Anthropic 的采用率按月上涨 3.8%,而 OpenAI 下降 2.9%。在过去一年中,Anthropic 的企业采用增长了 4 倍,而 OpenAI 仅增加 0.3%。该结论基于 Ramp 对 50,000 多家美国企业的支出模式所做的分析。
4-11.72%
OPENAI1.2%
IN-5.38%
GateNews·2小时前

英伟达批准 10 家中国公司购买 H200 芯片,每家最高 75,000 台

根据路透社今日的独家报道,约有 10 家中国公司(包括阿里巴巴、腾讯、字节跳动和京东)已获批采购英伟达的 H200 芯片,每家客户的限购数量为 75,000 台。联想和富士康获批作为分销商。 不过,迄今尚未有芯片发货。中国拒绝了美国提出的要求,即芯片需经由美国转运并缴纳 25% 的费用,理由是对硬件遭到篡改的安全担忧。为打破僵局,英伟达 CEO 黄仁勋本周应中国邀请加入白宫代表团,就高层会谈进行磋商。
GateNews·2小时前

Google 将于 5 月 20 日在 I/O 上推出 Gemini 3.2 Flash,并以 1/15 成本实现与 GPT-5.5 相匹配的性能

据 Abacus.AI 首席执行官 Bindu Reddy 称,Google 计划在 5 月 20 日的 I/O 大会上发布 Gemini 3.2 Flash,其在代码和推理任务上的性能将达到 GPT-5.5 的 92%,同时将推理成本削减至仅为后者的 1/15 到 1/20。大多数查询的延迟将低于 200 毫秒。Reddy 将这一突破归因于 Google 的蒸馏和稀疏性技术,这些技术能在不出现通常在模型优化中所见的性能断崖的情况下,将前沿模型压缩到 Flash 级别。
AT1.17%
ON-9.72%
MAY-4.22%
GateNews·3小时前

IBM 在 5 月 5 日的 Think 2026 上发布扩展的 AI 与区块链整合

在 5 月 5 日于 Think 2026 会议上,IBM 揭示了其 Confluent 平台的扩展能力,以支持用于面向 AI 驱动运营的实时数据处理。该公司推出了面向帮助企业改进 AI 部署、治理和运营可扩展性的工具。根据 Arvind Krishna 的说法,IBM 认为企业需要更强大的基础设施和治理,才能充分从 AI 技术中获益。IBM 强调,区块链和 AI 是相辅相成的:区块链能提升 AI 生态系统中的信任与透明度,而 AI 则通过自动化和先进分析提升区块链效率。
IBM-1.24%
AT1.17%
ON-9.72%
GateNews·3小时前

马斯克:中美峰会“非常顺利”,很多好事正在发生

《纽约邮报》记者 Emily Goodin 于 5 月 14 日在社媒上报道,白宫记者团在北京见到马斯克(Elon Musk)并进行采访。峰会后,马斯克表示会谈「非常顺利」,称「很多好事正在发生」;黄仁勋表示「会谈进行得很顺利」,并称中美两国元首都「棒极了」;库克对镜头比出「耶」手势后竖起大拇指。 三位 CEO 的确认反应 根据 Emily Goodin 在社媒上的现场报道,白宫记者团采访确认的三人反应: 马斯克:会谈「非常顺利」,并称「很多好事正在发生」 黄仁勋:「会谈进行得很顺利」,并称中美两国元首都「棒极了」 库克:先对镜头比出「耶」手势,随后竖起大拇指 黄仁勋加入代表团的确认经过 CNBC 一名知情人士透露,特朗普在看到媒体报道黄仁勋未受邀后,致电邀请其加入代表团,黄仁勋随后飞赴阿拉斯加搭乘空军一号。特朗普在社群媒体上确认黄仁勋已登上空军一号,并否认媒体有关黄仁勋未受邀的报道。英伟达发言人在声明中表示:「詹森应特朗普总统的邀请出席峰会,以支持美国和本届政府的目标。」英伟达被问及黄仁勋在阿拉斯加中途加入一事时,使用了相同措辞,但未提供进一步说明。白宫截至报道时尚未就此事作出回应。
Market Whisper·3小时前
news-image

豆包“扫一扫”显示支付订单入口,付费版最高月费 500 元

字节跳动(ByteDance)旗下 AI 助手豆包于 5 月 14 日前后出现两项重要动态:内测截图显示其“扫一扫”功能底部已出现“支付订单”入口;App Store 页面同步更新确认,豆包将在免费版基础上推出三档付费订阅方案,月费分别为 68 元、200 元及 500 元人民币。 扫一扫支付功能:内测截图的确认现状与未确认部分 根据目前流出的内测截图,豆包扫一扫界面底部已出现“支付订单”入口,显示 ByteDance 正在内部测试将扫码支付功能整合至豆包 AI 助手的技术可行性。ByteDance 未就此截图发布任何正式官方声明,上线时间、具体功能范围及定价均未披露。中国移动支付市场目前由微信支付和支付宝主导,ByteDance 此前尚未推出主流支付产品。 App Store 确认的订阅方案:三档定价与功能范围 根据 App Store 页面更新,豆包三档订阅方案的已确认定价如下: 标准版: 月费 68 元人民币 / 年费 688 元人民币 加强版: 月费 200 元人民币 / 年费 2,048 元人民币 专业版: 月费 500 元人民币 / 年费 5,088 元人民币 豆包官方确认
TOKEN-4.08%
Market Whisper·3小时前
news-image

OpenAI:TanStack 供应链攻击中未发生用户数据泄露

在 5 月 14 日,OpenAI 发布了一句话,内容涉及针对流行的开源库 TanStack 和多个 npm 包的“Mini Shai-Hulud”供应链攻击,并确认其安全团队在进行内部系统审计后,未发现用户数据遭到泄露或发生未经授权的访问的证据。 安全审计发现 在检测到对常用 npm 包的恶意攻击后,OpenAI 的安全团队对其内部系统进行了全面审查。公司确认其核心服务未被该攻击直接破坏。然而,为了确保本地环境的安全,OpenAI 已发布强制软件更新要求,适用于其官方应用的所有 macOS 用户。 用户需采取的行动 所有使用 OpenAI 官方应用的 macOS 用户都必须在 2026 年 6 月 12 日前完成软件更新,以保持安全合规并保护其本地环境。
Crypto Frontier·3小时前

WhatsApp 推出 Meta AI 无痕对话,消息自动消失引发问责机制疑虑

據 WhatsApp 官網於 5 月 13 日公告,該社交软體推出「Meta AI 无痕对話」(Meta AI Private Processing)功能,採用六項核心技術,包含可信賴執行環境 TEE 和 RA-TLS 端对端加密,確保使用者訊息在安全環境中處理,连 Meta 也无法存取对話內容,且訊息處理后自动消失。 Meta AI 无痕对話的六項確认技術 根據 Meta 技術白皮书確认的六項核心技術: 机密运算硬體:採用支援机密运算的 AMD CPU 与 Nvidia GPU 建立可信賴執行環境(TEE),包含 Meta 和主机作业系统在內,皆无法存取處理中的资料 受认证且加密的通訊:使用 RA-TLS 技術提供端对端加密,透过硬體认证验证伺服器是否執行未被竄改的软體堆疊 工件透明度:將二进位檔与模型權重等重要元件发布到第三方公开透明度日誌,供客戶端与研究人員验证執行程式碼的真实性 安全软體:透过多層次防護並將应用程式容器化,限縮攻擊面並管控资料外洩途徑 匿名路由:採用匿名憑证服務与匿蹤 HTTP 技術,透过第三方中继代理伺服器路由,对 Meta 隐藏使用者 IP 位址 短暫且无狀
Market Whisper·3小时前
news-image

GPT-5.6 已通过 Codex OAuth 成功访问,上下文窗口扩展至 150 万 tokens;预计 6 月上线

根据 Beating 的监测,OpenAI 尚未发布的 GPT-5.6 模型已在 Codex 环境中通过 ChatGPT Pro OAuth 身份验证被外部开发者成功访问,仅在 GPT-5.5 发布后三周。探测测试确认其上下文窗口为 150 万 tokens,比 GPT-5.5 的 105 万 tokens 上限增加了 43%。上周访问请求返回“model not supported”错误;本周 Pro OAuth 凭据已授予直接访问权限。 开发者 Haider 分析了 OpenAI 的发布节奏——从年度缩短到 30-45 天的间隔——预测 GPT-5.6 将在 6 月初发布。Polymarket 目前给出到 6 月 30 日 GPT-5.6 发布的概率约为 85%。
CODEX-7.69%
OPENAI1.2%
GateNews·4小时前

腾讯披露 AI 战略:2026 年下半年国产芯片供给加速,C 端变现“仍处于早期阶段”

根据 5 月 14 日财报电话会议上的相关表态,腾讯高管表示,公司预计今年资本开支将显著增加,并且国产 AI 芯片将从 2026 年下半年起逐步到货。腾讯董事会主席马化腾(Martin Lau)指出,模型训练主要是一项对未来能力的投资,可能不会带来即时回报。 在面向消费者的变现方面,Lau 表示,与西方市场两位数或更高的渗透率相比,中国的付费服务渗透率仍处于个位数。他提到,将订阅模式应用到中国市场会限制规模,而通过电子商务或广告等方式进行的替代变现仍“处于早期阶段”,即便是美国的领先玩家也尚未部署成熟的广告模型。
TENCENT-3.4%
CHIP-7.73%
IN-5.38%
GateNews·5小时前

Sam Altman 宣布:OpenAI Codex 向企业赠送两个月“免费”使用

OpenAI 执行长 Sam Altman 于 5 月 14 日宣布,在未来 30 天内,有意转用 Codex 的企业可获赠两个月完整企业版使用权,企业可通过 OpenAI 官方网站提交申请表单,或使用合作伙伴渠道(如 Stripe Atlas)的促销代码兑换。 促销条款与已确认的兑换渠道 兑换时限: 自公告日起 30 天内 兑换渠道(已确认两条): 通过 OpenAI 官方网站提交申请表单:使用合作伙伴渠道(如 Stripe Atlas)的促销代码直接兑换 促销内容: 两个月完整企业版 Codex 使用权 Codex 近期里程碑与相关政策变更 周活用户达 300 万(4 月 8 日): Codex 负责人 Thibault Sottiaux 确认,周活用户在一个月内从 200 万成长至 300 万。Sam Altman 宣布,用户数每新增 100 万,OpenAI 将重置全体用户的使用上限,此机制持续至用户总数达到 1,000 万。 旧版模型淘汰(4 月 14 日): OpenAI 已淘汰旧版 Codex 模型,并同步上线 GPT 5.2-codex、GPT 5.1 codex mi
OPENAI1.2%
CODEX-7.69%
ATLAS-2.9%
4-11.72%
Market Whisper·5小时前
news-image

SK 海力士随着 AI 芯片需求激增,市值逼近 1 万亿美元,2026 年股价上涨 200%

据路透社报道,5 月 14 日,SK hynix 的市值约达 9480 亿美元,这使得这家韩国内存芯片制造商有望成为继三星之后第二家跨过 1 万亿美元估值里程碑的公司。该公司股价在 2026 年上涨超过 200%,此前在 2025 年涨幅为 274%。这轮上涨由用于 AI 服务器的高带宽内存芯片需求飙升所推动,SK hynix 已售罄其全部 2026 年内存芯片产量。如果 SK hynix 突破 1 万亿美元的门槛,韩国将成为美国之外首个拥有不止一家具备此类估值公司的国家。
CHIP-7.73%
UP26.88%
IN-5.38%
ON-9.72%
GateNews·6小时前

AI 黑客能力每 4.7 个月翻一番;Claude Mythos 预览和 GPT-5.5 超出测试上限

据英国人工智能安全研究所(AISI)称,AI 模型的自主网络安全能力正在以前所未有的速度增长。自 2024 年末以来,AI 每 4.7 个月就会将其独立完成复杂网络任务的能力翻倍;最近,Claude Mythos Preview 和 GPT-5.5 已突破了这一增长曲线。尽管将单个任务限制为 250 万 tokens,这两款模型在 12 小时内、最高难度任务中的成功率都接近 100%。Claude Mythos Preview 成为首个完全渗透两种企业网络靶场场景的模型,包括高难度的 Cooling Tower 靶场(10 次尝试中 3 次成功);而 GPT-5.5 则在 The Last Ones 靶场中 10 次尝试获得 3 次成功。
GateNews·6小时前

Anthropic 和 OpenAI 的 PreStocks 在公司就未经授权的转账发出警告后暴跌 38-46%

据报道,Anthropic 和 OpenAI 已就未经授权的股权转让发出警告,包括通过 SPV、代币化工具或远期合约进行的交易,称此类交易可能无效,并且公司可能无法识别。相关的谨慎声明引发了 Solana 上相关 PreStocks 代币的急剧下跌,其中 Anthropic PreStocks 下跌约 38%,OpenAI PreStocks 下跌约 46%。 两家公司均强调,其普通股和优先股均受到严格的转让限制,未经董事会批准的交易将不获得股东权利的认可。OpenAI 还进一步警告,此类交易可能违反美国证券法,导致买方无法获得任何实际的经济利益。PreStocks 是旨在追踪私营公司隐含估值的代币化工具,但并未获得所依据公司方面的官方授权。
GateNews·7小时前