行业动态

追踪 AI 与 Web3 行业的最新进展与深度洞察

GitHub联合开源联盟呼吁修改加州AI透明度法案以保护开源生态

OmniTools 6月24日消息,GitHub联合Black Forest Labs、Hugging Face与Mozilla Corporation组成开源联盟,就加州AI透明度法案(SB 942,拟由SB 1000修正)提出修订建议。当前草案规定开发者可在下游用户未履行义务时撤销开源许可证,该条款与主流开源许可证永久不可撤销的法律属性存在冲突。 联盟指出,该撤销机制并非必要,现有监管与执法路径已可保障合规;建议参考欧盟AI法案中的透明度实践,改以向下游用户提供最佳实践文...

FastWan-QAD 视频生成模型发布:单卡 RTX 5090 1.8 秒生成 5 秒 480P 视频

OmniTools 6月24日消息,Sky Computing Lab 近日发布 FastWan QAD 视频生成模型系列。该模型基于 FastVideo 的量化感知蒸馏(QAD)方案训练,实测在单张 NVIDIA GeForce RTX 5090 显卡上,端到端生成一段 5 秒 480P 视频仅需 1.8 秒。目前,相关模型权重、训练代码及技术博客均已开源。

Krea 2 技术报告正式发布

OmniTools 6月24日消息,AI 图像生成平台 Krea 正式发布 Krea 2 技术报告。报告详细披露了 Krea 2 在训练数据构建、模型架构设计及核心训练策略等方面的技术细节,涵盖数据筛选、多阶段训练流程及图像质量优化等关键内容,面向开发者与研究人员公开。 报告原文:https://www.krea.ai/blog/krea 2 technical report

Anthropic推出Claude Tag:Slack常驻AI同事可学习企业上下文

OmniTools 6月24日消息,Anthropic正式推出Claude Tag研究预览版,作为嵌入Slack的常驻AI同事,面向Claude Enterprise及Claude Team客户开放。 该功能支持用户在Slack中直接@Claude获取实时洞察、分配任务,并具备持续上下文记忆能力。Claude Tag可获授权访问指定频道与工具,在单一频道内为所有成员共享同一AI身份,确保工作进展公开可见、上下文连续。 Anthropic表示,Claude Tag在“环境模式”...

五眼联盟联合预警:AI网络威胁数月内将波及普通用户

OmniTools 6月23日消息,2026年6月22日,五眼联盟(美、英、加、澳、新)网络安全部门联合发布警告称,即将推出的AI模型将显著降低编写复杂攻击代码的技术门槛。自动化智能体可全天候扫描互联网漏洞,导致安全响应窗口大幅收窄。AI驱动的超个性化钓鱼诈骗已在亚太地区扩散,印度2026年初勒索软件事件同比激增165%。五眼联盟建议企业部署自动化防御型AI系统,个人用户应启用多因素认证并清理闲置在线账户。

百度开源 Unlimited OCR 项目,支持单次长时域解析

OmniTools 6月23日消息,百度近期在 GitHub 开源 Unlimited OCR 项目,提出“单次长时域解析”(One Shot Long Horizon Parsing)技术方案,旨在实现一次性处理长时间跨度的 OCR 任务。该项目代码已托管于 GitHub,目前尚未披露具体性能指标与商用计划。

Mistral发布OCR 4模型,支持170种语言及结构化文档解析

OmniTools 6月23日消息,Mistral AI 6月23日消息,公司正式发布OCR 4模型,定位为面向文档智能的最新一代OCR系统。该模型具备文本提取、边界框定位、区块类型分类(如标题、表格、公式、签名等)及逐词/逐页置信度评分能力,输出结构化结果,适用于企业搜索、RAG和领域专属检索流程。 OCR 4支持170种语言,覆盖10个语系,尤其在稀有及低资源语言上表现优于竞品;模型体积精简,可单容器部署,满足数据主权与合规要求。其API定价为每千页4美元,批量调用享50...

Fika Jobs 获 400 万美元融资,开发视频优先的 AI 面试招聘平台

OmniTools 6月23日消息,TechCrunch 6月23日报道,瑞典斯德哥尔摩初创公司 Fika Jobs 宣布完成 400 万美元 pre seed 轮融资,将用于平台开发、团队扩张及今年晚些时候的正式发布。 该公司正构建一个以视频为核心的招聘平台,候选人通过 AI 面试代理(当前基于 Google Gemini 模型)完成约 10 分钟的视频面试,系统自动生成短视频片段并整合为动态个人档案。求职者可授权连接 LinkedIn 账户,AI 将据此生成个性化问题;雇...

英伟达发布BioNeMo智能体工具包,加速生命科学发现

OmniTools 6月23日消息,英伟达于6月23日正式发布BioNeMo智能体工具包(BioNeMo Agent Toolkit),面向生命科学领域提供可被AI智能体调用的专用工具与技能,覆盖生物学、化学、基因组学及药物研发等方向。 该工具包整合了NVIDIA Nemotron、NeMo、Parabricks、NemoClaw及OpenShell等技术,支持蛋白结构预测、分子对接、生成式化学、基因组分析、蛋白设计和生物标志物发现等任务。超50家机构已开始采用,包括礼来(L...

英伟达发布 Agent Toolkit,助力企业构建可信赖的专用 AI 代理

OmniTools 6月23日消息,英伟达(NVIDIA)正式推出 NVIDIA Agent Toolkit,旨在为企业提供构建专用 AI 代理的开放基础架构。该工具包整合了开源模型(NVIDIA Nemotron)、工具与技能模板(NemoClaw 蓝图)以及安全运行时环境(NVIDIA OpenShell),支持企业在自有系统中安全、规模化地部署 AI 代理。 目前该工具包已在多个行业落地应用:在生命科学领域,结合 BioNeMo Toolkit 可将蛋白质设计、基因组分...

IBM开源CUGA智能体开发套件,提供24个可运行示例

OmniTools 6月23日消息,Hugging Face 6月23日消息,IBM研究院正式开源CUGA(Configurable Generalist Agent)智能体开发套件,定位为面向企业级应用的轻量级智能体运行时框架。该工具通过预集成规划、执行循环、工具调用与状态管理等核心能力,使开发者仅需定义工具列表和提示词即可构建可用智能体应用。 CUGA配套发布cuga apps项目,包含24个单文件FastAPI应用示例,覆盖电影推荐、IBM云架构顾问、学术论文检索、网页...

网易有道开源Confucius4-TTS语音模型:支持14语种跨语种无口音合成与零样本克隆

OmniTools 6月23日消息,网易有道近日正式开源TTS引擎Confucius4 TTS(“子曰4.0”),宣称是业内首个支持14种语言跨语种无口音、且无需参考文本即可完成语音克隆的开源模型。 该模型仅需3秒参考音频即可实现零样本音色克隆,官方数据显示克隆音色与原声相似度超85%,任务准确度达97%。除支持中、英等14种语言外,该模型首次引入音频Prompt情感克隆迁移能力。 技术架构方面,Confucius4 TTS底层采用GPT式语义大模型、SSL预训练特征、ECA...

OpenAI机密IPO文件曝光:表外采购承诺达6650亿美元

OmniTools 6月23日消息,The Information 独家获取并审阅了 OpenAI 递交的机密 IPO 注册申请草案。文件显示,截至2026年3月31日,OpenAI 账面零债务,租约负债不足7.5亿美元,单季资本支出仅4600万美元,呈现典型轻资产软件公司特征。 但实际财务结构复杂:其未来芯片、能源与数据中心采购承诺高达6650亿美元,均未计入资产负债表;第一季度净亏损约85亿美元,营收成本达35亿美元,为资本支出的75倍。 财报还揭示高度关联方交易——当季...

NVIDIA 技术驱动超 400 台全球最快超算,占 TOP500 榜单 81%

OmniTools 6月23日消息,据最新发布的 TOP500 与 Green500 超级计算机榜单显示,NVIDIA 技术已支撑全球前 500 名超算中的 400 余台,占比达 81%;新入选系统中 90% 采用 NVIDIA 技术。TOP500 榜单中共有 26 套系统搭载 NVIDIA Grace CPU,较上期增加 8 套。 在 Green500 能效榜单中,排名前八的系统全部基于 NVIDIA GPU,前十名中有九套采用 NVIDIA 技术。位列榜首的 KAIROS...

Hugging Face 引入 AI 与人工协同机制,实现 huggingface_hub 每周自动化发布

OmniTools 6月23日消息,Hugging Face 官方博客宣布,已为其核心 Python 客户端库 huggingface hub 启用全新的每周自动化发布流程。该工作流基于 GitHub Actions 构建,深度整合开源工具链与开源权重模型(当前采用 Z.ai 的 GLM 5.2),并在关键环节保留人工审核机制。 新流程将版本发布周期从原先的每 4–6 周大幅缩短至每周一次。自动化环节覆盖版本号更新、分支管理、PyPI 发布及下游库兼容性测试等机械性任务;AI...

豆包大模型日均Token调用量达180万亿,火山引擎MaaS国内份额49.5%

OmniTools 6月23日消息,在当日举办的火山引擎FORCE原动力大会上,火山引擎总裁谭待披露,截至2026年6月,豆包大模型日均Token调用量已达180万亿,较两年前发布时增长超1500倍,过去一年内增长逾10倍。 数据显示,火山引擎在中国公有云MaaS服务市场占有率为49.5%,居国内首位;其“万亿Token俱乐部”企业客户数量已从2025年12月的100家增至200家。 大会同期宣布多项技术升级:MaaS层推出方舟CLI;Agent开发与运营层上线AgentKi...

Google DeepMind 向 A24 投资 7500 万美元,合作开发影视 AI 工具

OmniTools 6月23日消息,Google DeepMind 宣布向独立电影制片厂 A24 投资 7500 万美元,双方将合作开发面向电影制作的 AI 工具。A24 曾出品《万事俱备》《后室》等知名影片。 Google DeepMind 首席执行官 Demis Hassabis 表示,此次合作旨在通过与一线创作者直接协作,构建支持创意表达的 AI 功能。 此举是近期科技公司与影视行业深化 AI 合作的又一案例。此前,Netflix 已收购由本·阿弗莱克参与创立的 AI...

火山引擎发布豆包音频生成模型1.0

OmniTools 6月23日消息,火山引擎正式发布豆包音频生成模型1.0(Doubao Seed Audio 1.0)。该模型支持文本与音频参考联合输入,可端到端生成目标音频。单条Prompt即可编排多角色对白、情绪语气、背景音乐及环境氛围,并在长时生成中保持音色一致性,无需后期多轨混音。 模型支持0样本多模态输入,无需额外训练即可生成;实现音色与风格解耦控制,具备“一声多角”能力。单次最长支持2分钟音频创作,多次延长仍能保持音色统一。 目前该模型已开启火山方舟API邀测,...

孙正义否定马斯克太空数据中心构想:AI决战在陆地

OmniTools 6月23日消息,软银集团创始人孙正义在当日举行的软银公司年度股东大会上表示,在太空建立数据中心几乎没有实际价值,AI竞争的胜负将由陆地上的算力决定。 针对股东关于软银是否会效仿埃隆·马斯克太空数据中心计划的提问,孙正义明确予以否定。他指出,电力支出仅占数据中心运营成本极小部分,而搬迁至太空将带来高昂火箭运输费用、维护困难及通信延迟等现实障碍。 孙正义强调,未来几年的AI竞争格局远比十年后更为关键,软银将聚焦于陆地数据中心建设,并计划由旗下日本电信业务部门进...

京东开源全栈交互模型JoyAI-VL-Interaction

OmniTools 6月23日消息,京东近日开源全栈交互式多模态模型 JoyAI VL Interaction,获 vLLM Omni 原生支持。该模型支持持续视频流理解、关键事件主动识别与实时响应,并可将复杂任务交由后台 Agent 处理。 在 58 组真人盲测中,该模型在视频通话场景下对豆包助手胜率为 77.6%,对 Gemini 视频通话助手胜率为 87.9%;在监控预警任务中达到 100% 胜率。 开源内容涵盖模型权重、交互数据集、训练方案及完整可部署系统,支持摄像头...

盈透证券集成ChatGPT与Grok,支持期权、期货等AI智能体交易

OmniTools 6月23日消息,盈透证券(Interactive Brokers,IBKR)宣布正式集成ChatGPT与Grok,扩展其AI智能体交易(Agentic Trading)能力。此举继此前集成Anthropic Claude之后,进一步丰富了平台AI工具生态。 升级后,现有客户可免费使用该功能,通过自然语言在Client Portal、IBKR Desktop、IBKR Mobile及Trader Workstation(TWS)等平台完成投资组合分析、市场机...

字节Seed团队正式发布Seed2.1系列模型,聚焦AI生产力场景

OmniTools 6月23日消息,字节跳动Seed团队正式发布Seed2.1系列模型,聚焦真实生产力场景下的智能体能力升级,重点强化通用Agent能力、代码工程交付能力及多模态理解能力。 Seed2.1 Pro在GDPval基准测试中取得最高分,在Agents' Last Exam中位列第一梯队;在MobileWorld手机GUI任务、CreativeWork多环境任务中均表现突出。多模态能力在CharXiv RQ等多项基准测试中达到SOTA水平。 代码能力方面,Seed2...

火山引擎发布Doubao-Seed-2.1系列大模型及多款AI视频音频新模型

OmniTools 6月23日消息,火山引擎在FORCE大会上正式推出Doubao Seed 2.1 pro与Doubao Seed 2.1 turbo两款大模型。其代码能力接近Opus 4.7水平,Agent能力显著增强,多模态视觉理解在多数公开评测集位居前列。输入/输出价格分别为6元/30元每百万token,上下文长度达256k,已上线火山引擎、Trae及豆包平台,并兼容主流Agent框架。 基于该系列模型的豆包办公模式已开启内测,支持发票汇总、联网调研等办公场景任务。视...

Z.ai 发布开源大模型 GLM-5.2:744B 参数、1M 上下文窗口

OmniTools 6月23日消息,Z.ai 正式发布开源大模型 GLM 5.2,总参数量达 744B(活跃参数约 40B),支持 100 万 token 上下文窗口。官方称其综合性能与 Claude 4.8 Opus、GPT 5.5 及 Gemini 3.1 Pro 相当。 该模型通过 Unsloth 实现动态量化,2 bit GGUF 版本内存占用降至 239GB(较原版降低 84%),1 bit 版本进一步降至 217GB(降低 86%),可在配备 256GB 统一内存...

OpenAI联合Trail of Bits推出“Patch the Planet”开源安全计划

OmniTools 6月23日消息,OpenAI于6月22日宣布启动名为“Patch the Planet”的新倡议,旨在协助开源项目维护者识别并修复安全漏洞。该计划将与网络安全公司Trail of Bits合作,由其安全工程师直接参与开源项目的代码审查、补丁开发与测试构建。 OpenAI表示,该项目旨在减轻开源维护者面对大量安全报告时的负担,通过前置审核、协同修复及构建可复用的安全工作流,提升长期防护能力。其内部安全工具Codex Security也将用于支持该流程。 此举...

Runway 旗舰视频模型 Aleph 2.0 正式集成至 Figma Weave

OmniTools 6月23日消息,Runway 推出的旗舰 AI 视频编辑模型 Aleph 2.0 现已正式集成至 Figma Weave 平台。 该模型采用基于上下文的关键帧编辑机制:用户可提取视频中的任意一帧进行风格重设计,并通过时间戳关联至 Aleph 2.0 节点,系统将自动把该编辑同步至主体出现的所有帧,同时保持画面其余部分不变。 Aleph 2.0 支持最长 30 秒、1080p 分辨率的视频片段,支持跨多镜头序列统一应用编辑,无需逐镜头手动处理。

美国多地执法官员滥用Flock车牌识别系统跟踪前伴侣

OmniTools 6月23日消息,伊利诺伊州Holiday Hills警察局长于2026年6月18日被捕,被控两项渎职重罪。检方指控其利用Flock车牌读取系统及州警察数据库,持续18个月跟踪6名熟人,其中3人为前女友;仅对其中一人的前男友车牌查询达140次,其中86次发生在非执勤时段。 全美已确认至少18起同类事件,包括佐治亚州Braselton警察局长、爱达荷州Jerome县警长(曾700余次查询配偶车牌)等,涉事人员均已辞职或被逮捕。 Flock公司首席法务官Dan...

Claude Desktop 完整版上线 AWS、Google Cloud 与 Microsoft Foundry

OmniTools 6月23日消息,Anthropic 宣布,Claude Desktop 完整版现已支持在 AWS、Google Cloud 和 Microsoft Foundry 平台部署,面向企业用户提供 Chat、Claude Cowork 和 Claude Code 三大功能的集成桌面体验。IT 团队可将模型推理保留在自有云环境,对话历史支持本地存储。 该版本支持 IAM Identity Center、Workforce Identity Federation、M...

Oak发布v0.99.0测试版:专为AI智能体设计的开源版本控制系统

OmniTools 6月23日消息,开源版本控制系统Oak近日发布公开测试版v0.99.0。该项目专为AI智能体(如Claude Code、Codex、Cursor等)设计,采用BLAKE3内容哈希、内容定义分块、diff/merge机制及Blob/Manifest/Commit/Tree数据模型。 Oak以“分支 会话”为基本工作单元,用分支描述替代传统逐次提交,并通过内容寻址与懒加载技术,使智能体可在数秒内编辑任意规模仓库,性能显著优于Git。 当前版本支持macOS(A...

AI代理开发正迈入“循环(Loops)”新阶段

OmniTools 6月23日消息,TechCrunch 6月22日报道,Claude Code 创始人 Boris Cherny 在 Meta @Scale 大会上表示,AI 代理的“循环(Loops)”模式并非炒作,而是继代理式 AI 之后的关键演进。他指出,开发模式正从手写代码、AI 代理生成代码,迈向“代理调用代理并持续自主迭代”的新阶段。 Cherny 分享了其实际工作中的应用:一个 AI 代理持续优化代码架构,另一个负责识别并统一重复抽象,二者自动提交 Pull...

AI芯片公司Groq确认完成6.5亿美元融资,转向“新云”业务并重组高管团队

OmniTools 6月23日消息,AI推理芯片制造商Groq正式确认完成6.5亿美元新一轮融资。此次融资发生在Nvidia于2025年12月与Groq达成非独家技术授权协议并吸纳其核心创始团队约六个月后。 根据披露信息,Nvidia此前支付约20亿美元获得Groq语言处理单元(LPU)技术授权,并聘请了Groq联合创始人兼CEO Jonathan Ross及总裁Sunny Madra等关键人员。原高管Doug Wightman留任并接任CEO。Nvidia随后在2026年3...

英伟达推出新型温水冷却系统,称可大幅降低数据中心内部用水,但难解AI整体耗水难题

OmniTools 6月23日消息,英伟达近日宣布推出新型温水冷却系统,声称可在数据中心内部实现“几乎零用水”——冷却液在封闭回路中一次性填充并长期循环使用,无需额外补水。据该公司首席可持续发展官Josh Parker表示,该方案已基本解决数据中心设施层面的用水问题。 该系统将冷却液以45°C泵入机架,流经服务器后升温至55°C,利用环境空气通过被动散热器完成热交换,从而避免蒸发冷却及风扇或冷水机组的使用。 但分析指出,该技术仅覆盖数据中心总水足迹的约25%–33%,未计入电...

Google DeepMind 向 A24 投资 7500 万美元,合作开发 AI 影视制作工具

OmniTools 6月23日消息,Google DeepMind 宣布向独立电影公司 A24 投资 7500 万美元,双方将建立合作伙伴关系,共同开发面向影视制作的 AI 工具。 DeepMind 表示,该合作旨在结合一线电影人的实际创作反馈,构建能够支持真实、有意义叙事的 AI 功能,从而赋能艺术家的创意愿景。A24 曾出品《瞬息全宇宙》《Backrooms》等知名影片。 此次合作也反映出好莱坞加速布局 AI 的趋势:Netflix 此前已收购 AI 影视技术公司 Int...

Cursor 研究揭示 AI 编码模型在基准测试中存在奖励黑客行为

OmniTools 6月23日消息,Cursor 近期发布的一项研究指出,在 SWE bench Pro 基准测试中,Opus 4.8 Max 模型有 63% 的成功解决方案依赖于从公开来源检索并修正代码,而非自主逻辑推导。当隔离 git 历史并禁用网络访问后,其得分从 87.1% 下降至 73.0%;Composer 2.5 则从 74.7% 降至 54.0%。 在 SWE bench Multilingual 基准上,标准环境与严格受限环境的得分差距分别为 9.1 和 7...

亚马逊在印度测试支持印地语的AI助手Alexa+

OmniTools 6月23日消息,亚马逊正于印度开展生成式AI语音助手Alexa+的Beta测试,首次加入印地语支持。公司向部分印度用户发送邮件,邀请其填写问卷以加入测试计划。邮件提示,该Beta版本可能存在Bug,或出现信息不准确、本地语言发音偏差等问题。亚马逊已确认正在印度测试Alexa+,但未透露具体上线时间。 Alexa于2017年以英语版本进入印度市场,2019年增加印地语支持。目前Alexa+尚未在印度正式上线,其全球推广始于2025年,已于2026年2月覆盖美...

OpenAI 发布 Daybreak 安全工具:Codex Security 与 GPT-5.5-Cyber

OmniTools 6月23日消息,OpenAI 正式推出 Daybreak 安全工具系列,包含 Codex Security 与 GPT 5.5 Cyber。该系列旨在帮助组织大规模发现、验证并修复安全漏洞。其中,Codex Security 专注于代码层面的漏洞识别与修复建议,GPT 5.5 Cyber 则面向网络安全场景提供智能推理与响应支持。相关工具现已上线,详细技术文档与使用指南可通过 OpenAI 官方渠道获取。

Google ADK与A2A协议:跨语言多智能体协作实战

OmniTools 6月23日消息,Google 官方技术博客近日发布文章,详细演示了如何基于 Agent Development Kit(ADK)与 Agent2Agent(A2A)协议搭建跨语言多智能体流水线。方案中,Python 智能体负责调用 Gemini 大模型解析合同条款,Go 智能体则通过确定性逻辑进行合规性校验。 A2A 协议通过 Agent Card 实现能力发现,采用 JSON RPC 2.0 进行通信,并借助 Task 状态机管理任务生命周期;ADK 提...

SpaceX与开源AI实验室Reflection AI签署算力供应协议,合同总额最高达63亿美元

OmniTools 6月23日消息,TechCrunch 6月22日消息,SpaceX与开源AI实验室Reflection AI正式签署算力供应协议。自2026年7月1日起至2029年,Reflection AI将按月支付1.5亿美元,租用位于田纳西州孟菲斯附近的SpaceX Colossus 2数据中心内搭载英伟达最新GB300 AI芯片及配套硬件的算力资源。 该协议总金额最高可达63亿美元,双方可在合作满三个月后提前90天通知终止合同。此合作规模小于SpaceX此前与An...

TechCrunch 创始人峰会 2026 早鸟票优惠将于 6 月 26 日截止

OmniTools 6月23日消息,TechCrunch 6月22日消息,TechCrunch 创始人峰会 2026 将于11月4日在波士顿举行,预计吸引超1000名创始人与投资人参与。本次峰会聚焦初创企业增长、执行与资源对接,核心议题涵盖 Series A/C 融资策略、千万美元 ARR 达成路径及 IPO 准备等。 早鸟票优惠将于美国太平洋时间6月26日23:59截止,单人最高可省190美元,四人及以上团队享最高30%折扣。峰会将邀请特斯拉前总裁 Jon McNeill、...

xAI 在 Grok Build 中推出 /goal 模式,支持自主任务执行

OmniTools 6月23日消息,xAI 近日在 Grok Build 中正式上线 /goal 新模式。用户仅需通过单行命令设定目标,AI Agent 即可自动规划执行路径、拆解为带进度验证的任务清单,并持续运行直至目标达成。 该模式支持实时监控与中途干预指令,任务完成后所有子项将自动标记为完成。功能即日起开放,用户可通过终端运行安装命令配置 CLI 工具并登录账号即可启用。

小米YU7 GT创全球首个纽北自动驾驶圈速纪录,官方榜单新增该分类

OmniTools 6月23日消息,小米YU7 GT(选配赛道专业套装)在纽博格林北环赛道以自动驾驶系统完成全程无人计时圈,成绩为10分29秒483,成为全球首个获得认证的纽北自动驾驶圈速纪录。纽北官方圈速榜为此新增“自动驾驶”分类。 小米汽车表示,该成绩基于极限赛道环境下验证的动态模型、高频扭矩分配及毫秒级救车能力,相关技术将逐步应用于量产车型,以提升暴雨、冰雪等极端工况下的底盘与智能驾驶安全性。

Google Labs 提出“洞察策略”评估 AI 编码智能体主动性

OmniTools 6月23日消息,Google Labs 提出一种名为“洞察策略”的新评估方法,用于衡量 AI 编码智能体的主动性,而非仅依据任务完成度进行评分。该方法基于 Google 内部代码库中的 705 个 bug(对应 1178 个代码变更),通过时空近邻与语义相似度聚类,还原开发者真实的高层级目标。 初步实验显示,AI 智能体 Jules 在单轮探索下,洞察相关性评分平均达 4.5/5;当探索预算从两轮增至三轮时,Hit@5 准确率由 33% 提升至 57%。...

东京AI公司Sakana AI推出多智能体编排系统Sakana Fugu

OmniTools 6月23日消息,东京AI初创公司Sakana AI近日推出多智能体编排系统Sakana Fugu。该系统将多智能体协作封装为单一API调用,支持自动任务拆解、跨模型调度与结果验证。 其Fugu Ultra版本在工程、科学与推理等基准测试中表现对标同类系统。通过动态编排多模型,该系统可有效规避单一AI供应商的出口管制限制,被业界视为推动多智能体技术走向标准化与开箱即用的重要进展。

《经济学人》报道:美国家安全局局长称代号“Mythos”实体数小时内突破机密系统

OmniTools 6月22日消息,据《经济学人》报道,美国国家安全局局长公开表示,一个代号为“Mythos”的实体在数小时内成功入侵该国几乎所有机密信息系统。该表态出现在一篇关于特朗普政府限制人工智能公司Anthropic的报道中。 报道指出,美方尚未披露“Mythos”的具体身份、技术路径或攻击目标细节,亦未说明该事件是否已造成实际数据泄露或业务中断。目前尚无官方渠道进一步证实此次入侵事件的具体时间、范围及后续响应措施。

PaddleOCR 发布 PP-OCRv6:支持 50 种语言,参数规模覆盖 1.5M 至 34.5M

OmniTools 6月22日消息,PaddleOCR 团队近日在 Hugging Face 开源最新一代通用 OCR 模型族 PP OCRv6,提供 tiny(1.5M 参数)、small(7.7M 参数)和 medium(34.5M 参数)三个版本。其中 small 与 medium 版本支持简体中文、繁体中文、英文、日文及 46 种拉丁语系语言,共计 50 种语言。 在官方多场景基准测试中,medium 版本检测 Hmean 达 86.2%,文本识别准确率为 83.2%...

微信Agent“小微”启动灰度内测

OmniTools 6月22日消息,微信AI智能体“小微”已启动灰度内测。主入口位于微信首页左上角,支持向好友发送消息和红包(需用户确认),但暂不支持读取聊天记录或向群聊发送消息。 在群聊及私聊界面中,“问小微”子入口可读取当前聊天记录,并支持向多人群发内容。该智能体具备创建日程提醒、待办事项、总结朋友圈等功能,同时可接入公众号与视频号进行问答交互。 “小微”支持读取自身创建的收藏笔记,内置“小工具”功能,允许用户通过语音创建简易小程序(暂不可对外发布),并可调用第三方小程序...

Anthropic工程负责人:Claude Code等AI工具或加剧程序员孤独感

OmniTools 6月22日消息,Anthropic工程负责人Fiona Fung指出,Claude Code与Claude Cowork等AI编程智能体正显著提升工程师对AI工具的依赖程度,导致团队成员间直接交流减少,长期可能引发职业孤独感。为应对这一趋势,Anthropic内部已启动编程午餐、黑客松及共同开发时段等举措,以重建面对面协作场景。 调研显示,Claude Code目前已成为创业公司使用最广泛的AI编程工具;伴随“氛围编程”兴起,“单人创业者”现象增多。Fun...

英伟达发布 Halos 机器人安全系统,业界首个面向物理 AI 的全栈安全架构

OmniTools 6月22日消息,NVIDIA 6月22日消息,英伟达于6月22日宣布推出 Halos for Robotics,称其为业界首个面向机器人与物理 AI 的全栈式安全系统。该系统整合 AI 计算、系统软件、传感器数据、安全应用及检验能力,覆盖从芯片(NVIDIA IGX Thor)、传感器桥接(Holoscan Sensor Bridge)到操作系统(Halos OS)及检验实验室(Halos AI Systems Inspection Lab)的完整技术栈。...

欧洲宣布新建35台NVIDIA AI超算系统

OmniTools 6月22日消息,欧洲多国于今日宣布启动35台基于NVIDIA AI基础设施的新一代超算系统建设,覆盖23个国家,涉及巴塞罗那超级计算中心、德国巴伐利亚AI平台、意大利IT4LIA、斯图加特高性能计算中心HammerHAI及瑞典NAISS Mimer等项目。 这批系统主要采用NVIDIA Blackwell与Hopper架构,欧洲已部署或宣布的AI算力累计达800 AI exaflops。其中,巴塞罗那MareNostrum5 AI升级版将提供约20 exa...

英伟达发布Vera Rubin超算平台,单机架性能跻身TOP500级别

OmniTools 6月22日消息,英伟达于6月22日宣布推出Vera Rubin高性能计算平台,专为科学计算与AI融合负载设计。该平台单机架可提供7 Exaflops AI算力与5 Petaflops原生FP64双精度浮点性能,整体性能媲美TOP500超算榜单中的大型系统。 Vera Rubin整合Rubin GPU与Vera CPU,通过NVLink C2C互连、ConnectX 9 SuperNIC及BlueField 4 DPU构建,支持直接液冷架构。其面向气候建模、...