返回行业动态

Holo3.1发布:支持本地运行的轻量化计算机操作智能体

2026/06/02 14:14
查看原文

OmniTools 6月2日消息,Hugging Face 官方博客 6月2日消息,HCompany团队于6月2日发布Holo3.1系列模型,聚焦快速、本地化的计算机操作智能体(Computer Use Agents)。该版本基于Qwen架构,新增对桌面、Web及Android移动环境的跨平台鲁棒性支持。在AndroidWorld基准测试中,35B-A3B模型准确率从67%提升至79.3%,4B与9B小模型也分别由58%升至72%。

Holo3.1首次提供FP8、Q4 GGUF和NVFP4三种量化格式检查点,适配消费级硬件本地部署。其中NVFP4在DGX Spark上实现相较BF16达1.74倍的token吞吐量,端到端单步耗时由6.8秒降至3.3秒;Q4 GGUF版本则支持Windows/macOS本地运行,全程数据不出本地网络。

模型家族涵盖0.8B、4B、9B及35B-A3B四档参数规模,分别面向超轻量本地代理、成本敏感部署、性能与延迟平衡及SOTA任务场景,并原生支持function-calling协议,便于集成至第三方智能体框架。