行业深度

AI工具评测、选型指南与行业深度分析

聚焦 AI 工具、模型、Agent、内容生产和 Web3 应用,用教程、评测、案例和对比文章帮你更快判断工具怎么选、怎么用。

1.6万亿参数与缓存免费:拆解美团LongCat-2.0的Agent成本经济学
行业深度/2026/07/01/11 分钟阅读

1.6万亿参数与缓存免费:拆解美团LongCat-2.0的Agent成本经济学

2026年4月底,一个名为Owl Alpha的匿名模型悄然上线OpenRouter,两个月后其真身揭晓为美团正式发布的LongCat-2.0。这款基于5万张国产GPU训练的1.6万亿参数大模型,凭借缓存免费机制和极具攻击性的限时折扣,迅速冲进平台调用量前三。本文将拆解LongCat-2.0的MoE架构如何降低推理成本,分析缓存免费如何改变Agent开发经济学,并探讨国产大模型在正式发布前热衷于在OpenRouter进行匿名预览的行业逻辑。

阅读全文

编辑推荐

查看全部
0111 分钟阅读

1.6万亿参数与缓存免费:拆解美团LongCat-2.0的Agent成本经济学

2026年4月底,一个名为Owl Alpha的匿名模型悄然上线OpenRouter,两个月后其真身揭晓为美团正式发布的LongCat-2.0。这款基于5万张国产GPU训练的1.6万亿参数大模型,凭借缓存免费机制和极具攻击性的限时折扣,迅速冲进平台调用量前三。本文将拆解LongCat-2.0的MoE架构如何降低推理成本,分析缓存免费如何改变Agent开发经济学,并探讨国产大模型在正式发布前热衷于在OpenRouter进行匿名预览的行业逻辑。

029 分钟阅读

凌晨5点找AI要安眠药:一份大模型使用时间表里的人类图鉴

Anthropic最新发布的《Economic Index》六月报告揭示,AI已深度嵌入人类的生物钟与情感缝隙。从早7点的新闻查询到凌晨5点的睡眠求助,从周末飙升的个人对话到报税日前激增的财务请求,AI正从生产力工具演变为生活基础设施。更反常识的是,把工作最大胆委托给AI的人,反而对失业最不焦虑。本文从人类行为学视角,拆解这份时间表背后的生活节律重塑与工作心理变迁。

0311 分钟阅读

Deepseek提速85%背后:大模型告别参数内卷,开打成本战

2026年6月,梁文锋署名的DSpark论文发布,DeepSeek-V4线上服务在真实流量下生成速度大涨85%。这并非单纯的硬件升级,而是通过置信度调度消灭无效校验带来的算力浪费。大模型竞争正从参数规模狂奔,转向推理效率与算力成本的系统级工程博弈。

按主题浏览

筛选教程、评测和选型文章

全部深度文章

持续更新 AI 工具评测、模型教程和案例分析
盘点16个把自己蒸馏成Skills的国民级App。
选型指南转载

盘点16个把自己蒸馏成Skills的国民级App。

最近看到越来越多的一些国民级产品,开始把自己的一些能力,给封装称Skill或者MCP,来向大家开放,我觉得这个大家逐渐为Agent来做能力的趋势,越来越明显了。 特别是前段时间瑞幸咖啡上线了AI开放平台,支持MCP、CLI、Skill三种接入方式。 能够实现用AI点咖啡、查门店、搜商品等等等等。 我

2026/07/016 分钟阅读
用Codex搭建大神Karpathy同款知识库,我养出了比我还懂的AI | 附保姆级教程
选型指南转载

用Codex搭建大神Karpathy同款知识库,我养出了比我还懂的AI | 附保姆级教程

“我的人生现在在哪个阶段? 是奥德赛时期吗?” 我把这个问题丢给 AI。 它看完以后,给了我一个有点离谱、但又莫名准确的答案: 你现在是甄嬛的甘露寺时期。 身处低谷,暂时蛰伏,能力还在积累,时机还没真正到来。 向左滑动查看更多内容 如果只是普通 AI 这么说,我大概也会觉得它在瞎编。 但这一次,它不

2026/07/018 分钟阅读
往 Codex 里塞块无限画布,AI 改图终于能指哪打哪了|附教程
选型指南转载

往 Codex 里塞块无限画布,AI 改图终于能指哪打哪了|附教程

和 Codex、Claude Code 等 Coding Agent 沟通,很多时候就像站在许愿池边,对着池子里的王八扔硬币,嘴里念念有词,关键它还真给你兑现愿望。 因此,对很多不懂代码的人来说,Codex 带来的亢奋感是肉眼可见的—— 它让人第一次感觉,自己也能指挥电脑干活。 🔗 https://

2026/07/015 分钟阅读
大模型最后一层竟是推理累赘?绕开对齐税,奥数准确率暴涨 22.4%!
选型指南转载

大模型最后一层竟是推理累赘?绕开对齐税,奥数准确率暴涨 22.4%!

Qwen 团队 投稿 量子位 | 公众号 QbitAI 传统认知默认:随着网络深度单调递增,思考结果也会变得更准确。 各类开源自回归大语言模型 (LLM) 的生成,也总是从最后一层输出。 然而,来自 Qwen团队、清华大学、南洋理工大学 的最新研究成果打破了这一固有假设。 他们揭示了一个普遍存在的

2026/07/0110 分钟阅读
刚刚,GPT-5.6 正式发布,史上最强但被自己坑惨了
选型指南转载

刚刚,GPT-5.6 正式发布,史上最强但被自己坑惨了

就在刚刚,GPT-5.6 系列正式发布, 不过,它并没有直接全面开放,而是以「有限预览」的方式先行试水。 作为 OpenAI 最强的一代, GPT-5.6 一口气端出三款型号,名字起得颇有诗意: Sol(太阳)是旗舰模型,也是 OpenAI 口中目前最强的模型; Terra(地球/大地)是面向日常工

2026/07/017 分钟阅读
分享2个Vibe Coding必备的超实用Prompt。
选型指南转载

分享2个Vibe Coding必备的超实用Prompt。

周末跟几个之前的老朋友吃饭。 大家也都不由自主的聊到了AI,然后也聊到了Vibe Coding。 因为几乎都不是专业的程序员,都是各个其他职业的,有基金经理、设计师、老师、产品经理、媒体人等等等等,所以大家也都说了蛮多自己使用Vibe Coding的心得,也聊了不少过程中遇到的坑。 然后他们就问我,

2026/07/016 分钟阅读
Codex 一键省 Token 大法,亲测有效
选型指南转载

Codex 一键省 Token 大法,亲测有效

每次写 Codex 的教程或者使用案例,都有读者询问,这个 Token 消耗情况怎么样。 虽然免费也能用 Codex,但不同的档次 Plus、Pro 5x、Pro 20x 所包含的 Token 额度完全不同,怎么省 Token 成了这段时间以来社交媒体上的热门话题。 之前 Claude Code 爆

2026/07/017 分钟阅读
什么?WorkBuddy 可以直接操作电脑了?
选型指南转载

什么?WorkBuddy 可以直接操作电脑了?

今天测试阿里的 Qoder Work 时,我发现它仿照 Codex 实现了直接控制电脑的功能。我试了一下,在桌面版微信里向指定好友发消息,整个过程非常丝滑。 我心想:这个功能能不能迁移到 WorkBuddy 里? 安装 Skill 说干就干。我先在 Qoder Work 里找到了这个技能的名字(当时

2026/07/013 分钟阅读
美光三星海力士遭集体诉讼!郭明錤:27年都买不到便宜内存
选型指南转载

美光三星海力士遭集体诉讼!郭明錤:27年都买不到便宜内存

克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 内存涨价的几个“始作俑者”,被告了。 17名美国消费者和小企业主,在加州联邦法院提起集体诉讼,被告是 三星、SK海力士和美光 。 这三家企业占据了全球90%的内存市场,它们被指控的罪名是合谋掐断消费者用的内存供应,然后坐地起价。 讽刺的是,它们

2026/07/015 分钟阅读