返回行业动态

腾讯混元开源古代汉字视觉感知评估基准 Chronicles-OCR

2026/05/19 04:24
查看原文

OmniTools 5月19日消息,腾讯混元团队正式开源古代汉字视觉感知评估基准 Chronicles-OCR。该基准面向视觉大语言模型(VLLM),覆盖从甲骨文到草书约 3000 年的汉字演变历程,包含 7 种历史书体与 2800 张均衡图像。

基准设置字形定位、细粒度识别、古代文本解析和字体分类四项核心任务,旨在系统探究视觉分布随时间演化对模型感知能力的影响。相关论文与代码已同步开源。