OCR 完整化推进清单
一句话摘要:这是一份面向维护者的 OCR 推进任务表,用来记录哪些截图材料已经完成转写、哪些还在处理中、哪些还需要补回链和专题接入。
适合对象:维护者、研究者、AI 检索系统 当前状态:持续更新中 可信度:
[已确认]关联文档:docs/OCR资料/OCR资料导航.md、docs/OCR资料/OCR 证据链说明.md、docs/OCR资料/OCR 完整化总表.md
0. 本轮体检与索引同步结论
- [已确认] 原始资料目录已统一迁移到
资料/下,当前推进清单的目录口径与总索引保持一致。 - [当前快照] 三个原始截图目录当前可定位,但本次检查未列出可直接 OCR 的图片文件;因此本轮不能继续从原图新增转写,只能同步现有 OCR 文档、映射表与状态清单。
- [已确认] 当前文档库中已显式写出的 OCR 编号与专题回链仍可作为已整理证据使用;后续若恢复原图,应优先复核这些编号对应的真实文件与相邻页。
- [已确认] 当前剩余重点已从“路径迁移”转为“原图恢复、逐图覆盖率、专题回链完整度与状态词一致性”。
- [已确认] 当前 OCR 工程四个核心面板已形成稳定分工:
- 总索引:
docs/知识库总索引.md - 推进清单:
docs/OCR 完整化推进清单.md - 总表:
docs/OCR资料/OCR 完整化总表.md - 映射表:
docs/OCR资料/映射表/OCR 图片编号映射表.md
- 总索引:
- [当前重点] 后续优先检查的不再只是“目录名是否改了”,而是:
- 具体截图文件名是否真实存在;
- 状态词是否严格统一为六种标准写法;
- 专题页是否都能反向追到 OCR 文档与映射表。
这份清单怎么用
建议按下面顺序使用:
- 先看本轮新增体检结论,了解当前总体状态。
- 再按“基础写脚本界面 / 官方教程 / 引擎更新”三块分别推进。
- 处理完转写后,再回到映射表推进状态,补编号映射和专题回链。
- 最后用“完整化标准”和“统一状态词执行标准”做复核。
- [已确认] 当前仓库根目录包含
README.md、docs/、原始资料目录资料/;其中包含三类原始截图目录与社区原始文本资料/其他用户给的解析.txt。 - [当前快照] 三类原始截图目录本轮列目录为空,暂不能继续新增 OCR;若后续恢复图片,应重新执行目录级盘点。
- [已确认] 当前可读 Markdown 文档已形成
教程资料 / 脚本系统 / 引擎更新 / 社区分析 / OCR资料 / 元信息六大知识分区。 - [已确认] OCR 层已形成“原文归档 + 映射表 + 推进清单 + 总表 + 总览 + 规范”六件套。
- [疑似错误] 部分旧文档仍保留
2025-04-18的老更新时间,与 2026-04-20 的维护批次不一致,需逐步刷新。 - [疑似错误] 少数维护文档曾把“已修复事项”写成当前事实,但后续文档又出现旧日期、旧状态,说明历史修复记录与实际库状态存在回退或未全量同步
- [已确认] 本轮继续补录官方教程
110423 / 110426 / 110618 / 110621 / 110633 / 112351 / 112706 / 112726八张有效页,覆盖教程知识树入口、游戏设置作用域、操作UI生命周期、物体UI绑定规则、武器槽组件、角色组件与快捷聊天按钮 - [已确认] 本轮继续补录官方教程
112739 / 112756 / 112814 / 112843 / 112911 / 112923六张有效页,覆盖背包组件、移动摇杆、技能摇杆、互动按钮、通用摇杆与输入框组件
1. 基础写脚本界面截图
- 当前状态:已有接近完整的编号清单与 OCR 总表;历史 OCR 已覆盖
215321~215645多个关键页,但本轮未检测到可直接继续 OCR 的原图文件。 - 已重点覆盖:组件、类型、指令、自定义组件、作用域、流程控制、系统/地图脚本、基础属性面板、对象分类、地图属性、计时器状态、对象动作页、分类切换页
- 新进展:已同步旧路径与当前中文目录结构,并把已补编号回填到映射表;现阶段应优先恢复原图或继续校对已入档条目。
- 后续重点:
- 在原图恢复前,优先校对
215603、215605、215607、215608、215615、215620~215625、215639~215645等已入档条目的状态词与专题回链 - 原图恢复后,再补
215611等仍缺直接条目的编号 - 给重复页、校对页补统一状态标签
- 视情况拆为“组件/类型/流程/系统脚本”四个子 OCR 文档
- 在原图恢复前,优先校对
2. 官方教程文档截图
- 当前状态:历史 OCR 已形成高价值主题入口;本轮目录快照未列出可直接 OCR 的
.jpg/.hwbk文件,因此暂不能继续新增官方教程转写,只能维护已入档条目与编号状态。 - 已重点覆盖:广播、素材、自定义组件、组件定义、指令与脚本、UI、地图层级、实例化、地块、道具、子弹、生命、货币、货币条、拾取参数、素材移动/复制/文件夹/组件挂载、游戏设置、操作UI、物体UI、武器槽、角色组件、快捷聊天按钮、背包、移动摇杆、技能摇杆、互动按钮、摇杆、输入框
- 新进展:补拿到
112424 / 112435两页近战武器组件的更完整证据,可用于继续细化近战系统专题 - 后续重点:
- 武器系统其他页面(优先:近战武器剩余页 / 远程武器 / 伤害)
- 粒子特效相关页
- 地图/UI/数据相关剩余页
- 逐图建立主题归属、无效页、备份页与重复页标记
3. 创游世界引擎更新说明内容截图
- 当前状态:历史 OCR 已整理出约 25 张主图规模的版本链判断;本轮目录快照未列出可直接 OCR 的原图,因此后续补证需等待原图恢复或改从现有 OCR 文本继续校对。
- 已重点覆盖:4.54.0、4.52.60、4.52.54、4.52.1、4.48.3、4.45.30、4.45.27、4.45.19、4.45.1、4.43.24、4.40.17、4.40.5
- 新进展:从新 OCR 证据中确认
4.33.86至少涉及粒子系统优化、颜色过渡模式(HSB/RGB)和联机限制/当前地图脚本改名等内容 - 后续重点:
- 剩余 4.54.0 / 4.52.x 页面的补证
- 4.43.24 / 4.40.17 / 4.40.5 / 4.35.1 / 4.33.86 的有效页继续分离
- 逐页建立“版本-截图编号-功能点”映射
4. 映射表推进状态
已创建:
docs/OCR资料/映射表/OCR 图片编号映射表.md已先录入:官方教程与引擎更新中的部分已整理编号,以及脚本截图的阶段性已补编号
新进展:除既有逐号映射外,现已新增
docs/OCR资料/OCR 完整化总表.md,把三大目录的“总量、编号、状态、下一步重点”集中化本轮已新增补强脚本编号:
215325215513, 215514, 215516, 215521215603, 215605, 215607, 215608, 215615215620~215625215639, 215640, 215645
下一步重点:
- 校对脚本截图
215603~215645区间与215327、215328、215329、215330、215335、215339、215348、215355、215357、215401~215419、215513~215521的状态词、专题回链与是否已在映射表落地,避免把已入档页继续误写成未补页 - 原图恢复后,再给官方教程剩余页建立“已入档 / 无有效文本 / 待处理 / 备份文件(
.hwbk) / 疑似重复页”状态 - 给引擎更新建立更完整的“版本号-截图编号-功能点”链路
- 让更多专题文档能反向指回具体截图编号
- 已开始按“三段式回链”给高价值专题补
来源截图编号 / 对应 OCR 文档 / 对应映射表,并与 OCR 总表、规范文档互链
- 校对脚本截图
本轮新增回链专题:
docs/脚本系统/专题研究/自定义组件深度解析.md、docs/脚本系统/专题研究/系统级脚本能力解析.md、docs/教程资料/专题研究/素材系统与组件挂载解析.md,已补齐来源截图编号 / 对应 OCR 文档 / 对应映射表本轮新增引擎更新映射编号:
105508, 105510, 105513, 105515, 105516,并继续巩固105537所在联机 UI 演进链本轮同步刷新:
docs/脚本系统/专题研究/创游世界战斗系统设计入门.md更新时间,维持高价值专题头部元数据一致性
4.1 当前已完成的回链动作
- 三大 OCR 原文文档头部已补入统一状态词、回链规范入口、映射表入口
- 脚本 OCR 已明确当前已重点映射编号段与待继续补强编号段
- 官方教程 OCR 已明确高价值补证编号与优先主题簇
- 引擎更新 OCR 已明确重点版本链与待继续补证版本
5. 完整化标准
当满足以下条件时,可视为接近完整:
- 原图恢复或重新盘点后,三类截图均有可核验的图片编号清单
- 每张有效截图至少有一条 OCR 条目或“重复/无有效文本说明”
- 每个主题都能回溯到具体截图编号
- 总索引能明确指出已完成率与剩余工作
- 存在统一的图片编号映射表,可从主题回溯到截图编号
- 若当前快照没有原图文件,只能把完整度标为“历史整理记录接近完整”,不能写成当前逐图全量完成
6. 统一状态词执行标准
后续 OCR 目录统一只使用以下状态词:
- 已入档
- 已入档(待复核)
- 无有效文本
- 疑似重复页
- 备份文件(
.hwbk) - 待处理
执行要求:
- 不再混用“无效页 / 无文字页 / 重复校对页 / 待补页”等松散说法
- 发现重复页时,优先补充其主证据页编号
- 发现 OCR 信息不足但页面主题明确时,优先标注为
已入档(待复核)
7. 当前最值得优先补的工作
- 优先核对已入档脚本截图
215603~215645区间的状态词与映射表回链,避免已补编号继续显示为待补。 - 原图恢复后,优先把官方教程中的武器、粒子、地图/UI/数据相关剩余页进一步细化。
- 优先完善引擎更新中的旧版本链路,尤其是
4.33.86 ~ 4.35.1一带。 - 优先给高价值专题持续补“三段式回链”:
来源截图编号 / 对应 OCR 文档 / 对应映射表。
8. 收尾判断
[已确认]这份推进清单已经不只是待办表,而是 OCR 层的阶段性治理文档。[已确认]当前最关键的不是简单增加 OCR 数量,而是把“截图编号 → OCR 文本 → 专题结论”闭环持续补齐。[高可信推断]只要这份清单继续维护,后续网页端就能更自然地支持“从结论展开证据”的阅读方式。
关联阅读
docs/OCR资料/OCR资料导航.mddocs/OCR资料/OCR 证据链说明.mddocs/维护与报告/维护与报告导航.md
