OCR 未识别与残缺清单
适用范围:
docs/OCR资料/目录下当前仍未完全识别的截图 目的:集中记录"无有效文本 / 仅标题 / OCR 残缺 / 待继续重读"的条目,便于后续补档
- 关联文档:
docs/OCR资料/官方教程截图转文本索引.mddocs/OCR资料/基础写脚本界面截图转文本.mddocs/OCR资料/引擎更新截图转文本.mddocs/OCR资料/映射表/OCR 图片编号映射表.mddocs/OCR资料/OCR 状态词与回链规范.mddocs/OCR资料/OCR 资料总览与完整化现状.md
快速结论
当前最值得优先处理的问题页主要分三类:
- 完全无有效文本:OCR 仍读不出稳定文字
- 只识别到标题或少量残片:可确认主题,但正文不足以支撑细节结论
- 主体可识别但细节残缺:已有研究价值,但仍需继续人工清洗与相邻页补证
恢复后补 OCR 同步说明
原始 资料/ 图片恢复后,已对官方教程此前未入主索引的 120 张截图完成一次重读,并形成 docs/OCR资料/官方教程恢复后补OCR清单.md。其中第 5、6 批 40 张(113929-120527 范围内的补档条目)已正式接入 docs/OCR资料/官方教程截图转文本索引.md 的"恢复后补 OCR 正式索引附录"。
本清单同步保留其中仍不适合作为稳定正文证据的条目:105858、112144、115813、115833、115851。
1. 完全无有效文本
105858
- 来源目录:
资料/官方教程文档截图/ - 当前状态:无有效文本
- 原图重读结果:无文本或无法稳定提取
- 当前判断:恢复后补 OCR 重读仍未得到可引用正文;需人工目视判断是否为过渡页、空白页、评论页或低对比截图
- 关联补档清单:
docs/OCR资料/官方教程恢复后补OCR清单.md - 关联主文档:
docs/OCR资料/官方教程截图转文本索引.md
112144
- 来源目录:
资料/官方教程文档截图/ - 当前状态:无有效文本
- 原图重读结果:无文本或无法稳定提取
- 当前判断:恢复后补 OCR 重读仍未得到可引用正文;需人工目视判断页面类型和相邻页归属
- 关联补档清单:
docs/OCR资料/官方教程恢复后补OCR清单.md - 关联主文档:
docs/OCR资料/官方教程截图转文本索引.md
115833
- 来源目录:
资料/官方教程文档截图/ - 当前状态:无有效文本
- 原图重读结果:
No text detected in image. - 当前判断:位于"玩家属性和指令 / 物体篇"附近,可能是过渡页、空白页或纯示意页;暂不作为正文知识页
- 关联补档清单:
docs/OCR资料/官方教程恢复后补OCR清单.md - 关联主文档:
docs/OCR资料/官方教程截图转文本索引.md
115851
- 来源目录:
资料/官方教程文档截图/ - 当前状态:无有效文本
- 原图重读结果:
No text detected in image. - 当前判断:位于"玩家属性和指令 / 物体篇"附近,可能是过渡页、空白页或纯示意页;暂不作为正文知识页
- 关联补档清单:
docs/OCR资料/官方教程恢复后补OCR清单.md - 关联主文档:
docs/OCR资料/官方教程截图转文本索引.md
120911
- 来源目录:
资料/官方教程文档截图/ - 当前状态:无有效文本
- 原图重读结果:
No text detected in image. - 当前判断:位于
120855、120933同一帮助中心导航链附近,更像栏目切换、滚动过程或入口列表中的中间态截图,而不是稳定正文页 - 页面类型:过渡页 / 无文本页
- 建议动作:后续若恢复原图,可结合前后页继续人工目视判断
- 关联主文档:
docs/OCR资料/官方教程截图转文本索引.md
120933
- 来源目录:
资料/官方教程文档截图/ - 当前状态:无有效文本
- 原图重读结果:
No text detected in image. - 当前判断:位于帮助中心导航链与教程/基础知识条目之间,疑似入口切换或过渡页,不适合作为正文知识页
- 页面类型:过渡页 / 无文本页
- 建议动作:后续若恢复原图,可结合
120926前后页继续判断栏目归属 - 关联主文档:
docs/OCR资料/官方教程截图转文本索引.md
说明:
110011、110105已在主 OCR 文档中二次重读出弱文本,不再归入"完全无有效文本",已移动到下一节"低质量可见文本"。
2. 仅识别到标题或极少文本
115813
- 来源目录:
资料/官方教程文档截图/ - 当前状态:已入档(待复核)
- 原图重读结果:仅稳定识别到"玩家属性和指令"等极少文本
- 当前判断:可确认该页属于"玩家属性和指令"主题,但正文信息不足以支撑细节结论;已在主索引恢复后补 OCR 附录中占位
- 相邻页线索:前后与
115754的系统属性和指令、115909的物体篇形成连续教程链 - 建议动作:人工目视或用更强 OCR 复核,确认玩家属性、玩家指令的具体条目
- 关联补档清单:
docs/OCR资料/官方教程恢复后补OCR清单.md - 关联主文档:
docs/OCR资料/官方教程截图转文本索引.md
114955
- 来源目录:
资料/官方教程文档截图/ - 当前状态:已入档(待复核)
- 原图重读结果:
物品类型- 当前判断:只能稳定确认专题标题为"物品类型",正文尚未提取成功
- 相邻页线索:前页
114929为专题目录页,后续已补出115032的"物品交易功能"及115049~115344的数字/真假值篇正文,但"物品类型"自身正文仍待继续补读 - 建议动作:继续检索
1149xx / 1150xx / 1151xx相邻页 - 关联主文档:
docs/OCR资料/官方教程截图转文本索引.md
115013
- 来源目录:
资料/官方教程文档截图/ - 当前状态:无有效文本
- 原图重读结果:
|国eG - 当前判断:仅识别出极少碎片,无法稳定确认主题,可能是过渡页、裁切页或高度噪声页
- 建议动作:结合
114955、115032与115049前后页继续判断归属 - 关联主文档:
docs/OCR资料/官方教程截图转文本索引.md
115516
- 来源目录:
资料/官方教程文档截图/ - 当前状态:无有效文本
- 原图重读结果:
No text detected in image. - 当前判断:处于
115502(数组)与115537(表篇)之间,可能是数组属性/指令页、过渡页或纯示意图页,暂无法稳定定题 - 建议动作:继续补读
1155xx / 1156xx相邻页,优先寻找"数组的属性和指令"正文 - 关联主文档:
docs/OCR资料/官方教程截图转文本索引.md
215645
- 来源目录:
资料/基础写脚本界面截图/ - 当前状态:已入档(待复核)
- 原图重读结果:
触发事件:G自身- 当前判断:可确认存在"触发事件"入口,且与"自身"作用域有关
- 建议动作:结合同组事件页继续补全
- 关联主文档:
docs/OCR资料/基础写脚本界面截图转文本.md
3. 可识别主体,但细节残缺
215639
- 来源目录:
资料/基础写脚本界面截图/ - 当前状态:已入档(待复核)
- 原图重读结果:
C1秒将@自身
渐变至 1并等待结束- 当前判断:可确认是"1秒将自身……渐变至……并等待结束"的时间渐变脚本
- 缺口:中间属性名与目标值区域仍不清楚
- 关联主文档:
docs/OCR资料/基础写脚本界面截图转文本.md
105600
- 来源目录:
资料/创游世界引擎更新说明内容截图/ - 当前状态:已入档(待复核)
- 原图重读结果摘要:
- 可识别"颜色过渡模式""联机优化""当前地图""玩家变量数量提高到200""云变量表最大行数提高到1000"等关键词
- 仍存在较多 OCR 噪声
- 当前判断:属于旧版本更新混合页,信息有价值,但适合继续人工清洗
- 关联主文档:
docs/OCR资料/引擎更新截图转文本.md
4. 这份清单怎么用
建议按下面顺序使用本清单:
- 先看"完全无有效文本"页,判断是否需要通过相邻页补主题
- 再看"仅识别到标题或残片"页,优先补同主题连续截图
- 最后处理"主体可识别但细节残缺"页,把它们从待复核推进为已校正
5. 后续优先级建议
- 先补
113234的相邻粒子特效页(优先检索 1132xx / 1133xx 同批次截图) - 再补
215645所在的事件入口同组页 - 再清洗
215639这类已知高价值但字段缺失页 - 之后处理
105600这类 OCR 噪声大、但信息量高的更新页 - 最后回头判断
110011 / 110105这类低质量可见文本页的主题归属;它们已不再归入纯无文本页
6. V3 补齐轮次新增记录(2026-05-27)
新增待复核页
| 编号 | 来源 | 原图重读结果 | 当前判断 | 建议处理 |
|---|---|---|---|---|
| 114955 | 官方教程 | 仅识别标题"物品类型" | 物品类型专题页,正文仍待继续补读 | 检索 1149xx/1150xx/1151xx 相邻页继续补 |
| 115013 | 官方教程 | 极少量碎片|国eG | 可能是过渡页/裁切页/高噪声页 | 待人工判断 |
| 115516 | 官方教程 | No text detected | 位于数组与表篇之间,可能是过渡页 | 需人工目视判断是否有过渡页价值 |
V3 轮次已完成处理
- ✅ 更新
OCR资料导航.md:补充 OCR 补齐进度总览、V3 新增待复核页列表、状态词统一规范、证据等级说明 - ✅ 更新
OCR 完整化总表.md:补充 V3 轮次 OCR 扫描发现、当前待复核页清单、状态词使用约束 - ✅ 更新本清单维护建议:补充 V3 轮次新增内容
7. 当前维护建议
- 对问题页尽量补"关联主文档"
- 能确定主题时,尽量补"相邻页编号"
- 解决后不要只改主文档,记得同步从本清单移除或改状态
- 对仍无法识别的页,至少保留"已重读但仍无文本"的明确说明
- V3 轮次建议优先处理:114955(物品类型)、115813(玩家属性)、215639(基础脚本截图)
- 注意保持与
OCR资料导航.md的状态同步
9. V4 轮次补齐计划(2026-05-28)
9.1 下一批优先处理编号
根据 V3 轮次的 OCR 完成情况,建议按以下优先级继续推进:
第一优先级:专题完整性补档
| 编号 | 主题方向 | 当前状态 | 建议处理 |
|---|---|---|---|
| 113234 | 粒子特效组件 | 已入档(待复核) | 补同主题相邻页 1132xx / 1133xx |
| 115813 | 玩家属性和指令 | 已入档(待复核) | 继续补玩家属性、玩家指令具体条目 |
| 115032 | 物品交易功能 | 已入档(待复核) | 补抽奖/消耗/保底结构体区域 |
| 114955 | 物品类型 | 已入档(待复核) | 检索 1149xx / 1150xx 相邻页 |
第二优先级:弱证据页精校
| 编号 | 当前状态 | 建议处理 |
|---|---|---|
| 215639 | 已入档(待复核) | 补全渐变脚本中间属性名 |
| 215645 | 已入档(待复核) | 补全触发事件参数格式 |
| 110011 / 110105 | 已入档(待复核) | 继续人工目视判断主题归属 |
第三优先级:旧版本补证
| 编号 | 主题方向 | 建议处理 |
|---|---|---|
| 105600 | 旧版本更新混合页 | 继续人工清洗 |
| 105553 | 4.33.86 粒子系统 | 补更多同版本细节 |
9.2 本次 V4 轮次新增发现
扫描结果汇总
- OCR 完整化总表:当前状态已更新至 V3,脚本截图接近完整,官方教程主题入口强但逐页覆盖率仍在提升
- 官方教程截图转文本索引:已覆盖 200+ 截图,状态词体系已建立,回链规范已统一
- 基础写脚本界面截图转文本:已覆盖 63 张截图,专题总表结构完整
- 引擎更新截图转文本:已覆盖 23 张截图,版本主线完整
已确认的高价值补证编号
113929:主角复活指令113943:打开选角色面板指令113955:切换武器指令114004:卸下武器指令114012:恢复血量指令114026:设置主角属性指令114039:执行主角指令指令114050:切换地图指令114108:设置地图运行速度指令114119:生成物体指令114133:生成可拾取物体指令114213:设置跟踪目标指令114225:设置滤镜指令114239:镜头移动指令114250:镜头缩放指令114312:设置背景指令115705:相对坐标115715:颜色篇115729:局部变量115740:系统 & 玩家篇115754:系统属性和指令115909:物体篇115922:自身属性和指令115940:自身基础指令续页115954:当前地图属性和指令120017:当前 UI 属性和指令120035:当前 UI 指令续页120310:概率执行语句120333:工具脚本120343:查看数值120356:脚本注释块120411:逐行 debug 脚本120422:帮助中心列表页120443:切换地图后主角消失120456:退出联机回档问题120507:角色无法攻击敌人120527:物体检测器检测不到物体
9.3 新增专题回链建议
以下专题文档建议补充上述 OCR 编号回链:
docs/脚本系统/专题研究/创游世界战斗系统设计入门.md→ 建议回链112424、112435、112546、112706docs/教程资料/专题研究/UI系统与切换机制解析.md→ 建议回链120605、120017、120035docs/脚本系统/专题研究/自定义组件深度解析.md→ 建议回链215333、215355、215357、215401~215419docs/教程资料/专题研究/素材系统与组件挂载解析.md→ 建议回链105946、110035、112222、112247
9.4 状态词使用约束(再次强调)
全库 OCR 文档统一使用以下状态词,禁止混用旧说法:
已入档:已有 OCR 条目,且当前可直接作为证据引用已入档(待复核):已有 OCR 条目,但仍存在错字、版本号、主题归属或细节待校正无有效文本:图片存在,但当前 OCR 无稳定可用文本,不等于图片无价值疑似重复页:与其他页高度重复,通常保留主证据页即可备份文件(.hwbk):目录存在,但不计入主图 OCR 数量待处理:已发现编号或文件,但尚未建立稳定 OCR 条目
禁止混用的旧说法:无效页、无文字页、重复校对页、待补页、待补专题、未完成、待补充、待完善、示例略、以后再写
9. V4 轮次补齐计划(2026-05-28)
9.1 本轮执行摘要
本次 V4 轮次执行完成了以下工作:
系统性扫描了 OCR 资料目录:
- 确认当前 OCR 文档共计 16 个 Markdown 文件
- 官方教程截图转文本索引.md(6651行,136个OCR条目)
- 基础写脚本界面截图转文本.md(3198行,63张截图)
- 引擎更新截图转文本.md(842行,23张截图)
确认了当前阶段特征:
- OCR 工程已完成「骨架型完整化」
- 正在向「逐图可追溯 + 证据链工程化」推进
生成了 V4 维护报告:
- 创建了
docs/OCR资料/OCR 未完成内容专项补齐报告.md(V4 版本) - 汇总了当前问题清单和下一步建议
- 创建了
9.2 本轮新增发现
已确认的高价值补证编号(按主题分类)
战斗系统相关:112424、112435、112546、112706
UI系统相关:120605、120017、120035、120620、120633
脚本系统相关:215333、215355、215357、215401、215403、215404、215405、215416、215419、215530
素材系统相关:105946、110035、112222、112247
物体系统相关:115909、115922、115940、115954
调试工具相关:120333、120343、120356、120411
常见问题相关:120443、120456、120507、120527
9.3 本轮状态确认
| 问题类别 | 数量 | 状态 |
|---|---|---|
| 完全无有效文本 | 6 个 | 需人工目视判断 |
| 低质量可见文本 | 3 个 | 已入档(待复核) |
| 仅标题或残片级识别 | 6 个 | 建议继续补档 |
| 原图缺失或待核对 | 3 个 | 需继续追溯 |
9.4 下一轮建议优先级
- 第一优先级:脚本截图继续细化(体量可控,已有基础最好)
- 第二优先级:批量推进官方教程截图(对新手帮助最大)
- 第三优先级:完善引擎更新的版本证据链(严谨度增强)
9.5 本轮实际修改文件清单
| 文件 | 修改类型 | 主要改进 |
|---|---|---|
| docs/OCR资料/OCR 未完成内容专项补齐报告.md | 新建 | V4 轮次维护报告 |
9.6 专题文档沉淀建议
以下专题文档建议补充 OCR 编号回链:
docs/脚本系统/专题研究/创游世界战斗系统设计入门.md→ 回链112424、112435、112546、112706docs/教程资料/专题研究/UI系统与切换机制解析.md→ 回链120605、120017、120035docs/脚本系统/专题研究/自定义组件深度解析.md→ 回链215333、215355、215357、215401~215419docs/教程资料/专题研究/素材系统与组件挂载解析.md→ 回链105946、110035、112222、112247
10. 维护者贡献指南
如何参与 OCR 补齐
- 选择待复核编号:从上表「下一批优先处理编号」选择一个待复核编号
- 查看原图和相邻页:打开对应截图,结合前后页上下文判断内容
- 补充 OCR 条目:在对应 OCR 文档中按格式补充条目
- 更新映射表:为新完成的条目更新
OCR 图片编号映射表.md - 沉淀专题文档:将高价值 OCR 内容归纳为正式专题文档
OCR 条目标准格式
## 编号. 图片文件名或截图编号
### OCR 原文
```text
这里保留原始 OCR 文本。人工整理
对 OCR 原文的校正、理解、提炼。
当前判断
- 状态:已入档 / 已入档(待复核)
- 证据等级:E1 / E2 / E3 / E4 / 待验证
- 关键词:...
- 关联专题:...
- 待复核问题:...
---
## 11. 质量自检清单
每次更新 OCR 文档后,请检查:
- [ ] 是否保留了原始 OCR 原文?
- [ ] 是否添加了人工整理?
- [ ] 是否标注了状态词?
- [ ] 是否标注了证据等级?
- [ ] 是否补充了关键词?
- [ ] 是否补充了关联专题?
- [ ] 是否补充了待复核问题?
- [ ] 是否更新了对应的映射表?
- [ ] 是否有不确定内容标注「待验证」?
- [ ] 是否有社区经验标注「社区观察」?
全库 OCR 文档统一使用以下状态词,禁止混用旧说法:
- `已入档`:已有 OCR 条目,且当前可直接作为证据引用
- `已入档(待复核)`:已有 OCR 条目,但仍存在错字、版本号、主题归属或细节待校正
- `无有效文本`:图片存在,但当前 OCR 无稳定可用文本,不等于图片无价值
- `疑似重复页`:与其他页高度重复,通常保留主证据页即可
- `备份文件(.hwbk)`:目录存在,但不计入主图 OCR 数量
- `待处理`:已发现编号或文件,但尚未建立稳定 OCR 条目
**禁止混用的旧说法**:`无效页`、`无文字页`、`重复校对页`、`待补页`、`待补专题`