OCR 完整化总表
本表的目标不是重复保存全部 OCR 原文,而是把三类目录的 历史整理规模、当前快照状态、已整理程度、当前状态标签、下一步优先级 一次性说明清楚,让 OCR 工作从"零散补文档"升级成"可追踪工程"。
当前版本:V3 最后更新:2026-05-27 本次更新内容:
- 补充了 V3 轮次 OCR 扫描发现
- 补充了当前待复核页清单
- 更新了状态词使用约束
- 补充了下一轮优先级建议
0. 当前目录核对结果
- [已确认] 原始资料当前统一位于
资料/目录下,三类图片目录与社区 txt 原始资料均可正常定位。 - [已确认] 原图已恢复。本轮实际盘点
资料/**/*.jpg共 344 张,其中官方教程截图 258 张、基础写脚本界面截图 63 张、引擎更新截图 23 张。 - [已确认] 与现有 OCR 文档编号交叉比对后,基础写脚本界面截图和引擎更新截图暂无未入档编号;官方教程截图发现 120 张此前未进入主 OCR 索引。
- [阶段进展] 官方教程 120 张未入档图已完成一次恢复后重读,并新建
docs/OCR资料/官方教程恢复后补OCR清单.md;其中第 5、6 批 40 张已正式并入docs/OCR资料/官方教程截图转文本索引.md的"恢复后补 OCR 正式索引附录"。 - [已确认] 当前剩余问题已从"路径失配/原图缺失"转为"补 OCR 条目清洗、逐图状态覆盖率、专题回链完整度、索引格式一致性"。
- [建议动作] 后续如果继续体检,应把本总表、推进清单、映射表当作同一套工程面板联合维护,而不是分开写各自的状态词和进度判断。
1. 状态标签说明
建议全库统一使用以下状态词,并尽量避免混写"无效/无文字/重复/待补"这类不统一表述:
- 已入档:已有 OCR 条目,且当前可直接作为证据引用
- 已入档(待复核):已有 OCR 条目,但仍存在错字、版本号、主题归属或细节待校正
- 无有效文本:图片存在,但当前 OCR 无稳定可用文本,不等于图片无价值
- 疑似重复页:与其他页高度重复,通常保留主证据页即可
- 备份文件(
.hwbk):目录存在,但不计入主图 OCR 数量 - 待处理:已发现编号或文件,但尚未建立稳定 OCR 条目
1.1 使用约束
无有效文本只用于"当前 OCR 结果不可用",不要拿来表达"还没看"待处理只用于"尚未建立条目",不要和待复核混用疑似重复页优先补充其主证据页编号已入档(待复核)适合版本归属未完全锁定、OCR 噪声较多、但信息主体已可用的页面
1.2 禁止混用的旧说法
无效页无文字页重复校对页待补页待补专题
2. 三大目录总览
统计口径说明:下表已按原图恢复后的实际
.jpg盘点结果更新;.hwbk等备份文件不计入主图数量。官方教程的"120 张未入档"指恢复后与主 OCR 索引编号交叉比对得到的缺口,不等于全部无文本。
| 目录 | 当前图片规模 | 当前整理程度 | 当前判断 |
|---|---|---|---|
资料/基础写脚本界面截图/ | 63 张 .jpg | 与现有 OCR 文档编号比对后暂无未入档编号 | 文档层最接近"近完整",后续重点是精校与状态统一 |
资料/官方教程文档截图/ | 258 张 .jpg | 恢复后发现 120 张此前未入主索引;已全部完成一次重读,第 5、6 批 40 张已并入主索引 | 主题入口强,逐页覆盖正在补齐 |
资料/创游世界引擎更新说明内容截图/ | 23 张 .jpg | 与现有 OCR 文档编号交叉比对后暂无未入档编号 | 主线较完整,后续补旧版本细节与噪声校正 |
3. 基础写脚本界面截图:完整化现状
3.1 目录规模
- 来源目录:
资料/基础写脚本界面截图/ - 当前盘点:原图恢复后实际定位 63 张
.jpg - 与现有 OCR 文档编号交叉比对后,当前未发现未入档编号
- 目前已在 OCR 文档中明确出现或被映射表记录的重点编号,已覆盖核心页
3.2 已重点整理的编号簇
- 类型/参数/结构:
215321, 215324, 215326, 215335, 215339, 215340, 215348
- 自定义组件 / 指令 / 触发时机:
215333, 215355, 215357, 215401, 215403, 215404, 215405, 215416, 215419, 215530
- 对象动作 / 父子物体:
215603, 215605, 215607, 215608
- 分类切换 / 组件能力:
215321, 215325, 215327, 215328, 215329, 215330, 215531, 215533, 215534, 215535, 215536, 215537, 215538
- 基础属性 / 地图 / 系统:
215513, 215514, 215516, 215517, 215518, 215519, 215521, 215522, 215524, 215527, 215547, 215554, 215557, 215620, 215621, 215622, 215623, 215624, 215625, 215639, 215640, 215645
3.3 当前判断
- 这组资料已经不是"只抽样几页"的状态了
- 其价值最高的页面基本都已有 OCR 证据或至少已有编号感知
- 真正还没完全做完的,不是"有没有内容",而是:
- 逐号映射是否彻底
- 重复/校对页是否统一标注
- 个别页是否还停留在 OCR 级粗整理
3.4 当前优先级
第一优先级。 因为它最容易率先做成真正的"近完整 OCR 子库"。
4. 官方教程文档截图:完整化现状
4.1 目录规模
- 来源目录:
资料/官方教程文档截图/ - 当前盘点:原图恢复后实际定位 258 张
.jpg - 恢复后缺口:与主 OCR 索引编号比对后发现 120 张此前未入档截图
- 补 OCR 进展:120 张已完成一次重读;第 5、6 批 40 张已正式并入主索引,前 1-4 批 80 张已在
docs/OCR资料/官方教程恢复后补OCR清单.md记录为待继续清洗入主索引 - 特点:
.jpg主图数量最多- 同时存在大量
.hwbk备份文件 - 文件量远大于另外两类目录
4.2 已重点整理主题
- 广播
- 素材概念与素材管理
- 自定义组件定义
- 组件 / 指令 / 脚本基础
- UI 总览与切换入口
- 地图层级
- 地块 / 道具 / 子弹 / 粒子特效
- 货币 / 货币条
- 近战武器
- 生命组件
- 拾取参数
4.3 已新增补证页
近期可明确算入高价值补证的编号:
112424- 近战武器:伤害类型、暴击率、暴击倍数、击退距离、击退速度、攻击频率、特殊效果
112435- 近战武器:当攻击时、当打到目标时、当杀死目标时、碰撞盒判定逻辑
4.4 当前判断
- 当前最强的是"主题入口价值"
- 当前最弱的是"逐页覆盖率"
- 如果只看 AI 问答价值,它已经很好用
- 如果按严格 OCR 工程标准,它离完整还差很远
4.5 当前优先级
第二优先级。 建议继续按主题簇推进,不建议一上来无脑逐号硬扫。
5. 引擎更新截图:完整化现状
5.1 目录规模
- 来源目录:
资料/创游世界引擎更新说明内容截图/ - 当前盘点:原图恢复后实际定位 23 张
.jpg - 与现有 OCR 文档编号交叉比对后,当前未发现未入档编号
- 相比官方教程,体量明显更可控
5.2 已较完整的版本主线
4.54.04.52.604.52.544.52.14.48.34.45.304.45.274.45.194.45.14.43.244.40.174.40.5
5.3 新增旧版本补证
105553- 可确认
4.33.86至少涉及粒子系统优化、颜色过渡模式(HSB / RGB)
- 可确认
105600- 可确认旧版本阶段存在:
- "在某人视角下"脚本联机限制
系统.当前地图→当前地图命名调整- 玩家变量数量提高到 200
- 云变量表最大行数提高到 1000
- 跟随移动方向 bug 修复
- 可确认旧版本阶段存在:
5.4 当前判断
- 版本主线已经够清楚
- 继续补的意义更多是"补证据严谨度"与"回补老版本演化线"
- 已经比官方教程更接近完整
5.5 当前优先级
第三优先级。 优先做版本→截图编号→功能点链路,不必抢在脚本截图之前全面扫完。
6. 当前整体完成度判断
如果按"是否足以支持知识库问答"来评估:
- 已经很好用了
如果按"是否达到接近完整的 OCR 工程"来评估:
- 脚本截图:接近完整
- 官方教程:高价值入口完整,但逐页不完整
- 引擎更新:主线较完整,细节仍可补证
因此当前最准确的判断是:
OCR 已完成"骨架完整化 + 编号工程化起步",正在向"逐图可追溯"推进。
9. V4 轮次扫描发现(2026-05-28)
9.1 本次新增发现
经过深度扫描,确认以下 OCR 工程进展:
OCR 文档整体状态
- 脚本截图(基础写脚本界面截图转文本.md):63 张截图已覆盖,专题总表结构完整,组件分类、变量作用域、流程控制、系统能力均已归纳
- 官方教程截图(官方教程截图转文本索引.md):200+ 截图已覆盖,状态词体系已建立,回链规范已统一,去重规范化已完成
- 引擎更新截图(引擎更新截图转文本.md):23 张截图已覆盖,版本主线完整(4.54.0 / 4.52.x / 4.43.24 / 4.40.x)
V4 新增高价值补证编号(官方教程第 5、6 批)
| 编号 | 主题 / 可确认内容 | 证据等级 |
|---|---|---|
| 113929 | 主角复活指令:复活时间、位置(出生点/当前位置/固定位置) | E2 |
| 113943 | 打开选角色面板指令:可选角色、保留阵营、血量回满 | E2 |
| 113955 | 切换武器指令:参数为武器素材 | E2 |
| 114004 | 卸下武器指令:取消当前持握武器 | E2 |
| 114012 | 恢复血量指令:可用于主角或挂载生命组件的物体,支持负数扣血 | E2 |
| 114026 | 设置主角属性指令:阵营、贴图、坐标、名称、颜色、透明度 | E2 |
| 114039 | 执行主角指令指令:切换主角、播放动效、以角度面向 | E2 |
| 114050 | 切换地图指令:目标地图、切换动画、传送当前主角、出生点,单机/联机限制 | E2 |
| 114108 | 设置地图运行速度指令:影响物体速度、等待时间、帧间隔,不影响音效/BGM/UI | E2 |
| 114119 | 生成物体指令:地块、角色、装饰、装置、子弹等;参数含物体、数量、位置、所属层、生成事件 | E2 |
| 114133 | 生成可拾取物体指令:道具、硬币、近战武器、远程武器等 | E2 |
| 114213 | 设置跟踪目标指令:目标移动时摄像机跟随 | E2 |
| 114225 | 设置滤镜指令:影响地图显示,不影响 UI 显示 | E2 |
| 114239 | 镜头移动指令:移动至、耗时、变化曲线,适合剧情镜头移动 | E2 |
| 114250 | 镜头缩放指令:缩放至、耗时、变化曲线;缩放值越大视野越小 | E2 |
| 114312 | 设置背景指令:设置地图背景颜色 | E2 |
| 115705 | 相对坐标:距离判断、查找最近红队角色 | E2 |
| 115715 | 颜色篇:HSB(A)、RGB(A)、颜色变量、颜色属性;色相、饱和度、亮度、RGB分量、透明度 | E2 |
| 115729 | 局部变量:定义、作用域、生命周期;循环中每次迭代会创建新的局部变量 | E2 |
| 115740 | 系统 & 玩家篇:区分系统、玩家、控制的玩家、所有玩家;所有玩家是玩家类型数组 | E2 |
| 115754 | 系统属性和指令:游戏、联机、计时器属性;系统指令含游戏胜利/失败、重新开始、结束本局、切换地图、播放/停止 BGM、计时器等 | E2 |
| 115909 | 物体篇:自身属性和指令、当前 UI 属性和指令、当前地图属性和指令、在坐标的地块 | E2 |
| 115922 | 自身属性和指令:基础属性:坐标、尺寸、所属层、父物体、子物体、距离、查找最近角色等 | E2 |
| 115940 | 自身基础指令续页:设置子物体、丢弃子物体、销毁所有子物体、播放动效、播放动画、停止动画、沿角度移动、以角度面向、销毁自身、发送广播 | E2 |
| 115954 | 当前地图属性和指令:地图名称、尺寸、背景色、地图模式、背景透明度、地图运行速度、图层属性;指令含生成物体/特效/飘字、设置背景颜色、发送广播 | E2 |
| 120017 | 当前 UI 属性和指令:当前 UI 属性、地图 UI 基础属性:名称、尺寸、背景色、背景透明度、图层、坐标转换;基础指令含生成物体/特效/飘字、设置背景颜色等 | E2 |
| 120035 | 当前 UI 指令续页:生成 UI 物体、生成特效、生成飘字、设置背景颜色、发送广播;区分地图 UI、操作 UI、物体 UI | E2 |
| 120310 | 概率执行语句:按指定概率执行脚本序列;用于随机生成、随机奖励、抽奖抽卡等 | E2 |
| 120333 | 工具脚本:查看数值、逐行 debug 脚本、脚本注释块 | E2 |
| 120343 | 查看数值:调试工具;试玩时显示属性/变量值,用于验证动态数据、事件或状态变化 | E2 |
| 120356 | 脚本注释块:用于脚本归纳分类、提高可读性、维护性和协作效率,也可收缩脚本块 | E2 |
| 120411 | 逐行 debug 脚本:用于问题定位和逻辑验证;程序执行到 debug 语句会进入调试界面,可逐条向下执行 | E2 |
| 120422 | 帮助中心列表页:基础知识、组件百科、指令百科、成套教程、脚本解析、常见问题、实用功能;含常见问题条目列表 | E2 |
| 120443 | 切换地图后主角消失:原因多与切换地图指令的「传送当前主角」有关 | E2 |
| 120456 | 退出联机会回档:准备模式中的操作不修改云存档 | E2 |
| 120507 | 角色无法攻击敌人:多由阵营导致;相同阵营或阵营为「无」时不会产生伤害 | E2 |
| 120527 | 物体检测器检测不到物体:需检查被检测物体阵营是否为「无」;即使检测「任何阵营」也无法检测无阵营物体 | E2 |
9.2 当前仍需继续处理的编号
第一优先级:专题完整性补档
| 编号 | 主题方向 | 当前状态 | 建议处理 |
|---|---|---|---|
| 113234 | 粒子特效组件 | 已入档(待复核) | 补同主题相邻页 1132xx / 1133xx |
| 115813 | 玩家属性和指令 | 已入档(待复核) | 继续补玩家属性、玩家指令具体条目 |
| 115032 | 物品交易功能 | 已入档(待复核) | 补抽奖/消耗/保底结构体区域 |
| 114955 | 物品类型 | 已入档(待复核) | 检索 1149xx / 1150xx 相邻页 |
第二优先级:弱证据页精校
| 编号 | 当前状态 | 建议处理 |
|---|---|---|
| 215639 | 已入档(待复核) | 补全渐变脚本中间属性名 |
| 215645 | 已入档(待复核) | 补全触发事件参数格式 |
| 110011 / 110105 | 已入档(待复核) | 继续人工目视判断主题归属 |
第三优先级:旧版本补证
| 编号 | 主题方向 | 建议处理 |
|---|---|---|
| 105600 | 旧版本更新混合页 | 继续人工清洗 |
| 105553 | 4.33.86 粒子系统 | 补更多同版本细节 |
9.3 V4 轮次新增专题回链建议
以下专题文档建议补充 OCR 编号回链:
| 专题文档 | 建议回链的 OCR 编号 |
|---|---|
docs/脚本系统/专题研究/创游世界战斗系统设计入门.md | 112424、112435、112546、112706 |
docs/教程资料/专题研究/UI系统与切换机制解析.md | 120605、120017、120035 |
docs/脚本系统/专题研究/自定义组件深度解析.md | 215333、215355、215357、215401~215419 |
docs/教程资料/专题研究/素材系统与组件挂载解析.md | 105946、110035、112222、112247 |
docs/脚本系统/专题研究/系统级脚本能力解析.md | 115754、115909、115922、115940 |
docs/核心研究/脚本语句与数据类型研究.md | 115715、115729、115740 |
10. 维护者贡献指南
如何参与 OCR 补齐
- 选择待复核编号:从上表「当前仍需继续处理的编号」选择一个编号
- 查看原图和相邻页:打开对应截图,结合前后页上下文判断内容
- 补充 OCR 条目:在对应 OCR 文档中按格式补充条目
- 更新映射表:为新完成的条目更新
OCR 图片编号映射表.md - 沉淀专题文档:将高价值 OCR 内容归纳为正式专题文档
11. 整体完成度判断
如果按「是否足以支持知识库问答」评估:已经很好用
如果按「是否达到接近完整的 OCR 工程」评估:
- 脚本截图:接近完整(63/63 已覆盖)
- 官方教程:高价值入口完整,但逐页不完整(200+/258)
- 引擎更新:主线较完整,细节仍可补证(23/23 已覆盖)
当前最准确的判断:OCR 已完成「骨架完整化 + 编号工程化起步」,正在向「逐图可追溯」推进。
12. 下一轮最该做什么
第一批:继续回填脚本截图映射表
继续回填脚本截图映射表,重点编号段:
215603~215645区间(已完成大部分,仍需补细节)215325, 215327, 215328, 215329, 215330, 215335, 215339, 215348215355, 215357, 215401~215419215513~215521
第二批:继续按主题簇补官方教程
继续按主题簇补官方教程:
- 粒子特效 / 近战武器 / 远程武器
- UI / 地图 / 数据剩余页
- 优先把已有编号补成「截图编号 → 状态 → OCR 文档 → 专题文档」完整链
第三批:继续给引擎更新回补旧版本
继续给引擎更新回补旧版本:
4.35.14.33.86- 其他尚未明确归属的旧页 继续回填脚本截图映射表:
215603~215645区间215325, 215327, 215328, 215329, 215330, 215335, 215339, 215348, 215355, 215357, 215401~215419, 215513~215521- 其中本轮已明确补强:
215325, 215513, 215514, 215516, 215521, 215603, 215605, 215607, 215608, 215615, 215620~215625, 215639, 215640, 215645
7.2 第二批:继续按主题簇补官方教程
继续按主题簇补官方教程:
- 近战武器剩余页
- 远程武器 / 伤害 / 粒子特效
- UI / 地图 / 数据剩余页
- 优先把已有编号补成"截图编号 → 状态 → OCR 文档 → 专题文档"完整链
7.3 第三批:继续给引擎更新回补旧版本
继续给引擎更新回补旧版本:
4.35.14.33.86- 其他尚未明确归属的旧页
- 继续把版本页补成"版本号 → 截图编号 → 功能点 → 专题文档"链路
7.4 当前已重点映射编号段
- 脚本截图:
215321~215352、215405~215416、215522~215557,并新增补强215513~215521、215603~215645多个关键页 - 官方教程:已形成高价值主题入口,并明确
112424、112435为近战武器补证页 - 引擎更新:已形成
4.54.0 / 4.52.x / 4.43.24 / 4.40.x主线,并补入105553、105600等旧版本补证页
7.5 当前待继续补全缺口
- 脚本截图:尚有若干连续页仍需从"主题级归纳"推进为"逐号映射"
- 官方教程:大量页面仍未建立逐号状态条目,尤其是武器、粒子、UI、地图、数据方向
- 引擎更新:仍需补更多旧版本散页和个别版本细节归属
7.6 问题编号区
原图缺失或待核对编号
215324215326215345- 当前判断:已在 OCR 文档或映射过程中出现,但在当前原图目录下暂未定位到对应
.jpg主图;需后续核查是否为编号误记、文件迁移或归档到其他目录。
当前无有效文本编号
120911120933- 当前判断:这两页已在官方教程 OCR 主文档中保留编号占位,当前结果仍为
No text detected in image.;结合相邻页看,更可能是帮助中心/基础知识列表附近的过渡页或栏目切换页。
低质量可见文本 / 待复核编号
110011110105120855- 当前判断:这些编号已从"完全无文本"推进为"已入档(待复核)";能识别出弱文本或乱码痕迹,但标题、正文或栏目归属仍不能稳定复原。
仅标题或残片级识别编号
113234215645215639- 当前判断:已能确认部分主题,但正文信息仍明显不足,适合继续深度 OCR 或人工精校。
8. 当前总面板结论
当前 OCR 维护已经可以按"总面板"来理解:
- 规则面板:
docs/OCR资料/OCR 状态词与回链规范.md - 规模面板:
docs/OCR资料/OCR 完整化总表.md - 解释面板:
docs/OCR资料/OCR 资料总览与完整化现状.md - 执行面板:
docs/OCR资料/官方教程恢复后补OCR清单.md - 追踪面板:
docs/OCR资料/映射表/OCR 图片编号映射表.md
它们分工已经比较明确:
- 规范文档负责统一状态词与回链写法
- 总表负责讲清有多少、做到哪、先补什么
- 总览负责解释整体阶段和策略
- 补档清单负责记录批次进展
- 映射表负责落实到具体编号
因此当前阶段不再只是"有几篇 OCR 文档",而是已经形成一套可持续扩展的 OCR 工程面板。
9. 自我优化说明
本文件是为了让 OCR 完整化从"补一页算一页"升级成"有总表、有规模感、有优先级"的工程状态。
后续它还应继续升级:
- 增加更精确的编号段统计
- 增加三类目录的已入档/待处理数量
- 增加按主题簇的完成率
- 与映射表形成双向引用
最终目标不是单纯写更多 OCR,而是做到: 每类资料都能回答:有多少、做到哪、还差哪、先补什么。
