OCR 证据链说明
一句话摘要
本文档专门解释 OCR 原文、图片编号、映射表、专题文档之间的关系,帮助普通玩家、维护者与 AI 系统理解这套证据链结构。
适合谁阅读
- 普通玩家:想了解结论背后的证据来源
- 维护者:需要回查原始截图和 OCR 文本
- 研究者:需要验证结论的准确性
- AI 检索系统:需要区分结论层和证据层
你将学到什么
- OCR 文档的三层结构
- 原始截图、OCR 原文、专题研究的关系
- 为什么证据链对知识库很重要
- 如何使用映射表回查证据
三层结构
1. 原始截图层
这是最底层证据,保留最原始的信息来源。
| 特点 | 说明 |
|---|---|
| 最原始 | 直接来自创游世界编辑器或教程 |
| 不可篡改 | 作为最终证据来源 |
| 按编号索引 | 每个截图有唯一编号 |
2. OCR 原文层
把截图中的文本转成可检索内容,方便搜索、引用、比对与人工修订。
| 特点 | 说明 |
|---|---|
| 可检索 | 支持关键词搜索 |
| 可引用 | 方便在文档中引用 |
| 可修订 | OCR 错误可以人工校正 |
3. 专题研究层
把 OCR 原文和多来源信息整理成更容易读懂、适合学习和项目设计的专题文档。
| 特点 | 说明 |
|---|---|
| 易读 | 结构化、有层级、有示例 |
| 可导航 | 有目录、有链接、有分类 |
| 含结论 | 给出明确的知识结论 |
推荐理解方式
最理想的结构是:
原始图片编号 → OCR 文档条目 → 专题研究文档这样做的好处:
- 玩家:能知道结论不是凭空写的
- 维护者:能快速回查原证据
- AI 系统:能更稳地把「结论层」和「证据层」分开处理
为什么这很重要
| 重要性 | 说明 |
|---|---|
[已确认] | 教程、脚本界面、引擎更新里有不少细节只出现在截图里 |
[已确认] | 如果没有证据链,后期很容易把推断写成事实 |
[高可信推断] | 对网页端知识库来说,OCR 证据页可以作为「附录/证据参考」模块存在,而不是直接占主内容层 |
证据链示例
以「广播机制」为例:
- 原始截图:截取官方教程中广播积木的截图,编号如
tutorial_001.png - OCR 原文:通过 OCR 把截图转成文本,记录在
官方教程截图转文本.md中 - 专题文档:在
广播机制完全指南.md中引用 OCR 内容,给出结构化结论
这样用户既可以看易读的专题文档,也可以在需要时回查 OCR 原文和原始截图。
相关页面
- OCR资料导航 - OCR 资料总入口
- OCR 图片编号映射表 - 编号与主题映射
- OCR 资料总览与完整化现状 - OCR 整体状态
- OCR 证据使用规范 - 证据使用规范
- OCR 状态词与回链规范 - 状态词规范
待验证问题
[待验证]不同 OCR 工具对同一截图的识别率差异[待验证]某些老旧截图是否仍可获取原图
后续优化方向
- [ ] 补充更多证据链示例
- [ ] 完善映射表与专题文档的对应关系
- [ ] 补充 AI 系统使用指南
