你好，我是 AoZai

一个对计算机视觉和深度学习感兴趣的开发者。这里记录我的学习和项目过程。

最新文章

2026年6月4日 4 min read

从 ONNX 模型到可玩的 Mod——记录三个阶段的完整开发历程：Fabric 原型、NeoForge 单人底座与玩法分离、Paper 服务端插件，以及把 7356 类手写识别变成 3D 法术系统的设计思考。

2026年6月3日 4 min read

SharedEngramCupModel 之后继续推进单字分类的架构探索。标准残差骨干成为新的底模，冻结重排在相同路线下拿到最高分，ConvNeXtV2 单独赛道冲上 97%，以及 MBConv 轻量化失败证明了骨干选择比参数数量更重要。

2026年5月15日 4 min read

将单字模型的视觉能力迁移到行级OCR，经历CTC序列建模、外部域崩塌、domain adapt等波折，最终形成一套可用的多字识别方案。

浏览关于汉字识别的文章

浏览关于 OCR 的文章

浏览关于 CTC 的文章

浏览关于序列模型的文章

浏览关于深度学习的文章