4 min read
从单字到整行:端到端手写中文识别实战
将单字模型的视觉能力迁移到行级OCR,经历CTC序列建模、外部域崩塌、domain adapt等波折,最终形成一套可用的多字识别方案。
阅读文章 开始阅读将单字模型的视觉能力迁移到行级OCR,经历CTC序列建模、外部域崩塌、domain adapt等波折,最终形成一套可用的多字识别方案。
阅读文章 开始阅读在初代单字模型基础上,将类别扩展到7356、重设计共享原型分类头、打通Competition外部验证,最终形成48/96/184三档可用模型。
阅读文章 开始阅读社团研究成果整理。记录从原型验证到模型压缩、特征融合再到记忆机制的完整探索过程,以及踩过的坑和阶段性的思考。
阅读文章 开始阅读