该成果构建了 SCUT-COUCH 多样式海量文字样本大数 据集;研制了一款基于深度学习的完全自主知识产权手写识 别技术、光学字符识别(OCR)技术,支持简体、繁体、简 繁混合识别,主要特点:(1)手写输入:支持连续书写, 包括重叠书写和整行书写;包括半屏和全屏两种方式;(2) 书法美化:支持鹅毛笔和毛笔书法等多种风格渲染;(3) 大字符集:支持常用字和生僻字,无缝支持简繁体混合书写;(4)词组联想:根据输入上下文语义,智能联想等。(5) 支持常规文档、PPT 文档、场景图像文档的 OCR 识别。
成果已获得国家发明专利授权 20 余项、计算机软件著作权登记 8 项、另外申请发明专利 30 项。 相关技术已先后 授权给国际国内多家知名 IT 企业使用。
主要特色包括:(1)单字识别率:第一候选:≥98%, 前十候选:≥99.8%;(2)字符集:国标 GB2312-80,BIG5 字符集、GB18080-2001 大字符集等多种字符集;支持 1000 多个常用香港字及生僻字、数字、英文字符、120 多种标点 及各类常用符号;(3)识别速度:单字识别时间小于 60ms;(4)支持任意方向旋转手写、连续手写、重叠手写、重叠 多行书写识别。获广东省科技进步一等奖,目前已成功授权 于多家公司使用