为什么要研究神经网络?

   有人问我,你为什么突然有兴趣研究这个了,其实答案很简单也很无奈,市面上现在没有合适的可以识别古籍毛笔字尤其是繁体的软件。太多的法本需要整理成电子文档来保存,在下一直的志愿就是以后能建立一个道教图书馆,里面放上各门各派的法本,任天下道友随意观看。

   但要建立这个,需要有一个良好的识别软件,能够对古籍的文字进行提取,并且对于那些字库中不存在的讳字及符文,能够自动转换成图片,这个无论是adobe acrobat pro,ABBYY_FineReader,或是汉王 PDF OCR,中文的识别还是偏重于规则的汉字上,而在设计时也是通过内部的一定变形来进行泛化,用来识别毛笔字,尤其对于那些竖排的无标点手写古籍来说,只能说是惨不忍睹。

  既然没有人做这个事,就只能自己来做了。

《为什么要研究神经网络?》有2个想法

    1. 国外的古籍,大多只要识别字母就行了,字母是有限的,国内的毛笔汉字真是不容易,一个汉字就是一个图形,并且充满异体字。

发表评论

电子邮件地址不会被公开。 必填项已用*标注