为什么要研究神经网络?

为什么要研究神经网络?

   有人问我,你为什么突然有兴趣研究这个了,其实答案很简单也很无奈,市面上现在没有合适的可以识别古籍毛笔字尤其是繁体的软件。太多的法本需要整理成电子文档来保存,在下一直的志愿就是以后能建立一个道教图书馆,里面放上各门各派的法本,任天下道友随意观看。

   但要建立这个,需要有一个良好的识别软件,能够对古籍的文字进行提取,并且对于那些字库中不存在的讳字及符文,能够自动转换成图片,这个无论是adobe acrobat pro,ABBYY_FineReader,或是汉王 PDF OCR,中文的识别还是偏重于规则的汉字上,而在设计时也是通过内部的一定变形来进行泛化,用来识别毛笔字,尤其对于那些竖排的无标点手写古籍来说,只能说是惨不忍睹。

  既然没有人做这个事,就只能自己来做了。

三符风云涌

2 Comments

地主 Posted onpm 4:52 - 2016 年 11 月 19 日

记得以前看到过,国外在用网站识别码来识别古籍。
就是把古籍的照片拿出几个字来用人工识别。

    三符风云涌 Posted onpm 3:19 - 2016 年 11 月 28 日

    国外的古籍,大多只要识别字母就行了,字母是有限的,国内的毛笔汉字真是不容易,一个汉字就是一个图形,并且充满异体字。

Leave a Reply