“863计划”成果 TH-OCR技术走向世界

互联网 | 编辑: 李月松 2008-03-28 00:30:00转载-投稿

据国外媒体报道,搜索谷歌就一项针对图片和视频中所含文字内容的识别技术提交了专利申请。据悉该软件于2007年开发成功,它可识别图像、视频中内置的文本内容。谷歌在该专利申请的简要技术说明中表示,这种文字识别使用了计算机辅助技术,其中包括对图像中的文字进行抽取,以

据国外媒体报道,搜索谷歌就一项针对图片和视频中所含文字内容的识别技术提交了专利申请。据悉该软件于2007年开发成功,它可识别图像、视频中内置的文本内容。谷歌在该专利申请的简要技术说明中表示,这种文字识别使用了计算机辅助技术,其中包括对图像中的文字进行抽取,以前谷歌申请的专利技术多与文本搜索有关。业内人士预计,谷歌未来将在视频、图片搜索服务中向大家提供以OCR图片文字识别技术为核心的搜索服务。这个新闻,让一直默默耕耘着的OCR技术成为世人瞩目的明星。
业界人士称,谷歌所提交的图像和视频文本识别技术属于“光学字符识别(Optical Character Recognition,OCR)”范围。OCR技术已有30多年历史,主要应用于办公室自动化中的文本输人、邮件自动处理等领域。现在,文通信息以TH-OCR为核心技术的文档影像行业解决方案,已经在金融、通信、电力、OA等众多领域广泛应用。可以看出,OCR在个人市场与行业市场都有极大的应用潜力,“无所不能”的OCR技术迎来了它的黄金时代。
在科幻故事中经常会遇到这样的情景,人们通过“思考”的行为即可将所要表的内容在大屏幕显示设备上显示出来,从而与其他人自由地交流。借助图像文字识别软件,这样的情景不会只在科幻故事存在。
所谓图像文字识别软件,就是利用科技让电脑认字,是高科技智能行为的一种。将这种想法付诸实现的就是OCR软件,目前我国自助研发的TH-OCR技术处于世界一流水平,已经可以实现英文、日文、韩文、中文、我国少数民族文字的电子化录入。文通信息公司将TH-OCR技术进行产品化推广,针对用户实际需求推出多种中文录入软件和整体解决方案。
OCR是计算机输入技术的一种,它通过模式识别将文字的图像文件转化为可编辑的文本文件,彻底改变了计算机纸介质资料输入的概念。只要用扫描仪将文本图像输入计算机,就可转化为可修改的文本文件,这比手工输入速度快了几十倍。随着OCR技术的广泛应用,它正逐渐被人们所知晓。国际软件巨头微软在研发XP系统的时候,就意识到OCR的市场需求,在发布的Office 2003中全面配装了TH-OCR;硬件方面的领袖企业英特尔公司也确定TH-OCR为MMX技术支持项目。
无论是让计算机对文字进行排版输出,还是要让计算机认识它看到文字,所有这一切都是为我们生活服务。信息化和数字化的进程,让我们不再安于用十指敲击键盘来输入数据。人们希望能将时间和精力投入到更具创造性的工作中去,因而希望计算机等辅助设备能更具智慧。OCR技术就是其中的一项,跟打印技术相对,它是让计算机认字的一种技术,这远比打印复杂得多。

世界搜索引擎巨头谷歌,在07年就已进入了OCR研究领域,将OCR与传统的搜索技术结合在一起,获得了双赢的效果。通过OCR技术,谷歌可提供更准确、更人性化的搜索服务。只需输入文字,即可准确地搜索到视频、图片等资料里嵌入的文字信息,这项应用不仅仅方便了网民,更会为谷歌带来丰厚利润。而我国的北京文通信息技术有限公司早在92年就进入OCR领域,经过十五年不断发展,TH-OCR已经将其他OCR技术远远抛在了后面。从技术的可靠性、稳定性和实用性等多个角度来说,TH-OCR是目前最优秀的OCR技术。
TH-OCR是“863计划”重点项目,由清华大学电子工程系智能图文实验室研发,现在代表我国OCR技术水平的TH-OCR多次获得国际奖项。处于世界领先位置的TH-OCR技术,不仅仅在我国传统的汉字识别上达到了99.8%的识别率,而且已经实现了中英文混排图片文字的识别,同时日、韩等亚洲常见语言文字的识别更是让其他OCR技术望尘莫及。文通在2007年实现了我国少数民族语言识别,这是世界首个蒙藏维哈柯朝多民族语言识别技术。
个人应用与行业应用的全面发展,将OCR技术推上了前台,越来越多的人们开始知道、了解OCR,并时刻感受着OCR技术带来的便利。

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑