Google的工程师显然在“恢复”由惠普开发并被抛弃的一款索引引擎。
Google宣布,已经帮助惠普修复了20年前开发的Tesseract 中的软件缺陷。Tesseract 是由惠普实验室(HP Labs)开发的一款OCR
引擎,惠普后来将它发布为开放源代码软件。
Google为什么会对OCR 感兴趣呢?据Google称,简单地说,我们的目的就是使用户能够访问大量信息,当信息存储在纸质媒介上时,我们可以利用OCR
将这些信息转换为可供计算机处理的格式。
这一项目符合Google“索引和组织世界上信息”的目标。利用Tesseract
这样的开放源代码技术,其他工程师和机构可以帮助对更多的存储在纸质媒介上的信息进行数字化处理。
应内华达州大学的工程师的要求,Google向该项目提供了帮助。内华达州大学要求Google帮助修正这款老软件中的缺陷,当时,这款软件曾经是最精确的字符识别引擎之一。
Google表示,我们在惠普的同行意识到,通过发布为开放源代码来恢复这款软件的活力,会使它发挥更大的作用。
网友评论