PChome 3月31日消息,近日,百度旗下文心大模型衍生项目PaddleOCR在GitHub上Star数突破73.3K,以微弱优势超越谷歌旗下产品Tesseract OCR(73.2K),这也是中国开源技术在OCR领域首次登顶全球。
PChome 3月31日消息,近日,百度旗下文心大模型衍生项目PaddleOCR在GitHub上Star数突破73.3K,以微弱优势超越谷歌旗下产品Tesseract OCR(73.2K),成为全球最受欢迎的OCR开源项目,这也是中国开源技术在OCR领域首次登顶全球。

PChome了获悉,1985年,惠普实验室推出Tesseract OCR,2005年开源后由谷歌接手维护,是OCR领域近40年的标杆产品,长期霸榜GitHub。此次登顶的PaddleOCR则依托文心大模型,支持超100种语言,用户覆盖160个国家和地区;2024年起Star数爆发式增长,2026年1月推出的PaddleOCR-VL-1.5在国际评测中取得了全球SOTA成绩。截止2025年9月,该项目累计下载量超900万,被5.9k+项目引用,是GitHub社区中唯一一个Star数超过50k的中国OCR项目。
此外,百度同步升级服务:官网免费解析额度由每日1万页提升至2万页,用户还可通过OpenClaw直接调用PaddleOCR Skill,免费获取高精度PDF解析能力。

此次超越不仅打破了谷歌在OCR领域的长期主导地位,也展现出了国产AI技术与开源生态的全球竞争力。