提取文本信息
PDF是Adobe公司开发的电子文件格式,也是Internet上进行电子文档发行和数字化信息传播的理想文档格式。现在互联网上越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件很多使用PDF格式文件。
PDF文件一个弊端就是用户不能直接提取该文档中的文字或图片信息,给大家查找和使用资料带来麻烦。如果你使用了下面的两款小工具,就可以轻松提取PDF文件中的文字和图片信息了。
一、提取文本信息
提取PDF文件中的文本信息时,需先将PDF文件转换为文本文档,随后只要用Word等文本编辑工具将转换的文本文件打开。
“VeryPDF PDF2Word”可以将PDF文件转换为Word文档文件,能用Word打开转换后的PDF文件,即可轻松提取文档中的文字信息。
使用PDF2Word转换PDF文件时,在程序主界面中单击“file→Open”(打开)按钮,选择需要打开的PDF文件,随后单击“打开”按钮,弹出文件保存对话框,在此选择转换后文件保存的文件名和路径。
并在下面的“保存类型”项中选择保存方式“Word files(*.rtf)”,这样该文件将会被转换为rtf格式,然后单击“保存”按钮。
还可对选中的PDF文件进行分析,分析后并开始转化,在程序主界面下面弹出一个转换进度条。
分析转换
文件转换后,就可以使用Word打开转换后的文件了。
打开转换后的文件
怎么样文字信息和图片就可以在Word中随便修改了。
将PDF中的图片一网打尽
二、将PDF中的图片一网打尽
若想提取文档中的图片,在word中非常麻烦,可使用一款名为“PDF Extract TIFF”,将PDF文档中的所有图标提取出来并保存为TIFF图片格式。
用PDF Extract TIFF提取PDF中图片时,启动PDF Extract TIFF,在主界面中单击“open”(打开)按钮,在弹出的窗口中选择需提取图片的PDF文件。
PDF Extract TIFF主界面
随后打开“另存为”对话框,在此选择好图片文件保存的路径和图片文件名。
通过上面的设置,单击“保存”按钮,对PDF文件中的所有图片进行提取,并保存的指定的文件夹中。怎么样,PDF文档中的图片是不是被一网打尽了。
网友评论