在pdf文档中的文字和图片等信息,处于一种不可被更改的状态,它的稳定性非常高,不容谌冥鹳籀易出现乱码,想要提取其中的文字,怎么操作
工具/原料
联想小新
windows10
方法/步骤
1、主界面左侧的功能选项中,艽鹤绚趣选择第三位的“PDF文档识别”,然后可以在界面中心区域,将需要进行文字提取的pdf导入其中
2、从电脑中找到合适的pdf文档,提取文字最好是纯文字内容的pdf,将其载入工具中
3、页面选择可以设置好需要进行识别的页面,识别效果选择“格式优先”,导出格式,选择TXT文档的形式
4、在点击右下角的“一键识别”后,识别成功,点击“操作”下方的小图标,分别是打开文件和文件夹,打开文件