怎么才能把PDF中的扫描成的书中的文字转化成WORD格式?
发布网友
发布时间:2022-02-23 01:31
我来回答
共7个回答
热心网友
时间:2022-02-23 03:00
如果你有扫描仪的话,就需要一款汉王OCR软件,如6800。如果没有扫描仪的话,需要购进一款汉王6800(或更高的级别的)扫描仪,随机赠送OCR软件。
它能够将扫描的文字直接导入到WORD中进行编辑。
Pdf转化word
1. 第一步:先用Adobe Reader打开想转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”窗口中将“打印机”栏中的“名称”设置为“Microsoft Office Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。
第二步:运行Microsoft Office Document Imaging,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”,不管它,确认即可。
2. 情况一:如果pdf文档本身就是用pagemaker或word转换而来的(文字非常清晰锐利,很容易识别),那你就方便了。你可以先用acrobat打开,然后点文件——>另存为——>把他保存成rtf文档,这样将把所有的pdf页保存成rtf文档,在用word打开。注意最好保存成rtf文档,要不很有可能产生乱码。小技巧:如果你只想识别pdf文件中的其中几页,那你可以现把那几页另存为新的pdf文档,再进行识别。Ny1
情况二:如果你所得到的pdf文档是用扫描仪扫进去的图片转换的,那么就麻烦了,不过还是比手输入快多了,所以继续往下看。首先你用acrobat把pdf文件打开,然后点文件——>另存为——>把他保存成图片格式*.tiff(这是无压缩图片格式,以便识别),然后到网上下载文字识别软件,建议用尚书六号(现在好像出到七号了,很有名,随处都可以下到),安装好后,打开转换好的tiff图片,点击识别,看,文字出来了吧,尚书系列文字识别软件功能十分强大,你可以在里面把文字都编辑好了,再保存成rtf或txt文件,然后粘贴到word里就可以使用了,注意过滤回车符。
热心网友
时间:2022-02-23 04:18
用图片制作的PDF文件转换成WORD文件也还是图像,是无法直接编辑的。比较简单的办法是将图像中的文字识别出来,然后就可以编辑了。
你可以这样去做:
一、将PDF文件中的各页图像提取出来
1)使用Adobe Acrobat软件
2)在上面菜单上选文件>导出>提取图像为>JPEG文件(其他二种也行,JPEG文件比较小)
3)按提示,选择一个适当的文件夹,保存图像
二、安装一个文字识别(OCR)软件用来识别已提取的图像
本人使用过多款识别软件,推荐汉王文本王、清华紫光TH,它们不但汉字识别率高,还可以识别表格、繁体字、英文、竖排文字等;输出方式也很灵活,可以只输出文字,也可以按原稿排版格式输出WORD文件;使用起来也都不复杂。
三、输出成WORD文件,进行编辑打印。
热心网友
时间:2022-02-23 05:53
史上最好的PDF转WORD工具----SolidConverterPDF[带注册]
由于个人编辑时,用PDF格式的很不方便经常要转为WORD格式,有没有好的工具呢,有很少,这款就是史上最好的软件
文件大小: 16000 K
超酷PDF转换WORD工具,100%支持中文,唯一支持中文的!安装的时候是英文,装好就是中文了!
说明:安装的时候是英文,装好就是中文了!
注册方法:Name:zhou_S_@sohu.com
Email:zhou_S_@sohu.com
Organization: zhou_S_@sohu.com
Unlock code: XGXT
注:邮箱与注册码是必须填写正确,其余则是可以随便填写的。
注册运行后有网络验证,把注册表里的HKEY_CURRENT_USER\Software\SolidDocuments\SolidConverterPDF\HistoryList键值删除即可。(或者用防火墙禁止访问网络?)
破解补丁:
path.exe是注册补丁 patch到软件的安装目录下即可。
超酷PDF转换WORD工具,100%支持中文,唯一支持中文的!内有效果图!
安装的时候是英文,装好就是中文了!
下载地址:
http://www.peee.net/Soft/rj/200507/767.html
热心网友
时间:2022-02-23 07:44
尚书OCR软件可以将图片格式的文字转成可编辑的,不过你说的不清晰,就有点难度了
热心网友
时间:2022-02-23 09:52
好像现在的工具都不能 如果有也通知我一下
热心网友
时间:2022-02-23 12:17
用汉王2.5试试,我一直用,还不错。
热心网友
时间:2022-02-23 14:58
第一步:打开我们下载好的软件,会出现一个对话框,选择上面的“从PDF中选文件”。然后在对话框中,打开需要编辑的PDF文档。
第二步:PDF文档就会出现在编辑页面中了。这时我们点击转换,软件就会自动对文件进行分解排版,以便于后续的识别过程。
第三步:点击上面的“识别”按钮,软件就会自动对文件上的文字进行识别,不一会儿就会把识别结果呈现在右边。大家可以对识别结果进行校对,如果发现错误可以进行改正。如果是多页内容进行识别的话,我们可以点击识别按钮选择下方的“全部”,就能对所有内容进行识别了。
第四步:最后我们想要保存为Word形式的话,直接点击上方的“Word”按钮,选择输出路径