【转载+整理】将PDF文件转换成DOC、TXT的方法和软件

血腥妖精 发表于 2007-11-30 19:47:19

       
         这两天正要用PDF,把一些好用的方法和软件整理到一起,供大家方便使用。


   方法:

      
      1 最传统的方法:
利用Office 2003中的Microsoft Office Document Imaging组件来实现。 

  第一步:先用Adobe Reader打开想转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”窗口中将“打印机”栏中的“名称”设置为“Microsoft Office Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。

  注:如果没有找到“Microsoft Office Document Image Writer”项,使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件,选中“Office 工具 Microsoft DRAW转换器”。

  第二步:运行“Microsoft Office Document Imaging”,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”,不管它,确认即可。

  注:对PDF转DOC的识别率不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对工作。

  以上仅在word2003中可用,其它版本没有Microsoft Office Document Image Writer。




      2  防止乱码出现的方法:“百度硬盘”将中文PDF文件转化为无乱码DOC文件。

      首先,启动“百度硬盘”,点击“文档”下的"PDF"文档或指定搜索某个"PDF"文档,接下来找到需要转换为DOC的文档的文件,点击下方的快照链接,然后跳出一个网页,然后点击“文件->使用Microsoft office Word编辑”,可以再word中打开当前页面,文件中除了无法显示图片外,文字以及排版格式都是原版的。
PPT转DOC也可以用上述这种办法。



                                =======================================



     软件:


           1 我常用的两个软件:Solid Converter PDF  、PDF to Word v3.0

           NO.1
           软件名称: Solid Converter PDF   
           
软件类型:绿色软件  
           运行环境:Win9X/WinXP/Win2000/
           软件语言:简体中文 
           软件大小:5.5 MB  
       -------------------------------------------------------
      
Solid Converter PDF是一套专门将PDF文件转换成DOC的软件,除了转换成DOC文件外,还可以转换成RTF以及Word XML文件。除此之外,它还有一个图片撷取功能,可以让我们将PDF档里的图片撷取出来,以及将PDF档里的表格撷取出来,并输出到Excel里,方便我们编辑表格里的资料。
PDF转换为WORD,TXT,图片等格式工具,对中文支持一级棒,是目前同类软件中最出色的。
解压后,在文件夹里直接点solidconverterPDF.exe就可以用了,转换真的很好,我用别的软件转换有乱码现象的文件有,这个转换没有。



          NO.2
          软件名称: PDF to Word v3.0
         
软件类型:绿色软件  
          运行环境:Win9X/WinXP/Win2000/
          软件语言:简体中文 
          软件大小:5.0 MB  
        PDF2Word(pdf to word)让你可以把文本,图片以及其他内容从pdf文档中输出到word文档中,所以你能够重新编辑pdf内容,PDF2Word将保存文本,版面和图片到生成的word文档中。PDF2Word(pdf to word)是一个独立的软件,所以你不需要安装Microsoft Word,Adobe Acrobat,甚至 Acrobat Reader来运行它。


SolidConverterPDF.rar 下载链接:
http://www.fs2you.com/files/feae2999-911f-11dc-b7b3-00142218fc6e/
PDF2Word_v3.0.rar 下载链接:
http://www.fs2you.com/files/feac8540-911f-11dc-8fcd-00142218fc6e/




         2  PDF阅读器

      在下载PDF阅读器后,把它安装启动。然后在左方列表里选择你将要将之转化成文本的PDF格式文件,点击菜单栏上的“文件→导出为文本”即可将整个PDF文件导出成为TXT格式的文本文件。

        A 只导出一页:要是我们想要导出某页中的文本又要如何做?很简单,只要到该页,然后点击菜单栏上的“编辑→复制整页文本”,然后在一个TXT纯文本文件里按Ctrl+V将它粘贴进去就完成该操作了。

       B 只导出想要的内容:利用以上思维方式,我们可以继续利用这个小软件,帮我将某页中的某一段变成文本,方法是用工具栏中的“选中”按钮(像手掌的那个按钮右边),在PDF文件中将需要的段落选中(变为黄色),然后我们点击菜单栏中的“编辑→复制”,再将它拷到TXT文件里即可。




以上方法和软件经测试均有效,但也可能会存在时效问题,即:很久之后会有更便捷的新方法和软件诞生,届时请勿对本文嗤之以鼻,谢谢!




阅读3624次 评论1条 个人主页 扔小纸条 文件夹: 入侵
收藏: QQ书签 del.icio.us 订阅: Google 抓虾

最新评论


  • 123
    2008-03-04 22:25:09 匿名 61.138.*.*

    PDF3。0很好用,谢谢

    不客气!

发表评论

* 昵称

已经注册过? 请登录

新用户请先注册 以便能显示头像及追踪评论回复

Email
网址
* 评论
表情
 
 

分类小组论坛
杂谈, 娱乐、八卦, 文学、艺术, 体育, 旅游、同城, 象牙塔, 情感, 时尚、生活, 星座, 科技

请注意遵守中华人民共和国法律法规, 如威胁到本站生存, 将依法向有关部门报告, 同时本站的相关记录可能成为对您不利的证据.

相关法律法规
全国人大常委会关于维护互联网安全的决定
中华人民共和国计算机信息系统安全保护条例
中华人民共和国计算机信息网络国际联网管理暂行规定
计算机信息网络国际联网安全保护管理办法
计算机信息系统国际联网保密管理规定