找回密码
 开放注册
搜索
查看: 451|回复: 6

求PDF转TXT无乱码方法

[复制链接]
发表于 2011-7-26 07:57:19 | 显示全部楼层 |阅读模式
近来想翻译几本汤姆克兰西的小说。昨天下了一本2010年出的<Tom Clancy's Dead or Alive>,但问题是尝试将pdf转为txt时每次都是乱码。无论使用adobe reader 9还是10都一样。

求可行解决方法,感激不尽。有可乐相送
发表于 2011-7-26 08:04:56 | 显示全部楼层
试试看pdf2txt这软件

没遇到过乱码,但是会有格式问题(PDF带格式的,这个问题估计无解)。

另外看看PDF是不是带有某些特殊字符,比如Unicode什么乱七八糟的玩意儿。俺每次把古书转成TXT都会遇到这毛病。

这里是下载:http://www.pdf2txt.com/download.htm
可以无限制的试用30天。
不过估计你会找到破解啊免费啊什么的。
发表于 2011-7-26 12:30:24 | 显示全部楼层
人手转
发表于 2011-7-26 12:37:14 | 显示全部楼层
在PDF里面使用Microsoft office document image writer这个打印机选型进行打印,会出现一个后缀名为.mdi的文件,直接打开,选择工具——将文本发送至WORD,除图片和特殊格式外,其余文本均可以转换,除非没有字体库,这个方法只能转文字。
那个虚拟打印机是2003OFFICE版本里面的,没使用过其他OFFICE版本,相关内容是否相同不得而知
 楼主| 发表于 2011-7-26 13:49:28 | 显示全部楼层
下了个OCR识别软件Fine Reader终于搞定了...[s:7]
发表于 2011-7-26 16:55:29 | 显示全部楼层
汉王 PDF OCR
我觉得这个也不错
发表于 2011-7-26 19:47:31 | 显示全部楼层
要有完全无问题的办法估计我直接丢饭碗了- -
您需要登录后才可以回帖 登录 | 开放注册

本版积分规则

Archiver|手机版|小黑屋|13号避难所-旧人类论坛

GMT+8, 2026-6-8 20:06 , Processed in 0.087247 second(s), 15 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表