关于djvu转pdf的一个问题。 注:我的djvu文件里的内容不是图片,而是文字(可以复制,也可以被搜索)。
的有关信息介绍如下:有一个名字叫DjVuToy 的软件可以将djvu直接转为PDF的,不过我手头没有djvu文件,所以没有办法帮你测试一下转好后能不能复制,你自己试一下吧。地址已发你百度消息里面,你查看一下消息就行了。还有就是,如果转出来成了不能复制的,你可以用adobe acrobat 软件坐一下OCR,然后做成双层PDF就可以检索了~~
转换过了还是图片形式的,要想复制的话还得要OCR识别处理。不过看你文件有公式这个比较困难了~~~以为OCR对公式的识别率很低的~~~但那是如果只要文字部分的话,但是可以的 用ABBYY finereader处理一下 大概500+页要2个小时吧~~~ 识别的准确率也是蛮高的~~特别是英文~~~
给楼主泼个冷水。
这几乎是不可能的——之所以说几乎,是因为还有点可能。
如果楼主还想知道原因,请往下看。
首先,二楼提出的转换软件是肯定不行的,转换出来是图片,楼主自己也是半个高手,知道通过打印转换出来的都是图片。
但楼主似乎没有时间去研究原因,不妨我来解释一下。
很简单,djvu也是图片,djvu并不是文字!所以不管怎么转换都是图片。
那为什么楼主还能在djvu中搜索呢?那是因为djvu是可以带隐藏文本的,这些文本的内容就是供楼主搜索用的。
隐藏文本不仅有文本信息,而且有位置信息,因此用鼠标按住左键在DjVu页面上拖动,可以选中隐藏文字,并复制到剪贴板。
但很不幸的是,这些文本貌似只能用windjvu导出,然后自己重排版,再做出pdf,这样的pdf才是文本结构,才能进行选择和搜索。
这也就是为什么说“几乎是不可能的”,因为至少还有两条路——一是前面提到的重排版,二是批量ocr导出文本还是重排版,但不论哪种方式,做这么500多页的一本书,加上校对,要耗费极大的人力……
安装上acrobat专业版,打印成PDF,试一下。我之前打过不过原文件就是扫描的。
我用其他软件打出的PDF字体都可以搜索的。