5D艺术网首页
商城
|
资讯
|
作品
|
博客
|
教程
|
论坛
登录
注册
加为好友
发短消息
来自:
性别:秘密
最后登录:2011-09-19
http://moil.5d.cn/
首页
|
新闻
|
话题
|
博客
|
相册
|
艺术作品
|
社交关系
|
留言板
|
社交圈
2005/02/22 | 将PDF文件转换为TXT文件
类别(文摘)
|
评论
(1)
|
阅读(340)
|
发表于 23:28
将PDF文件转换为TXT文件
PDF是电子图书常用的文件格式,但是由于PDF文件不便阅读(需要安装Acrobat才能看),而且少则几百K,多则十来兆,不便网上传输,我们常常希望能把它转化成文本文件格式,却又往往无从下手。其实,这并不是一件难事。
首先,我要向大家介绍一个能将PDF文件转成TXT文件的软件——Aerial2.0。
我们知道,阅读PDF文件的工具,当属Adobe的Acrobat reader软件了,而Aerial则是Acrobat的一个插件。在安装了Aerial之后,Acrobat reader的菜单中的“plug-ins”就会多出一项“Aerial”。
Aerial 2.0为我们浏览PDF文件提供了强大的功能:
1.index manager:用于查找和管理文章的索引(必须要有Acrobat Exchange);
2.navigator:为PDF文件建立树结构,方便我们浏览;
3.paper clip page:剪贴页管理(必须要有Acrobat Exchange);
4.copy table to clipboard:将表格复制到剪贴板;
5.save as RTF :这才是我们最需要的功能,转化之后不仅保留了文字,连字体和颜色图案都能保留下来!
但是,Aerial并不是万能的,它对中文支持不太好,排版有时会比较混乱,而且遇上扫描的纯图形的PDF文件时就无能为力了。要想把此类PDF文件转化成文本文件,就相对麻烦一些了,具体步骤如下:
1.先用Acrobat打开PDF文件,选定区域,放大到300%~500%(视具体情况而定),复制到剪贴板。
2.用Photoshop或Photoimpact等图形软件调出剪贴板的图形,存成单色的(注意:一定要单色)TIF、PCX或BMP文件,图形文件格式视你所用的OCR软件而定。笔者推荐使用BMP文件存盘。
3.用OCR软件识别图形文件(笔者用的是Wtocr7.0),经过简单的排版校正后,一般能有95%以上的识别率。再经过你的手工修改后,就可以了。
0
评论
Comments
日志分类
首页
[502]
记日
[282]
图片
[30]
电脑
[26]
文摘
[116]
科学
[48]