以文本方式查看主题

-  中文XML论坛 - 专业的XML技术讨论区  (http://bbs.xml.org.cn/index.asp)
--  『 Semantic Web(语义Web)/描述逻辑/本体 』  (http://bbs.xml.org.cn/list.asp?boardid=2)
----  为了应用本体,急需一关于pdf文档提取成txt文档的工具  (http://bbs.xml.org.cn/dispbbs.asp?boardid=2&rootid=&id=11970)


--  作者:gengkeming
--  发布时间:11/11/2004 10:50:00 AM

--  为了应用本体,急需一关于pdf文档提取成txt文档的工具
不知各位大哥,有没有关于pdf文档转换成txt文档的工具, 那种用起来挺好的!能转换的具有正常格式的工具!
--  作者:hal9000
--  发布时间:11/12/2004 2:20:00 AM

--  
rdf or pdf?
--  作者:小蜜蜂
--  发布时间:11/12/2004 7:25:00 AM

--  
Acrobat 5.0
--  作者:jeanscjx
--  发布时间:11/12/2004 10:44:00 AM

--  
Omnipage 应该可以的 ,我自己安装了一个 ,不过没试过
--  作者:hal9000
--  发布时间:11/12/2004 4:29:00 PM

--  
如果是在项目中用的话(比如做搜索时的提取),推荐sourceforge上的一个专门来处理pdf的一个java项目,叫什么我忘了:P, 到sourceforge上搜一下吧
--  作者:nybon
--  发布时间:11/23/2004 9:57:00 PM

--  
xpdf可以从pdf里面抽取text,是我用过的唯一一个中文支持比较好的

http://www.foolabs.com/xpdf/about.html
download页面下载的xpdf包里面有一个pdf2txt可以转的


--  作者:iamwym
--  发布时间:11/24/2004 12:10:00 AM

--  
open pdf->select text-> ctrl-a-> ctrl-c -> ctrl-v
--  作者:liuhg
--  发布时间:4/13/2005 8:29:00 PM

--  
你可以试一下超星3.8中的文本提取功能
--  作者:liuhg
--  发布时间:4/13/2005 8:29:00 PM

--  
你可以试一下超星3.8中的文本提取功能
--  作者:jiexincao
--  发布时间:4/14/2005 1:32:00 AM

--  
ScanSoft PDF Converter
可以在word里打开PDF,当然文字的就成了文字了,挺好用的,网上有的下载。v2.0
--  作者:jiexincao
--  发布时间:4/15/2005 12:38:00 AM

--  
ScanSoft PDF Converter
我上传到ftp中了,希望对你有帮助
--  作者:dubistdumm
--  发布时间:4/23/2005 11:16:00 AM

--  
好象高版本的ACROBAT READER能直接将PDF另存为TXT格式的
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
109.375ms