推荐专题：

1000字范文 > 利用python中pdfplumber库提取PDF文件中文字

利用python中pdfplumber库提取PDF文件中文字

时间：2020-08-26 17:11:51

相关推荐

利用python中pdfplumber库提取PDF文件中文字

pdfplumber库中提供了一个extract_text()方法来帮助我们提取PDF文件中的文字。我们只需要使用pdfplumber中的open()方法打开我们希望提取文字的PDF文件，然后对所需提取文字的页面使用extract_text()方法即可提取出所需文字。

若希望提取出文件中全部文字，利用循环遍历PDF文件中所有页面即可

代码示例

import pdfplumberimport os#提取一页文字def extract_text_onepage (filepath,wpage):pdf = pdfplumber.open(filepath)page = pdf.pages[wpage]print(page.extract_text())#提取全部文字def extract_text_allpage (filepath):pdf = pdfplumber.open(filepath)for page in pdf.pages:print(page.extract_text())if __name__ == '__main__':path = os.getcwd() #获取当前的操作目录，因为pdf文件放在了当前目录中path += '\\paper.pdf' #文件名extract_text_onepage(path,1)extract_text_allpage(path)

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。

相关阅读

pdfplumber 提取pdf中文 Python

2019-01-08

python中pdfplumber解析pdf_Python教程：pdfplumber提取pdf中的表格数据

2023-04-20

python中pdfplumber解析pdf_Python中pdfplumber如何提取pdf中的表格数据

2021-06-14

Python 使用pdfplumber直接提取PDF文本内容

2020-02-19

扩展阅读

: PDF编辑技巧：怎么提取PDF文件中的页面

: 怎样提取PDF文件中的图片？提高工作效率就这么简单

: pdf文字编辑怎么操作？可以修改pdf文件中的文字吗？

: 使用Python+百度OCR文字识别提取图片内容

: 在PDF文件中如何给文字添加注释（教你一招）

: pdf编辑文字如何实现？原来在pdf文件中也可以插入文本框

最近发布

回忆无穷的精彩趣味运动会：1000字作文

2024-05-10

英语话剧大赛参与经历与表演心得

2024-05-10

快乐登顶：畅游长白山1000字作文素材汇总

2024-05-10

我喜欢的一名哲学家 1000字

2024-05-10

父亲眼中的无言关爱——1000字文章

2024-05-10

雷雨：高中生的心灵共鸣与思考

2024-05-10

推荐专题

诚信的作文1000字生物论文1000字营养与健康论文1000字生命作文1000字军训检讨1000字读书心得体会1000字好书读后感1000字歌颂祖国征文1000字读后感大学生1000字诊断学心得体会1000字自我剖析1000字 1000字故事西游记读后感1000字左右关于幸福的作文1000字大学入党申请书1000字