python fitz将pdf文档转图片和文字代码
代码语言:python
所属分类:其他
代码描述:python fitz将pdf文档转图片和文字代码
代码标签: python fitz pdf 文档 转 图片 文字 代码
下面为部分代码预览,完整代码请点击下载或在bfwstudio webide中打开
#!/usr/local/python3/bin/python3 # -*- coding: utf-8 -* # -*- coding: utf-8 -*- import fitz from operator import itemgetter import os import time # 将pdf转换为图片 def pdf_to_image(pdfPath, imagePath): pdfDoc = fitz.open(pdfPath) for pg in range(pdfDoc.pageCount): page = pdfDoc[pg] pix = page.getPixmap(alpha=False) # 默认是720*x尺寸 if not os.path.exists(imagePath): os.makedirs(imagePath) pix.writePNG(imagePath+'/'+'images_%s.jpg' % pg) #将图片写入指定的文件夹内 # 将pdf转换为txt文字 def pdf_to_text(pdfPath): doc = fitz.open(pdfPath) for page in doc: text = page.getText() print(text) #将pdf文档变成文字块 def pdf_to_TextBlocks(pdfPath): doc = fitz.op.........完整代码请登录后点击上方下载按钮下载查看
网友评论0