python fitz将pdf文档转图片和文字代码

代码语言:python

所属分类:其他

代码描述:python fitz将pdf文档转图片和文字代码

代码标签: python fitz pdf 文档 图片 文字 代码

下面为部分代码预览,完整代码请点击下载或在bfwstudio webide中打开

#!/usr/local/python3/bin/python3
# -*- coding: utf-8 -*
# -*- coding: utf-8 -*-

import fitz
from operator import itemgetter
import os
import time
 
 
# 将pdf转换为图片
def pdf_to_image(pdfPath, imagePath):
    pdfDoc = fitz.open(pdfPath)
    for pg in range(pdfDoc.pageCount):
        page = pdfDoc[pg]
        pix = page.getPixmap(alpha=False)          # 默认是720*x尺寸
        if not os.path.exists(imagePath):
            os.makedirs(imagePath)
        pix.writePNG(imagePath+'/'+'images_%s.jpg' % pg)     #将图片写入指定的文件夹内
 
 
# 将pdf转换为txt文字
def pdf_to_text(pdfPath):
    doc = fitz.open(pdfPath)
    for page in doc:
        text = page.getText()
        print(text)
       
 
 #将pdf文档变成文字块
def pdf_to_TextBlocks(pdfPath):
    doc = fitz.op.........完整代码请登录后点击上方下载按钮下载查看

网友评论0