python提取pdf文件中的图片并保存代码

代码语言:python

所属分类:其他

代码描述:python提取pdf文件中的图片并保存代码,主要使用了PyMuPDF库,非常方便

代码标签: pdf 提取 文件 图片 保存

下面为部分代码预览,完整代码请点击下载或在bfwstudio webide中打开

#!/usr/local/python3/bin/python3
# -*- coding: utf-8 -*

import fitz # PyMuPDF
import io
from PIL import Image

# file path you want to extract images from
file = "/data/wwwroot/default/asset/bfw.pdf"
# open the file
pdf_file = fitz.open(file)
# iterate over PDF pages
for page_index in range(len(pdf_file)):
    # get the page itself
    page = pdf_file[page_index]
    image_list = page.getImageList()
    # printing number of images found in this page
    if image_list:
        print(f"[+] 找到 {len(image_list)} 张图片 在页面 {page_index}")
    else:
        print("[!] 未找到图片", page_index)
    for image_index, img in enumerate(page.getImageList(), start=1):
  .........完整代码请登录后点击上方下载按钮下载查看

网友评论0