python提取pdf文件中的图片并保存代码
代码语言:python
所属分类:其他
代码描述:python提取pdf文件中的图片并保存代码,主要使用了PyMuPDF库,非常方便
下面为部分代码预览,完整代码请点击下载或在bfwstudio webide中打开
#!/usr/local/python3/bin/python3 # -*- coding: utf-8 -* import fitz # PyMuPDF import io from PIL import Image # file path you want to extract images from file = "/data/wwwroot/default/asset/bfw.pdf" # open the file pdf_file = fitz.open(file) # iterate over PDF pages for page_index in range(len(pdf_file)): # get the page itself page = pdf_file[page_index] image_list = page.getImageList() # printing number of images found in this page if image_list: print(f"[+] 找到 {len(image_list)} 张图片 在页面 {page_index}") else: print("[!] 未找到图片", page_index) for image_index, img in enumerate(page.getImageList(), start=1): .........完整代码请登录后点击上方下载按钮下载查看
网友评论0