Как собрать pdf-документ из кусков Python
Создано: 12 февраля 2025Автор: Егор Астапов57 просмотровСложность: легкий
Как собрать pdf-документ из кусков pdf Python? Эта статья является продолжением статьи как разделить pdf документ на страницы Python. У меня было несколько одностраничных pdf-документов и мне необходимо было из этих кусочков собрать один pdf-документ. Я снова воспользовался библиотекой PyPDF2. Посмотрите на код ниже.
#!/usr/local/bin/python
import os
import PyPDF2
def build_pdf(output_dir):
if not os.path.isdir(output_dir):
print("нет такой директории", output_dir)
return
# Список PDF-файлов для объединения
pdf_files = ["page1.pdf", "page2.pdf"]
for file in pdf_files:
filepath = os.path.join(output_dir, "part", file)
if not os.path.isfile(filepath):
print("нет такого файла", filepath)
return
# Создаем объект для записи PDF
pdf_writer = PyPDF2.PdfWriter()
# Проходим по каждому файлу и добавляем его к pdf_writer
for pdf_file in pdf_files:
filepath = os.path.join(output_dir, "part", pdf_file)
with open(filepath, "rb") as file:
pdf_reader = PyPDF2.PdfReader(file)
# Добавляем все страницы из этого файла
for page in range(len(pdf_reader.pages)):
pdf_writer.add_page(pdf_reader.pages[page])
output_file = "new_document.pdf"
# Записываем объединенные страницы в новый PDF файл
with open(os.path.join(output_dir, output_file), "wb") as output_file:
pdf_writer.write(output_file)
print(f"PDF файлы успешно объединены в {output_file}")
# Укажите путь к вашему PDF файлу
output_dir = "app/parsing/"
build_pdf(output_dir)