본문 바로가기
IT/Python

Python을 활용한 PDF 분리하기 (Pdf나누기)

by 마단 2023. 4. 27.
반응형

pdf 분할 코드

파이썬으로 pdf파일 분리하는 방법입니다.

 

이전에 pdf파일 병합 코드를 작성한적이 있고, 그 글의 연장선인 pdf파일 분리코드를 적어보고자 해요

 

이전 글은 아래 URL을 참조해주세요 

 

https://madanhambo.tistory.com/199

 

 

PDF 파일 분리 방법

 

먼저 PDF페이지 분리는 병합보다 어렵지는 않아요

 

그냥 pdf 파일을 가지고오고 코드 입력하고 분리가 끝이거든요

 

그도 그럴게 pdf파일을 열어보면 자동으로 1페이지, 2페이지, 3페이지 다 나눠져있잖아요

 

그래서 코드 수정 할 필요없이 아래 코드만 입력하면 어렵지 않게 분리가 가능해요

 

pip install PyPDF2
from PyPDF2 import PdfFileReader, PdfFileWriter
pdfReader = PdfFileReader("분할목적파일.pdf","rb")

for pageNum in range(pdfReader.numPages):
    pdfWriter = PdfFileWriter()
    page = pdfReader.getPage(pageNum)
    pdfWriter.addPage(page)
    pdfWriter.write(open(f"./분할한1 PDF 파일{pageNum+1}.pdf","wb"))

 

먼저 병합 방법과 마찬가지로 pdf파일을 다루기 위하여 PyPDF를 설치해줘요

 

from PyPDF2 import PdfFileReader, PdfFileWriter
pdfReader = PdfFileReader("분할목적파일.pdf","rb")

for pageNum in range(pdfReader.numPages):
    pdfWriter = PdfFileWriter()
    page = pdfReader.getPage(pageNum)
    pdfWriter.addPage(page)
    pdfWriter.write(open(f"./분할한1 PDF 파일{pageNum+1}.pdf","wb"))

 

여기서 문제, 내가 가지고 있는 파일 이름은 포트폴리오고, 포트폴리오를 1페이지부터 20페이지 까지 다 분리하고 싶은데 어떻게 해야할까? 라고 한다면

 

위 코드에서 한글만 바꿔주면돼요

 

예를들어서 위의 코드의 경우 파일명을 분할목적파일이라고 적었는데

 

파일명이 포트폴리오잖아요? 그러니까 한글을 분할목적파일 대신 포트폴리오라고 적으면 돼요

 


같이 보시면 좋은 글

 

2023.04.10 - [정리중] - Python을 활용한 PDF 합치기

 

Python을 활용한 PDF 합치기

파이썬을 통한 pdf 파일 합치는 방법 글의 순서 1. 왜 PyPDF인가 2. pdf 병합 - Colab에서(노가다 코드) 3. pdf 병합 - Colab에서(노가다 코드 개선) 4. 병합시 문제점 보완 1. 왜 Pypdf인가? 제가 일을 할 때 가

madanhambo.tistory.com

2023.05.21 - [IT/Python] - 파이썬으로 Pdf 텍스트 추출 법

 

반응형

'IT > Python' 카테고리의 다른 글

파이썬으로 Pdf 텍스트 추출 법  (0) 2023.05.21
Python을 활용한 PDF 합치기  (0) 2023.04.10

댓글