
파이썬으로 pdf파일 분리하는 방법입니다.
이전에 pdf파일 병합 코드를 작성한적이 있고, 그 글의 연장선인 pdf파일 분리코드를 적어보고자 해요
이전 글은 아래 URL을 참조해주세요
https://madanhambo.tistory.com/199
PDF 파일 분리 방법
먼저 PDF페이지 분리는 병합보다 어렵지는 않아요
그냥 pdf 파일을 가지고오고 코드 입력하고 분리가 끝이거든요
그도 그럴게 pdf파일을 열어보면 자동으로 1페이지, 2페이지, 3페이지 다 나눠져있잖아요
그래서 코드 수정 할 필요없이 아래 코드만 입력하면 어렵지 않게 분리가 가능해요
pip install PyPDF2
from PyPDF2 import PdfFileReader, PdfFileWriter
pdfReader = PdfFileReader("분할목적파일.pdf","rb")
for pageNum in range(pdfReader.numPages):
pdfWriter = PdfFileWriter()
page = pdfReader.getPage(pageNum)
pdfWriter.addPage(page)
pdfWriter.write(open(f"./분할한1 PDF 파일{pageNum+1}.pdf","wb"))
먼저 병합 방법과 마찬가지로 pdf파일을 다루기 위하여 PyPDF를 설치해줘요
from PyPDF2 import PdfFileReader, PdfFileWriter
pdfReader = PdfFileReader("분할목적파일.pdf","rb")
for pageNum in range(pdfReader.numPages):
pdfWriter = PdfFileWriter()
page = pdfReader.getPage(pageNum)
pdfWriter.addPage(page)
pdfWriter.write(open(f"./분할한1 PDF 파일{pageNum+1}.pdf","wb"))
여기서 문제, 내가 가지고 있는 파일 이름은 포트폴리오고, 포트폴리오를 1페이지부터 20페이지 까지 다 분리하고 싶은데 어떻게 해야할까? 라고 한다면
위 코드에서 한글만 바꿔주면돼요
예를들어서 위의 코드의 경우 파일명을 분할목적파일이라고 적었는데
파일명이 포트폴리오잖아요? 그러니까 한글을 분할목적파일 대신 포트폴리오라고 적으면 돼요
같이 보시면 좋은 글
2023.04.10 - [정리중] - Python을 활용한 PDF 합치기
Python을 활용한 PDF 합치기
파이썬을 통한 pdf 파일 합치는 방법 글의 순서 1. 왜 PyPDF인가 2. pdf 병합 - Colab에서(노가다 코드) 3. pdf 병합 - Colab에서(노가다 코드 개선) 4. 병합시 문제점 보완 1. 왜 Pypdf인가? 제가 일을 할 때 가
madanhambo.tistory.com
2023.05.21 - [IT/Python] - 파이썬으로 Pdf 텍스트 추출 법
'IT > Python' 카테고리의 다른 글
파이썬으로 Pdf 텍스트 추출 법 (0) | 2023.05.21 |
---|---|
Python을 활용한 PDF 합치기 (0) | 2023.04.10 |
댓글