Notice
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 파이썬 텍스트 변환 #파이썬 공부
- 논문번역 꿀팁
- 파이썬
- 파이썬#subprocess#communicate()
- 파이썬#파이썬경로#파이썬폴더#파이썬디렉토리
- 크롬오류#크롬검색어자동완성끄기#검색어자동완성오류#검색어자동완성 제거#검색어 노란선#검색어반복입력
- 통계 #ROC #TPR #FPR #TNR #이진분류 #Accuracy #Recall
- 파이썬 #
- 리눅스기초#리눅스명령어#리눅스 tail#tail#모의해킹 리눅스
- 리눅스#모의해킹#리눅스명령어#head 명령어
- 파이썬 예시
- 파이썬 음성인식
- 파파고 번역
- ROS #spin() #spinOnce() #ROS기초
- 파이썬 엑셀 파일 읽고 쓰기
- 파이썬 파일 전송
- 스트림 암호 one-time-pad 공격#보안#암호
- QGC#QGrouncControl#GLIB오류
- ROS #Robotics #ROS기초
- 파이썬 음성파일 텍스트 변환
- 파이선 행
- 파이썬 #파이썬프로젝트 #파이썬 예시 #파이썬 파일경로 #파이썬 자동화
- 파이썬 유튜브
- 파파고 꿀팁
- 파이썬 채팅
- pdf 번역
- PDF 개행문자
- 파이썬 프로젝트
- 패스트 캠퍼스 #자율주행 #비전
- 파이썬 열
Recent Comments
Archives
개발자비행일지
파이썬으로 pdf 파일 제목 추출하기 본문
아래의 소스코드는 현재 폴더에 있는 pdf파일에어 제목을 읽어서 파일명으로 바꿔주는 스크립트이다.
아직 title이 텍스트 마이닝 안되는 경우가 있어서 이 경우는 임의의 제목으로 작성되고 이건 수동으로 해주면 된다.
from pdfminer.pdfparser import PDFParser
from pdfminer.pdfdocument import PDFDocument
import os
from datetime import datetime
from random import *
path = os.getcwd()
for files in os.listdir(path):
# Rename only pdf files
if files.endswith(".pdf"):
fullName = os.path.join(path, files)
fp = open(files, 'rb')
parser = PDFParser(fp)
doc = PDFDocument(parser)
fp.close()
metadata = doc.info # The "Info" metadata
print("filename = %s" %files)
print(metadata)
basename = "study"+str(randint(1,100))
suffix = datetime.now().strftime("%y%m%d_%H%M%S")
non_title_filename = "_".join([basename,suffix])
metadata = metadata[0]
if "Title" in metadata:
if str(metadata['Title']) == "b''":
new_name = str(non_title_filename)+ ".pdf"
else:
new_name = str(metadata['Title']) + ".pdf"
os.rename(files, new_name)
print(new_name)
os.rename(files,'제목필요.pdf')
'▶ Python' 카테고리의 다른 글
파이썬 딕셔너리 (0) | 2020.07.10 |
---|---|
파이썬 os모듈 사용법 (0) | 2020.07.10 |
파이썬 연립방정식풀기 (0) | 2020.07.07 |
파이썬 부등식 (0) | 2020.07.07 |
파이참 단축키 (0) | 2020.07.07 |