Notice
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- ROS #spin() #spinOnce() #ROS기초
- 리눅스기초#리눅스명령어#리눅스 tail#tail#모의해킹 리눅스
- 파파고 꿀팁
- 파이썬 채팅
- PDF 개행문자
- 논문번역 꿀팁
- 파이썬 #파이썬프로젝트 #파이썬 예시 #파이썬 파일경로 #파이썬 자동화
- 파이썬 음성파일 텍스트 변환
- 패스트 캠퍼스 #자율주행 #비전
- 통계 #ROC #TPR #FPR #TNR #이진분류 #Accuracy #Recall
- pdf 번역
- 파이썬
- 파이썬 예시
- 파이썬#파이썬경로#파이썬폴더#파이썬디렉토리
- QGC#QGrouncControl#GLIB오류
- 파이썬 유튜브
- 파이썬 음성인식
- 파이썬 열
- 파파고 번역
- ROS #Robotics #ROS기초
- 크롬오류#크롬검색어자동완성끄기#검색어자동완성오류#검색어자동완성 제거#검색어 노란선#검색어반복입력
- 파이썬 #
- 파이썬 엑셀 파일 읽고 쓰기
- 파이선 행
- 스트림 암호 one-time-pad 공격#보안#암호
- 리눅스#모의해킹#리눅스명령어#head 명령어
- 파이썬 텍스트 변환 #파이썬 공부
- 파이썬#subprocess#communicate()
- 파이썬 프로젝트
- 파이썬 파일 전송
Recent Comments
Archives
개발자비행일지
파이썬으로 pdf 파일 제목 추출하기 본문
아래의 소스코드는 현재 폴더에 있는 pdf파일에어 제목을 읽어서 파일명으로 바꿔주는 스크립트이다.
아직 title이 텍스트 마이닝 안되는 경우가 있어서 이 경우는 임의의 제목으로 작성되고 이건 수동으로 해주면 된다.
from pdfminer.pdfparser import PDFParser
from pdfminer.pdfdocument import PDFDocument
import os
from datetime import datetime
from random import *
path = os.getcwd()
for files in os.listdir(path):
# Rename only pdf files
if files.endswith(".pdf"):
fullName = os.path.join(path, files)
fp = open(files, 'rb')
parser = PDFParser(fp)
doc = PDFDocument(parser)
fp.close()
metadata = doc.info # The "Info" metadata
print("filename = %s" %files)
print(metadata)
basename = "study"+str(randint(1,100))
suffix = datetime.now().strftime("%y%m%d_%H%M%S")
non_title_filename = "_".join([basename,suffix])
metadata = metadata[0]
if "Title" in metadata:
if str(metadata['Title']) == "b''":
new_name = str(non_title_filename)+ ".pdf"
else:
new_name = str(metadata['Title']) + ".pdf"
os.rename(files, new_name)
print(new_name)
os.rename(files,'제목필요.pdf')
'▶ Python' 카테고리의 다른 글
파이썬 딕셔너리 (0) | 2020.07.10 |
---|---|
파이썬 os모듈 사용법 (0) | 2020.07.10 |
파이썬 연립방정식풀기 (0) | 2020.07.07 |
파이썬 부등식 (0) | 2020.07.07 |
파이참 단축키 (0) | 2020.07.07 |