페이지수준 광고

2016년 6월 8일 수요일

pdf 텍스트 추출 간단하게 하자

많이 통용되고 공유되는것이 바로 pdf입니다. 왠만하면 무료로 된 리더기만 설치하게 되면 pdf내용 볼수있으니 말이죠.




pdf안에 내용을 가지고 오고싶은데 어떻게 추출하는지 그 방법을 3가지 케이스로 설명해볼까 해요. 편한 방법으로 선택해서 사용해보시면 될 듯 합니다.

내용을 마우스로 긁어 메모장에 붙여넣어 pdf 텍스트 추출


pdf열면 내용에서 마우스로 쭉 글자를 긁어서 복사 한 다음


메모장에 열고 붙여넣습니다.




그러면 텍스트에 해당하는 부분은 모두 붙여넣기가 됩니다.
다만 모든 텍스트이므로 문서에 따라서 하단에 붙어있는 쪽수라던지 해당 문서 제목 같은것도 같이 복사가 될 수 있습니다.




구글 드라이브이용



구글 계정이 있는 분들은 구글 드라이브로 가서 해당 pdf문서를 업로드 합니다.
새로 만들기 > 파일업로드 해서 파일 올려줍니다.



해당 파일 목록 한번 마우스로 클릭해서 선택하시고, 우측 마우스 버튼 눌러 뜨는 메뉴창에서 "연결 앱" > "구글 문서" 선택해주세요.


그러면 해당 문서의 내용만 긁어와서 보여주게 됩니다. 이렇게 깔끔하게 문서자체에 텍스트 삽입이 되어 pdf 텍스트 추출이 완료 됩니다.



pdf 문서에서 텍스트 추출

pdf문서에서 메뉴에 "파일" > "다른형식으로 저장" > "텍스트" 선택하면

안에 내용이 깔끔하게 txt로 뽑혀집니다.


지금까지 알아본 pdf 텍스트 추출 세가지 방법 도움 받으셨기를 바라겠습니다.