pdf 텍스트 추출 간단하게 하자
많이 통용되고 공유되는것이 바로 pdf입니다. 왠만하면 무료로 된 리더기만 설치하게 되면 pdf내용 볼수있으니 말이죠.
pdf안에 내용을 가지고 오고싶은데 어떻게 추출하는지 그 방법을 3가지 케이스로 설명해볼까 해요. 편한 방법으로 선택해서 사용해보시면 될 듯 합니다.
pdf열면 내용에서 마우스로 쭉 글자를 긁어서 복사 한 다음
메모장에 열고 붙여넣습니다.
그러면 텍스트에 해당하는 부분은 모두 붙여넣기가 됩니다.
다만 모든 텍스트이므로 문서에 따라서 하단에 붙어있는 쪽수라던지 해당 문서 제목 같은것도 같이 복사가 될 수 있습니다.
구글 계정이 있는 분들은 구글 드라이브로 가서 해당 pdf문서를 업로드 합니다.
새로 만들기 > 파일업로드 해서 파일 올려줍니다.
그러면 해당 문서의 내용만 긁어와서 보여주게 됩니다. 이렇게 깔끔하게 문서자체에 텍스트 삽입이 되어 pdf 텍스트 추출이 완료 됩니다.
안에 내용이 깔끔하게 txt로 뽑혀집니다.
pdf안에 내용을 가지고 오고싶은데 어떻게 추출하는지 그 방법을 3가지 케이스로 설명해볼까 해요. 편한 방법으로 선택해서 사용해보시면 될 듯 합니다.
내용을 마우스로 긁어 메모장에 붙여넣어 pdf 텍스트 추출
pdf열면 내용에서 마우스로 쭉 글자를 긁어서 복사 한 다음
메모장에 열고 붙여넣습니다.
그러면 텍스트에 해당하는 부분은 모두 붙여넣기가 됩니다.
다만 모든 텍스트이므로 문서에 따라서 하단에 붙어있는 쪽수라던지 해당 문서 제목 같은것도 같이 복사가 될 수 있습니다.
구글 드라이브이용
구글 계정이 있는 분들은 구글 드라이브로 가서 해당 pdf문서를 업로드 합니다.
새로 만들기 > 파일업로드 해서 파일 올려줍니다.
해당 파일 목록 한번 마우스로 클릭해서 선택하시고, 우측 마우스 버튼 눌러 뜨는 메뉴창에서 "연결 앱" > "구글 문서" 선택해주세요.
그러면 해당 문서의 내용만 긁어와서 보여주게 됩니다. 이렇게 깔끔하게 문서자체에 텍스트 삽입이 되어 pdf 텍스트 추출이 완료 됩니다.
pdf 문서에서 텍스트 추출
pdf문서에서 메뉴에 "파일" > "다른형식으로 저장" > "텍스트" 선택하면안에 내용이 깔끔하게 txt로 뽑혀집니다.
지금까지 알아본 pdf 텍스트 추출 세가지 방법 도움 받으셨기를 바라겠습니다.