유용한 정보

pdf 텍스트 추출 쉽게하는 방법

★§§§§§§★ 2019. 1. 24. 11:56

pdf 문서에서 텍스트만 추출해서 사용할 수 있는 방법을 알려드리도록 하겠습니다. 컴퓨터에서 작성할 수 있는 문서는 다양합니다. 어떤 프로그램을 사용했느냐에 따라서 확장자가 달라지는데요. 워드, ppt, 엑셀 등 많습니다. 따라서 서로 호환이 되지 않는 문제가 발생하는데요. 이를 해결하기 위해서 PDF 문서로 변환해서 사용하는 경우가 많습니다.

한가지 문제가 있다면 피디에프 문서에 있는 내용을 참고해서 작업해야 할 경우입니다. PDF 문서는 수정이 불가능하기 때문에 텍스트를 복사해서 붙여넣기가 되지 않습니다. 이럴 때는 다른 형식의 파일로 변환해도 되지만 텍스트만 추출해서 사용하는 것도 좋습니다.

현재 다양한 프로그램에서 PDF 속 글자를 추출하는 기능을 제공하고 있습니다. 오늘 소개해드리는 것을 사용하면 누구나 무료로 쉽게 할 수 있습니다. 어떻게 사용하는지 아래에서 자세히 설명해 드리도록 할게요.

pdf 텍스트 추출

pdf 텍스트 추출 방법

먼저, 오늘 사용할 프로그램을 알려드리겠습니다. 어도비 PDF 뷰어인 어도비 아크로뱃 리더 DC(Adobe Acrobat Reader DC)입니다. 어도비 회사에서 무료로 제공하고 있기 때문에 인터넷에서 받아서 설치하시면 됩니다.

▼ 설치가 끝났다면 실행하시기 바랍니다. 텍스트를 추출하고 싶은 문서를 열어 주세요. 다음으로 왼쪽 상단에 있는 [파일] 버튼을 누르세요. 메뉴 목록이 나타납니다. 다른 형식으로 저장 부분에 마우스를 올려 보세요. 오른쪽으로 확장 메뉴가 나옵니다. [텍스트(x)]를 선택하세요.

어도비 아크로뱃 리더 DC

다른 이름으로 저장 창이 나타납니다. 이제 텍스트 파일이 저장될 폴더를 선택하시면 됩니다. 이후에 오른쪽 아래에 있는 저장 버튼을 누르시기 바랍니다.

pdf 텍스트 변환 결과

▲ 자동으로 PDF 속에 있는 글자가 윈도우의 텍스트 문서로 변환됩니다. 어떻게 변했는지 살펴보도록 하겠습니다. 저장된 txt 문서를 열어 주세요. PDF 문서에 있었던 내용이 그대로 추출 된 것을 확인할 수 있습니다. 여러분이 사용하고 싶은 곳에 가져다가 쓰시면 됩니다. 정말 쉽죠? 여러분도 직접 해보시기 바랍니다.