이런저런 테스트를 해보고 싶어서 PDF 샘플 파일이 없는지 구글에 검색해 봤는데, 어째서 만만한 것이 안보이는지.

논문 PDF 샘플이라도 있으면 좋을 텐데 저작권이 있을 것 같은 자료밖에 안나와서... 결국 직접 만들게 되었습니다.

 

 

PDF 샘플 문서 - 이미지(OCR 없음).pdf
0.09MB

▲ 이것은 이미지를 PDF 파일로 저장한 것입니다. 구글 크롬 시크릿탭을 띄웠을 때 나오는 텍스트들을 캡쳐해서 PDF로 내보냈기 때문에, 사람 눈에는 글씨로 보이지만 OCR이 안입혀져 있어요. 그래서 텍스트를 마우스로 드래그할 수 없음.

 

▼ 텍스트를 JPG 그림파일로 저장한 것인데, 위의 PDF 샘플 문서와 동일한 내용입니다.

JPG 샘플 문서.jpg
0.08MB

 

이렇게 JPG나 PNG 파일을 PDF로 변환하는 도구들, 편리한 것들이 많이 나와 있는데... 힌트는 가까운 곳에!

 

 

PDF 샘플 문서 - 텍스트(OCR 있음).pdf
0.02MB

▲ 이것은 워드프로세서에서 텍스트를 타이핑한 다음 PDF로 저장한 것입니다. OCR이 입혀져 있기 때문에, 마우스로 긁었을 때 선택이 됩니다.

 

위의 파일들을 가지고 PDF Editor 프로그램으로 불러들여서 이런 저런 테스트를 해보면 되겠습니다.

반응형