본문 바로가기

유틸리티-사이트

html을 pdf로 변환해주는 오픈소스 SW - WK HTML To PDF

반응형

wkhtmltopdf

는 웹킷 렌더링 엔진을 사용하여 PDF 및 다양한 이미지 형식으로 HTML을 렌더링하는 오픈 소스 (LGPLv3) 명령 줄 도구입니다.

 

html을 pdf로 변환해주는 오픈소스.

아래의 홈페이지에 가셔서 본인의 OS에 맞는 빌드를 다운하세요.

 

https://wkhtmltopdf.org/downloads.html

 

 

 

< 사용 방법 >

wkhtmltopdf http://google.com google.pdf

 

 

다운로드해야 하는 대상이 여러 개일 경우 자동화 스크립트를 작성하여

편리하게 다운받는다.

 

만약 어떤 블로그의 포스팅 자료들을 PDF로 보관하고 싶다면

각 포스팅에 해당하는 URL을 자동으로 입력하게 만들면 된다.

통상적으로 게시물은 만든 순서대로 번호가 붙게된다.

 

 

 

< 자동화 스크립트 > 

 

Script.rc - 우분투 14.04

 

위 소스는 http://localhost/board.php로부터 게시물번호가 1~250 사이인 자료를

PDF로 긁어오는 스크립트다.

 

명령에 따라서 output1부터 output250까지 PDF로 만들어진다.

 

단! 누락된 게시물(삭제되어 존재하지 않는 포스팅)이 있을 수 있으므로 

파일사이즈를 비교하여 삭제시켰다.

 

굳이 없는 게시물에 대한 내용을 pdf로 남길 필요는 없기 때문이다.

 

삭제하는 방법은 해당 웹서버에서 게시물이 존재하지 않을 때의 사이즈를 정확히 구하여

비교하면 된다. 

 

그리고 만약 PDF로 만들고난 뒤 한글이 깨져서 나오는 경우

폰트를 따로 설치해줘야 한다.

 

반응형