본문 바로가기

개발이야기

[HWP] HWP to HTML

hwp를 웹브라우져에 바로 보여주기를 원하는 요구들이 있다.

물론 웨일에서 자동으로 클릭하면 다운받아서 웹브라우져에서 보여주긴 하지만, 

현재 운영중인 사이트는 hwp를 파일을 사람들이 열어서 필요한 정보를 database화 해서 보고 있다보니, 

아예 hwp의 내용을 다운받는 이런 일 없이 바로 보여주기를 원한다.

직접 만들어볼려니 시간이 걸릴거 같고(한글과 컴퓨터에 문서 내용을 보고 만들면 될거라고 되어 있는데, 문서대충 보다가 ㅠㅠ), 의뢰를 해도 돈이 문제구..쩝..

그래서 우선 생각한 것은 hwp파일을 html로 변환해서 해당 파일을 웹브라우져에서 보여주도록 처리 한다는 방안

관련 오픈 소스들이 있다.

1. https://pythonhosted.org/pyhwp/ko/converters.html#module-hwp5.hwp5odt

 

변환기들 (실험적) — pyhwp 0.1b8 documentation

변환기들 (실험적) HWPv5 문서를 다른 문서 형식으로 변환한다. 필요한 것 이 변환들은 내부적으로 XSLT 를 사용하며, 가능한 경우 Relax NG 로 결과물이 검증된다. 이를 수행하려면 lxml (homepage)이나 li

pythonhosted.org

 

2. https://github.com/hwp2html/hwp2html : 여기는 아직 지원을 하지 않는다.

 

GitHub - hwp2html/hwp2html: hwp lib 오픈 라이브러리를 이용해서

hwp lib 오픈 라이브러리를 이용해서 . Contribute to hwp2html/hwp2html development by creating an account on GitHub.

github.com

실시간으로 파싱해서 바로 보여주려고 하다보니 pyhwp를 만들려면 부가적으로 고민해야 할것들이 많이 생겨서

javascript로 된 모듈을 알아보니 아래와 같은 것이 있다.

1. https://github.com/hahnlee/hwp.js

 

GitHub - hahnlee/hwp.js: Open source hwp viewer and parser library powered by web technology

Open source hwp viewer and parser library powered by web technology - GitHub - hahnlee/hwp.js: Open source hwp viewer and parser library powered by web technology

github.com

2. https://hanlee.io/hwp.js

 

hwp.js

Open source hwp viewer and parser library powered by web technology

hanlee.io

현재는 위의 요구들이 당장은 쉽지 않기 때문에 수면아래로 가라앉아 있지만,

중간중간 알아봐야 할듯 하다. 

그리고 현재 hwpx 도 나오면서 이부분을 위의 오픈소스에서도 지원하지 않아서 이부분도 추가로 알아봐야할듯 하다.