질문.. 아래아한글 문서변환도구를 사용해서..

classic Classic list List threaded Threaded
9 messages Options
고재학 고재학
Reply | Threaded
Open this post in threaded view
|

질문.. 아래아한글 문서변환도구를 사용해서..

This post has NOT been accepted by the mailing list yet.
http://www.microsoft.com/ko-kr/download/details.aspx?id=36772

위 주소에서 제공하는 아래아한글 문서변환도구를 사용해서

HWP 를 DOCX 문서로 변환하면..

DOCX로 변환된 문서가 읽혀지지 않습니다..

아직 업데이트 전이라 그런거겠죠?
jihui.choi jihui.choi
Reply | Threaded
Open this post in threaded view
|

Re: 질문.. 아래아한글 문서변환도구를 사용해서..

안녕하세요.
아주 훌륭한 툴이 나왔군요. (소개해 주셔서 감사합니다. ㅎㅎ)

여튼 알려주신 사이트에서 HwpConverter_x64_ko-kr.exe 를 내려받아,
아래아한글 2007 로 작성된 문서를 MS OFFICE 2010 docx 로 변환한뒤,
리브레오피스 4.3.2.2 버전으로 읽으니 정상적으로 읽기가 되었습니다.

제가 테스트에 사용한 문서를 첨부하겠습니다.

수학의_이해.hwp
수학의_이해.docx
고재학 고재학
Reply | Threaded
Open this post in threaded view
|

Re: 질문.. 아래아한글 문서변환도구를 사용해서..

혹시 워드 2010에서 바로 변환해서 여셨나요?
그리고 나서 저장하면 리브레에서도 열리는데요.
\program files\microsoft office\15.0\
에 컨버터 파일이 있는데요.. 단독으로 실행이 됩니다..
근데 문제는 컨버터로 직접 변환한 경우에는 열리지 않더라고요..
파일이 손상됐다고 하면서요..
이전에는 은행에서 내려받은 엑셀파일도 그런 현상으로 안열리다
리브레가 업데이트 되면서 열리던데..
물론 변환된 파일을 워드에서 열고 나서 다시 저장을 하면
리브레 Writer에서도 열립니다..
근데 워드가 깔리지 않은 컴에서 열려고 하니.. 안되네요..
아마 워드 2013 포멧에 맞춰 변환된거 같던데..
리브레가 업데이트 될때까지 기다려야겠죠?
다음 업데이트 될때 이 부분도 추가 되면 좋겠는데..
jihui.choi jihui.choi
Reply | Threaded
Open this post in threaded view
|

Re: 질문.. 아래아한글 문서변환도구를 사용해서..

제가 어제 정신없는 상황에서 답변을 단지라 정확한 상황을 여쭤보지도 않았네요.

여튼 말씀하신대로 BATCHHWPCONV.EXE 를 이용해서 직접 HWP -> DOCX 로 변환한 파일을
리브레오피스에서 읽도록 하니 파일이 손상되었다며 안 읽히네요.

(MS Office 에서 플러그인을 이용해 직접 HWP 파일을 연뒤 DOCX 로 저장한 뒤, 리브레오피스로 열면 열리고요)


제 생각에는 MS 에서 만든 HWP 변환 플러그인 자체 문제로 보입니다.
변환 프로그램을 단독으로 실행하여 DOCX 파일(1)을 생성한 뒤, 워드를 통해 생성한 파일(2)과 비교해보니 xml 부분이 다른 점을 확인할 수 있었습니다.

그리고 (2)의 기본 스키마 xml 파일을 (1)로 복사하니 리브레오피스에서도 정상적으로 열렸습니다.
(사실 일부는 조금 깨지네요.)


처음에는 이게 플러그인으로만 동작하나.. 싶었는데, 사용 설명을 보니 단독으로도 동작하도록 만들었네요.
( 아래아한글 파일을 DOCX파일로 변환하려면, BATCHHWPCONV.exe파일을 실행하고 파일 옵션을 선택하고 원본 파일과 대상 파일을 선택한 다음 변환 버튼을 누릅니다.
한 폴더에 있는 아래아한글 파일을 모두 DOCX파일로 변환하려면, BATCHHWPCONV.exe파일을 실행하고 폴더 옵션을 선택하고 원본 폴더와 대상 폴더를 선택한 다음 변환 버튼을 누릅니다.
http://www.microsoft.com/ko-kr/download/details.aspx?id=36772 )

그런데 실제로 단독으로 실행하면 플러그인으로만 동작할 때와 다소 다르게 동작하지 않나 싶습니다.

예를 들어 [Content_Types].xml 의 경우
Default 태그나 Override 태그의 표준 형식은 <Default .....  /> 이고, 실제 MS 워드에서 hwp 를 읽어서 저장하면 같은 방식으로 저장됩니다. 그런데 변환 프로그램을 단독 실행하면 <Default ....> </Default> 라는 형식으로 저장됩니다. 이 부분에서 리브레오피스가 에러를 뿜는 것 같네요. 요걸 <Default ... /> 로 바꿔주면 정상적으로 읽는 걸 보면..


저도 이쪽 분야에 대해서는 잘 몰라서 좀더 알아보도록 하겠습니다.
참고로 제가 변환 프로그램으로 변환한 뒤, xml 태그를 변경해서 리브레오피스로 읽을 수 있게된 파일을 첨부합니다.

수학의_이해_20141120.docx


참고 : Walkthrough: Word 2007 XML Format
(2013용 xml format 에 대한 내용이 없는 것으로 보아 변경된 사항이 없지 않나 싶습니다.)
고재학 고재학
Reply | Threaded
Open this post in threaded view
|

Re: 질문.. 아래아한글 문서변환도구를 사용해서..

This post has NOT been accepted by the mailing list yet.
그렇네요.. 말씀하신 대로.. 바꿔보니깐.. 안열리던 문서가 열립니다..
대신 말씀대로 좀 깨지네요. ㅎ
결국 MS가 표준을 지키지 않아서 생기는 문제였군요..
예전에 은행권에서 내려받는 엑셀파일도 같은 증상이었는데..
그것도 이번 건과 같은 맥락이겠네요...
그후 리브레가 업데이트 되면서 그 엑셀문제는 사라졌는데..
MS가 컨버터를 바꿀리는 없겠고..
이번에도 한번 기대하고 기다려봐야 겠네요..^^
고재학 고재학
Reply | Threaded
Open this post in threaded view
|

Re: 질문.. 아래아한글 문서변환도구를 사용해서..

This post has NOT been accepted by the mailing list yet.
In reply to this post by jihui.choi
방법이 없을까요?
은행권에서 내려받는 엑셀 파일이 안열렸다..
리브레오피스 업데이트 이후에 열린다고 말씀드렸었는데..
어제 다시 확인해보니..
열리는 파일의 확장자는 XLS 더군요..
여전히 XLSX는 오류를.. ㅜㅜ
MS에서 제공되는 컨버터에서 HWP를 DOCX를 변환했을 때와 같은 현상이더군요..
고질적으로 표준화되지 않은 것으로 인해 오류가 나는 듯 싶은데..
그럼에도 불구하고 간단하게 열수 있는 방법이 없을 까요?
jihui.choi jihui.choi
Reply | Threaded
Open this post in threaded view
|

Re: 질문.. 아래아한글 문서변환도구를 사용해서..

에고 까먹고 있다 이제서야 글을 다네요.

은행권에서 제공하는 엑셀 파일들은 대부분 엑셀로 위장한 HTML 파일들입니다.

텍스트 에디터로 열어보면 HTML 코드들이 잔뜩 들어있는 경우가 대부분이지요.

그런데 은행권에서 제공하는 엑셀 파일 중 xlsx도 있나봅니다?

혹시 샘플을 전달해주실 수 있는지 궁금합니다.
고재학 고재학
Reply | Threaded
Open this post in threaded view
|

Re: 질문.. 아래아한글 문서변환도구를 사용해서..

This post has NOT been accepted by the mailing list yet.
네..은행권에서도 XLSX로 내려받는게 있더라고요..
지금 기억으로는 신한은행으로 알고 있는데..
제꺼가 아니라서.. ㅜㅜ
아는 사람들한테 리브레 전파하면서 가장 많이 걸리는 문제더라고요..
jihui.choi jihui.choi
Reply | Threaded
Open this post in threaded view
|

Re: 질문.. 아래아한글 문서변환도구를 사용해서..

사실 은행권에서 만든 가짜 엑셀 파일 문제는 오픈오피스 시절부터 꾸준히 문제가 되었던 것이었습니다.

솔직히 저는 리브레오피스가 버전업되면서 그게 정상적으로 열린다는 것 신기했습니다.. ^^;
(지금 확인해보니 잘 되네요.)

어떤 시스템들이 그렇게 가짜 파일을 만드는지 잘 모르겠습니다만,
안타깝게도 이건 해당 시스템(아마도 특정 라이브러리)이 수정되거나, 리브레오피스 측에서 해당 부분까지
커버하도록 업데이트해주기를 기다려야 할 것 같습니다.

관련 문제가 국내에만 있는 것인지, 아니면 특정 언어(예를 들어 자바 라이브러리라던가)에 관련된 부분인지
확인한 다음에, 리브레오피스 개발팀에게 전달을 해야겠습니다.(음.. 제가 하겠다라는 것은 아닙니다 ;;;)