iconv 캐릭터셋 변경할때 오류가 발생하는 경우(euc-kr to utf-8)
리눅스에서 대표적으로 사용하는 캐릭터셋 변환기 입니다.
● 오류가 발생하는 경우
[root@pabburi /www/] iconv --from-code=euc-kr --to-code=utf-8 --output=output.sql_utf8 input.sql
iconv: illegal input sequence at position 123
위와 같이 오류가 발생할때는 건너뛰는 무시하는 옵션을 주면 됩니다.
중요한 데이터이면 해당 위치를 윈도우로 받아서 열어 보시면 될것 같습니다.
이 문제는 리눅스에서 euc-kr만 처리가 가능한데 cp949 이거나 할 때 발생 하는 것으로 추측이 됩니다.
일반적으로 입력은 윈도우환경에서 하기 때문에 euc-kr 보다 더 많이 표현하는 cp949를 사용하면서 발생 되는 문제 일것입니다.
실제 이보다 더 많은 이유는 자릿수 문제 끝 부분이 한글이 잘려 들어간 것들이 있습니다.
● iconv 캐릭터셋 변경할때 오류 발생시(euc-kr to utf-8)
-c 옵션을 주면 중간에 맞지 않는 캐릭터셋의 문제는 무시하고 처리 합니다.
iconv -c --from-code=euc-kr --to-code=utf-8 --output=output.sql_utf8 input.sql