깨진 한글 문자 체크 하는 방법
정확한 방법은 아닐 수 있으니 보통 정확했습니다.
방법은 다른 인코딩으로 변경했다가 현재 사용하는 인코딩으로 다시 변경하여 비교 하는 방식 입니다.
$kw = trim($kw);
$kw_euckr = mb_convert_encoding($kw, 'euc-kr', 'utf-8');
$kw_utf8 = mb_convert_encoding($kw_euckr, 'utf-8', 'euc-kr');
if ( $kw != $kw_utf8 ) {
// echo $kw . "\n";
continue;
}
위와 같이 현재 utf8을 사용하고 있으면서 euc-kr로 변경 한다음 다시 utf-8로 변경 하는 방식으로 체크 합니다.
단 여기서의 문제는 한글을 표현하는 글자가 utf-8이 더 많기 때문에 euc-kr에서 표현하지 못하는 정상적인 것이 있을 경울 잘못 체크 될 수 있습니다. 하지만 euc-kr이 현재 사용하고 있는 것이라면 이 방식으로 체크 할때 문제 될것은 없겠습니다.