文字化け (もじばけ) : 컴퓨터용어. 작성된 문자를 정상적으로 읽을 수 없는 현상. 우리말로 하면 글자깨짐. (다카포 3 (TVA) 1화)



문자가 깨지는 원인에 대해서는 파일 전송이 제대로 안 되어서 짤린 경우, 인코딩 방식이 지정되지 않은 경우 등이 있겠지만 주로 발견할 수 있는 현상은 인코딩 방식이 달라서 글자가 깨지는 경우입니다. 일본웹을 돌아다니거나 일본컴퓨터에서 압축된 파일을 열려고하면 글자가 깨지는 현상을 볼 수 있습니다. 


http://soundonline.info (위 사진은 연출된 장면입니다)


컴퓨터가 탄생한 영어권 문화에서는 이런 현상이 없습니다. 1바이트 문자를 사용하기 때문에 영어는 절대로 깨지는 일이 없죠. 하지만 아시아권 국가는 글자가 영어에 비해서 복잡하기 때문에 유니코드 문자, 즉 2바이트 문자를 사용합니다. 대표적으로 우리나라는 EUC_KR, 중국은 GBK,  일본은 SHIFT_JIS를 사용합니다.


그러다보니 문자 인코딩이 다르면 문자가 정상적으로 표기되지 않습니다. 윈도우 파일시스템의 경우 윈도우가 자체적으로 기록하는 방식이 있어 다른 언어의 윈도우와 호환되는 편이지만 웹페이지나 압축파일의 경우 그렇지 않습니다. 이 때 인코딩이 잘못된다면 위와 같이 알아볼 수 없는 글자가 보이게 되지요..


요즘에는 대부분의 언어를 포함할 수 있는 인코딩 방식인 UTF-8이 널리 보급되면서 이렇게 글자가 깨지는 현상이 줄었지만 예전프로그램들은 UTF 방식을 지원하지않아 링크가 깨지거나 파일을 불러들이지 못하는 현상을 가끔 볼 수 있습니다.