드디어 바뀐 다음 카페의 한글 인코딩 방식 (EUC-KR → UTF-8)
다음 카페의 한글 인코딩 방식이 EUC-KR에서 '유니코드(UTF-8)'로 바뀌었다. 며칠 앞서 카페 점검한때를 알리는 안내문을 보았던 것 같은데, 그 때부터 바뀌었는지는 모르겠다.주1
처음의 EUC-KR은 KS 완성형 부호계에 들어간 한글 2350자만 나타낼 수 있었지만, CP949(확장 완성형)으로 EUC-KR을 확장 처리하여 KS 완성형에 없던 '똠'이나 '펲' 같은 글짜들을 나타내어 왔다. 그런데 CP949은 표준이 아니고 마이크로소프트라는 기업이 만들어 업계 표준처럼 퍼진 것이어서 파이어폭스를 비롯한 프로그램들에서 KS 완성형 부호계를 벗어난 한글 처리를 제대로 하지 못하는 문제가 생기기도 했다.
EUC-KR을 쓰던 다음 카페에서도 'ᄒᆞᆫ'과 같은 EUC-KR로 나타내지 못하는 옛한글을 'ᄒᆞᆫ'처럼 HTML 문자 참조꼴로 붙여 넣는 방법으로 유니코드 첫가끝(3벌식) 부호계로 넣을 수는 있었다.주2 하지만 이제는 다음 카페에서 유니코드를 쓰므로, 그런 번거로운 절차를 거치지 않고 글쇠를 눌러 바로 옛한글을 넣을 수 있다. 시험해 보니 본문과 덧글 모두 옛한글이 잘 들어갔다.
다만 옛한글은 잘 들어갔더라도 글꼴이 뒷받쳐 주어야 제 모습대로 볼 수 있다. 글꼴이 맞지 않으면 글이 보이지 않거나 낱자가 풀어진 채로 보일 수 있다. 다음 카페는 본문과 덧글에 굴림체를 쓰고 있는데, 굴림체는 옛한글을 제대로 나타내지 못하고 낱자가 풀어진 채로 보여 준다. 옛한글까지 제대로 보려면 은 글꼴이나 윈도우 8 이상에 들어가는 맑은고딕처럼 옛한글을 지원하는 글꼴을 써야 한다. 하지만 다음 카페는 글을 올리는 사람이 본문 글꼴을 바꿀 수 있어도 덧글의 글꼴은 마음대로 바꿀 수 없다. 그래서 굴림체가 깔린 곳에서는 덧글에 들어간 옛한글이 낱자가 풀어진 채로 보일 수밖에 없다.
그래도 예전에는 ??로 나오던 한글이 낱자가 풀어진 채로라도 나오는 것은 반가운 일이다. '세벌식 사랑 모임'처럼 '세벌식'이나 '한글'을 주제로 하는 카페들에서도 '세벌식 자판'과 '세벌식 부호계'(첫가끝 부호계)를 제대로 쓰지 못하는 일이 내내 아쉬웠는데, 다음 카페의 한글 인코딩 방식이 유니코드로 바뀐 덕분에 이 아쉬움이 풀렸다.
덧글을 달아 주세요