후배의 블로그에서 보낸 트랙백이 본인의 사이트에서 외계어로 번역된 케이스가 있다.

제목부분만 살포시 때다가 보자.

나의 개발환경

저 코드를 그대로 브라우저보고 번역해봐! 하면

나의 개발환경

으로 나온다. 대체 뭐가 문제일까.

그 후배녀석이 사용하는 블로그시스템은 ExpressionEngine. 내부적으로 UTF-8을 지원한다라고 되어있는것 같지만 한글을 입력하고 내부적 처리를 보면 전혀 아니다. 한글을 전부 저런식으로 바꾸어 버린다. 그리고 트랙백을 보낼때도 저런식으로 보내는 것이다.

EE에서 보낸 트랙백은 WordPress나 기타 많은 블로그 시스템에서는 잘 보일수도 있다. 왜냐면 액면 그대로 출력을 하고 브라우저가 번역을 하기 때문이다. 반대로 태터는 트랙백 데이터를 원본 그대로 표시하고자 HTML Escaping을 해 주기 때문에 외계어로 보이는 것이다.

누가 틀린것인가?

Trackback에 대한 스펙에서 텍스트의 Representation에 대한 정의는 되어 있지 않다. 뭐 맞고 틀리고 할 기준 자체가 없기는 하다. 허나 스펙에서 charset을 명시하도록 되어 있고 따라서 utf-8로 보낼때 한국어를 저런 외계어로 번역할 필요가 없는 것은 자명하다. 보낼때 번역할 필요가 없다는 것은 받을때도 마찬가지이다. 그대로를 표시해 주면 되는 것이다.

태터도 WP처럼 저런 인코딩을 지원해 주면 되지 않냐에 대해선 저렇게 했다간 반대로 현재 이글을 트랙백 보냈다간 중간의 "나" 라는 부분에서 문제가 생긴다. 따라서 어설프게 다른 블로그 시스템의 문제점을 케어해 주긴 어려울 것으로 보인다.

결론.
무늬만 UTF-8 지원하는 놈들 쓰면서 한글 사용은 자제하길. 한글을 포기하거나 시스템을 바꿔야 한다.

PS.
한국어(혹은 non-english)를 사용한다라는 점이 Unicode 프로그래밍을 하는 상황에선 장점으로 작용되기도 한다. 많은 외국에서 제작된 프로그램들이 Unicode 환경에서 정상 동작을 하지 않기도 한다(Google Earth 대표적).
우리의 것(프로그램)이 좋은 이유가 이런 것인지도.
뭐 태터도 아랍권 가면(글의 방향이 우->좌) 머리아픈 상황이 되겠지만 :)

PS2.
일부사이트는 UTF-8 트랙백을 못받는 놈들도 있다. 포탈 블로그중에도 상당수 있다. 그래서 태터 내부엔 몇몇 사이트를 센싱해서 euc-kr로 기꺼이 지원해 주는 케이스도 있는 것이다.

신고


티스토리 툴바