본문 바로가기

폰트

80, 90년대의 컴퓨터 속 한글 - 조합형, 완성형

요즘 컴퓨터에서 한글을 쓰는 것은 너무나 자연스럽습니다


단지 키보드의 /영키만 누르면 한글과 영문을 자유자재로 

페이지에 표시할 있는데, 이는 OS에서 한글을 지원하기 때문입니다


그러면 한글을 지원하지 않던 과거에는 어떻게 한글을 사용했을까요

대략 20여년 개인용 컴퓨터가 세상에 나오면서부터 

90년대 중반까지 한글을 표기하기 위한 많은 노력과 표준들이 만들어지고 사라져 갔습니다

 

오늘은 8, 90년대의 한글표기 방법에 대해 알아보도록 하겠습니다



컴퓨터가 처음 발명된 영어권 국가는 글자문제에 대해 상대적으로 자유로웠습니다

8비트로 표현할  있는 256가지 조합으로 모든 문자를 표현할  있었기 때문이죠

알파벳은 128비트로 모두 표현이 가능했기 때문에 

128비트로 알파벳과 같은 공통 문자를 처리하고, 

나머지 문자들은 나머지 128비트로 처리하는 ASCII방식을 사용하였습니다


문제는 한국이나 중국 혹은 한자문화권 국가들이었습니다

초중종성 체계를 사용하는 한글이나 한자를 사용하는  중국은 

1바이트로 문자를 표기하는 것이 불가능했습니다

퍼스널 컴퓨터가 출시되면서 한글을 표기하기 위해 n바이트 조합형을 사용하게 됩니다.


n바이트 조합형

paraMSX http://sharksym.egloos.com/ MSX에뮬레이터



8비트 컴퓨터가 출시되면서 한글의 자소단위로 표기하는 n바이트 조합형이 사용됩니다

자음과 모음단위로 1바이트씩 사용하는 방식은 

최소 2바이트에서 최대 5바이트의 데이터를 사용하는  

다른 조합형에 비해 길이가 길고 데이터의이가 가변적이기 때문에 

데이터의 처리가 어려운 단점이 있어 16비트 컴퓨터의 등장과 함께 사라집니다.

 


3바이트 조합형

2바이트 조합형이 나오기 전까지 아주 짧은 기간동안 사용되었습니다

각각의 데이터를 초성, 중성, 종성 단위로 분류하여 데이터를 조합하고, 

ㅃ같은 쌍자음과 ㅢ같은 겹모음을 모두 처리할 있었지만 

3바이트로 데이터가 커서 2바이트 조합형이 출시되자 빠르게 사라졌습니다.

 


2바이트 조합형

현재까지 남아있는 유일한 조합형 한글 표기방법은 상용조합형 입니다

기본적으로 2바이트(16비트)에서 최초 1비트를 제외한 15비트를 5비트씩 나눠서 

,,종성에 할당하는 방식은 같았으나 

상용조합형, 삼성조합형, 금성조합형등 여러가지의 조합형이 난립했고, 

각각 코드가 호환되지 않는 단점이 있어 

삼보컴퓨터에서 주도하는 상용조합형으로 모두 통합됩니다

2바이트 조합형이 현재까지 사용되고 있다고는 하나 

몇몇의 텍스트 편집 프로그램을 제외하고는 모두 완성형 한글을 사용합니다

조합형은 폰트의 크기가 완성형에 비해 사이즈가 작고 

제작해야 하는 폰트의 갯수가 적어 제작하기 용이한 장점이 있었으나 

윈도우95 확장완성형 한글을 채용하게 됨으로서 조합형은 사라져갑니다.

 


7비트 완성형

이른바 청계천 상가에서 개발되어 보급되었기 때문에 

청계천 한글로 불리며 영문에서 사용되지 않는 조합

(소문자 뒤에 대문자가 오거나 특수문자와 알파벳 조합) 한글을 끼워넣는 방식이었기 때문에 

표현할 있는 한글의 수가 1300여개로 제한적이었고(조합 가능한 한글의 10분의 1) 

특수한 조합을 사용하는 영문이 한글로 표시되는 단점이 있었지만

(BASE 아십니까? dBASE 표시오류니다.) 

데이터가 작아 한글카드가 저렴했고 구현이 쉽다는 이유로 널리 사용되었습니다

 


여기서 잠깐 한글카드란?

위에서도 언급했듯 DOS시절까지 OS 한글을 지원하지 않았고, 

XT시절 하드디스크가 없는 컴퓨터에서는 한글을 저장할 있는 공간이 없었기 때문에 

한글을 표시하기 위해서는 아래와 같은 한글카드를 컴퓨터에 장착해야만 했습니다

하지만 이런 한글 카드들은 후에 램상주 형태로 한글을 지원할 있게 되면서 빠르게 사라져 갑니다.

(구글에서 '한글카드' 검색해 보세요. 안나와요.)

출처 http://pc.dcinside.com/sub_main_pcadigitallife.php?contents_no=52&code1=5&code2=6&page=1&keyword=&select_keyword=


완성형

2바이트 완성형도 여러가지 표준이 존재했는데 아마도 가장 많이 들어본 것이 EUC-KR 입니다

현재는 대부분의 웹페이지들이 UTF-8으로 제작되지만, 

이전에는 대부분 한국어 페이지라고 하면 

웹페이지에 charset=euc-kr 이라는 헤더를 삽입했을 입니다.  

재미있는 것은 euc-kr 삽입한 홈페이지들 대부분이 euc-kr 아니고 

CP949라는 입니다

euc-kr ISO/IEC 2022와의 호환성을 유지하기 위하여 

상위 128비트에는 ASCII 흡사한 포맷인 KS X 1003 배치하고 

나머지 128비트 94 * 94 영역에 한글과 한자 그리고 특수문자를 배치한 형태의 포맷입니다.

 

뭔소린지 모르겠지요? ^^;;;

 


이것만 기억하시면 됩니다

8836 공간을 가지고 한글과 한자 특수문자를 표현한다는 이야기입니다

그러면 여기서 문제가 발생합니다

조합형으로 표현 가능한 한글은 1만개가 넘습니다

하지만 euc-kr 한글 낱자를 제외하고 2350자만 표현이 가능하지요

. 표현할 있는 글자가 빠지게 됩니다

자신의 핸드폰이 오래된 구닥다리 폰이라면 

SMS창을 열고 ''이나 '' 입력해 보시기 바랍니다또는 '' 있지요

가끔 문자로 '씨앙'이라고 보내는 친구가 있다면 

친구에게 완성형과 아래에서 설명할 CP949 대해 설명해 주시기 바랍니다

(물론 이로 인해 발생하는 문제는 블로그에서 책임지지 않습니다.)

 


확장 완성형

완성형에서 위와 같이 표기할 없는 문자가 발생하는 문제가 발생하자, 

MS CP949 새로운 포맷을 만들어 냅니다

euc-kr 호환성을 유지하면서 남는 공간에 빠진 문자 8821자를 채워넣어 

Windows 95 공식 한글 포맷으로 채택합니다

것이 조합형이 사장되는 결정적인 계기가 됩니다

확장 완성형은 euc-kr 그대로 유지하면서 남는 공간에 

모자란 글자를 채워넣는 형식이었기 때문에 

실제로 저장되는 데이터는 조합형과 달리 순서가 뒤죽박죽인 문제가 있습니다.

 

출처: 위키피디아 http://ko.wikipedia.org/wiki/코드_페이지_949


대충 살펴봐도 조합형이 훨씬 합리적으로 보입니다

그럼에도 불구하고 조합형이 사장된 이유는 한글의 원리를 이해하지 못하는 서구인들의 인식과 

국제규격화가 어려운 점, 그리고 MS종속적으로 컴퓨터 시장이 발전한 점이 복합적으로 작용했습니다. (믿거나 말거나 북한에서 조합형을 먼저 표준으로 채택하면서 조합형을 사장시켰다는 음모론도 있습니다.)

 


완성형은 이것으로 ! 같지만 유니코드가 남았습니다

전세계의 문자를 모두 포맷으로 통합하려는 

유니코드에 대해서는 다음 이시간에 찾아뵙도록 하겠습니다.


온한글 블로그 기자단 2기 강인규

 

ⓒ 온한글