두벌 자판의 설계 원리와 한계 - ③ 낱소리 분석
4. 국회 회의록 통계 분석
이 장에서는 국회에서 공개한 2011. 9.1~2011.10.14의 국회 회의록의 한글 및 부호·숫자 등의 잦기를 분석한다. 이 자료를 근거로 삼아 뒤에서 새 2벌 자판을 설계하고 여러 2벌 자판들을 견주려고 한다. 엄밀히 비교하려면 더 많은 글을 다양하게 비교해야겠지만, 회의록으로서 오늘날 쓰이는 대화문의 낱소리 잦기를 모자라게나마 파악하는 데에 뜻을 두고자 한다. 대화와 연설을 담은 국회 회의록은 글말을 담은 자료와 한글 낱소리 잦기가 다를 수 있다. PDF 파일을 텍스트 파일로 바꾸면서 쪽의 머리글, 꼬리글 내용이 잘못 섞여 들어간 부분도 조금 있다.
통계 분석에는 조합형 한글 코드를 다루는 김용묵님의 간단한 한글 타자 행동 분석기를 바탕으로 글쓴이가 기능을 고치고 더한 도구를 썼다. 로마자는 셈하지 않았고, 자판들에서 바로 넣을 수 없는 특수기호는 셈하지 않거나 다른 기호로 바꾸었다. 가운뎃점은 공병우 최종 자판에만 들어가 있으므로 문맥에 따라 붙임표(-)나 쉼표로 바꾸었고, 거꾸로 공병우 최종 자판에는 없는 '&'는 셈하지 않았다. 거듭 들어간 빈 칸과 빈 줄은 하나로 셈하였다.
한글 낱소리 | 부호 | 숫자 | 기타 | ||||
---|---|---|---|---|---|---|---|
첫소리 | 169'8148 | 쉼표(,) | 1'8661 | 0 | 7251 | 빈 칸 | 50'3399 |
가운뎃소리 | 169'8148 | 마침표(.) | 4'0550 | 1 | 5601 | 줄바꿈 | 4'8060 |
끝소리 | 76'5756 | 쌍점 (:) | 2 | 2 | 4161 | ||
큰 따옴표(") | 1048 | 3 | 2442 | ||||
작은 따옴표(') | 2634 | 4 | 1731 | ||||
물음표(?) | 7915 | 5 | 1996 | ||||
느낌표(!) | 371 | 6 | 1232 | ||||
빗금 (/) | 13 | 7 | 1263 | ||||
붙임표, 뻐기(-) | 1144 | 8 | 1174 | ||||
물결표(~) | 103 | 9 | 1399 | ||||
더하기(+) | 13 | ||||||
여는 손톱묶음 ( | 1724 | ||||||
닫는 손톱묶음 ) | 1724 | ||||||
% | 1006 | ||||||
합 | 416'2052 | 합 | 7'6908 | 합 | 2'8250 | 합 | 55'1459 |
(1) 낱소리 잦기
먼저 회의록의 낱소리 잦기와 2벌 자판으로 넣을 때의 타수를 셈한다. 뒤에서 만들 2벌 자판은 'ㅆ' 글쇠를 따로 넣으려 하므로 'ㅆ'의 타수를 따로 셈하였다.
잦기 | 타수 | 타수 비율 | 타수 순위 |
||||||
---|---|---|---|---|---|---|---|---|---|
첫소리 | 끝소리 | 첫소리 | 끝소리 | 닿소리 | 첫소리 | 끝소리 | 닿소리 | ||
ㄱ | 25'4946 | 7'5317 | 26'9406 | 7'6223 | 34'5629 | 6.31% | 1.79% | 8.10% | 3 |
ㄲ | 1'4460 | 577 | |||||||
ㄴ | 11'0377 | 25'5964 | 11'0377 | 26'1821 | 37'2198 | 2.59% | 6.14% | 8.72% | 2 |
ㄷ | 13'8383 | 2333 | 15'1672 | 2333 | 15'4005 | 3.55% | 0.05% | 3.61% | 7 |
ㄸ | 1'3289 | ||||||||
ㄹ | 10'6046 | 11'4538 | 10'6046 | 11'5367 | 22'1413 | 2.49% | 2.70% | 5.19% | 4 |
ㅁ | 6'8190 | 4'8362 | 6'8190 | 4'8521 | 11'6711 | 1.60% | 1.14% | 2.73% | 10 |
ㅂ | 8'1771 | 5'3736 | 8'2653 | 5'7530 | 14'0183 | 1.94% | 1.35% | 3.28% | 9 |
ㅃ | 882 | ||||||||
ㅅ | 15'2965 | 1'8631 | 15'2965 | 2'2255 | 17'5220 | 3.58% | 0.52% | 4.11% | 5 |
ㅆ | 5519 | 3'7704 | 5519 | 3'7704 | 4'3223 | 0.13% | 0.88% | 1.01% | 11 |
ㅇ | 38'0308 | 13'1448 | 38'0308 | 13'1448 | 51'1756 | 8.91% | 3.08% | 11.99% | 1 |
ㅈ | 16'5546 | 1997 | 16'7294 | 2075 | 16'9369 | 3.92% | 0.05% | 3.97% | 6 |
ㅉ | 1748 | ||||||||
ㅊ | 3'6692 | 921 | 3'6692 | 921 | 3'7613 | 0.86% | 0.02% | 0.88% | 12 |
ㅋ | 3499 | 1 | 3499 | 1 | 3500 | 0.08% | 0.00% | 0.08% | 15 |
ㅌ | 1'5435 | 2917 | 1'5435 | 2921 | 1'8356 | 0.36% | 0.07% | 0.43% | 13 |
ㅍ | 1'1717 | 1905 | 1'1717 | 1905 | 1'3622 | 0.27% | 0.04% | 0.32% | 14 |
ㅎ | 13'6375 | 9095 | 136375 | 1'5041 | 15'1416 | 3.20% | 0.35% | 3.55% | 8 |
ㄳ | 15 | ||||||||
ㄵ | 78 | ||||||||
ㄶ | 5779 | ||||||||
ㄺ | 314 | ||||||||
ㄻ | 159 | ||||||||
ㄼ | 185 | ||||||||
ㄽ | 0 | ||||||||
ㄾ | 4 | ||||||||
ㄿ | 0 | ||||||||
ㅀ | 167 | ||||||||
ㅄ | 3609 | ||||||||
합계 | 169'8148 | 76'5756 | 169'8148 | 77'6066 | 247'4214 | 39.79% | 18.19% | 57.98% |
..
잦기 | 타수 | 타수 비율 |
타수 순위 |
겹홀소리 타수 |
|
---|---|---|---|---|---|
ㅏ | 33'0976 | 36'6217 | 8.58% | 1 | (3'5241) |
ㅐ | 8'2400 | 8'4771 | 1.99% | 7 | (2371) |
ㅑ | 1'1816 | 1'1816 | 0.28% | 11 | |
ㅒ | 1237 | 1237 | 0.03% | 14 | |
ㅓ | 18'6486 | 21'5773 | 5.06% | 5 | (2'9287) |
ㅔ | 8'4483 | 8'4598 | 1.98% | 8 | (115) |
ㅕ | 7'1190 | 7'1190 | 1.67% | 9 | |
ㅖ | 1'1390 | 1'1390 | 0.27% | 12 | |
ㅗ | 15'2305 | 21'7682 | 5.10% | 4 | (6'5377) |
ㅘ | 3'5241 | ||||
ㅙ | 2371 | ||||
ㅚ | 2'7765 | ||||
ㅛ | 2'4001 | 2'4001 | 0.56% | 10 | |
ㅜ | 11'4110 | 16'4575 | 3.86% | 6 | (5'0465) |
ㅝ | 2'9287 | ||||
ㅞ | 115 | ||||
ㅟ | 2'1063 | ||||
ㅠ | 1'0971 | 1'0971 | 0.26% | 13 | |
ㅡ | 19'9504 | 22'7501 | 5.33% | 3 | (2'7997) |
ㅢ | 2'7997 | ||||
ㅣ | 27'3440 | 30'1437 | 7.06% | 2 | (2'7997) |
합계 | 1698148 | 1793159 | 42.02% |
(2) 닿소리 이음 잦기
다음은 받침과 첫소리의 이음 잦기를 나타낸 표이다.
ㄱ | ㄲ | ㄴ | ㄷ | ㄸ | ㄹ | ㅁ | ㅂ | ㅃ | ㅅ | ㅆ | ㅇ | ㅈ | ㅉ | ㅊ | ㅋ | ㅌ | ㅍ | ㅎ | 합계 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ㄱ | 6139 | 96 | 520 | 2029 | 10 | 965 | 3955 | 2944 | 11 | 3604 | 16 | 22006 | 7530 | 18 | 649 | 12 | 414 | 416 | 9873 | 61207 |
ㄲ | 33 | 15 | 527 | 2 | 577 | |||||||||||||||
ㄳ | 15 | 15 | ||||||||||||||||||
ㄴ | 11417 | 583 | 3941 | 19215 | 16 | 4154 | 3600 | 5956 | 18 | 9508 | 74 | 34209 | 17639 | 394 | 2383 | 174 | 1231 | 540 | 18248 | 133300 |
ㄵ | 1 | 1 | 72 | 4 | 78 | |||||||||||||||
ㄶ | 841 | 491 | 357 | 884 | 0 | 3101 | 105 | 5779 | ||||||||||||
ㄷ | 660 | 282 | 85 | 5 | 16 | 51 | 0 | 1030 | 110 | 45 | 20 | 2304 | ||||||||
ㄹ | 5351 | 855 | 68 | 2570 | 15 | 4469 | 2167 | 2753 | 12 | 2874 | 4280 | 20542 | 4484 | 131 | 1011 | 56 | 152 | 650 | 3973 | 56413 |
ㄺ | 14 | 2 | 3 | 71 | 3 | 218 | 311 | |||||||||||||
ㄻ | 48 | 1 | 108 | 0 | 0 | 157 | ||||||||||||||
ㄼ | 62 | 3 | 3 | 2 | 75 | 7 | 19 | 171 | ||||||||||||
ㄽ | 0 | |||||||||||||||||||
ㄾ | 1 | 3 | 4 | |||||||||||||||||
ㄿ | 0 | |||||||||||||||||||
ㅀ | 23 | 6 | 34 | 2 | 76 | 23 | 164 | |||||||||||||
ㅁ | 2958 | 1228 | 286 | 3786 | 2 | 720 | 724 | 980 | 1 | 3614 | 34 | 12499 | 2840 | 36 | 1612 | 3 | 530 | 213 | 3865 | 35931 |
ㅂ | 2095 | 13 | 30277 | 1090 | 1092 | 587 | 1869 | 5 | 1632 | 11 | 7663 | 2636 | 333 | 1 | 29 | 40 | 1826 | 51199 | ||
ㅄ | 306 | 647 | 562 | 2 | 3 | 672 | 1 | 1250 | 133 | 3576 | ||||||||||
ㅅ | 208 | 47 | 100 | 1267 | 15 | 120 | 218 | 17 | 34 | 2 | 11807 | 166 | 117 | 167 | 2 | 7 | 1031 | 15325 | ||
ㅆ | 3978 | 6546 | 6560 | 13278 | 5394 | 1944 | 37700 | |||||||||||||
ㅇ | 19548 | 327 | 1089 | 5984 | 30 | 4162 | 3207 | 8366 | 19 | 11318 | 8 | 29908 | 8201 | 36 | 3560 | 54 | 1739 | 1002 | 16759 | 115317 |
ㅈ | 681 | 172 | 170 | 4 | 5 | 186 | 368 | 138 | 248 | 17 | 1989 | |||||||||
ㅊ | 17 | 6 | 6 | 21 | 4 | 6 | 24 | 3 | 1 | 88 | ||||||||||
ㅋ | 1 | 1 | ||||||||||||||||||
ㅌ | 204 | 38 | 245 | 79 | 3 | 9 | 380 | 1879 | 67 | 3 | 2907 | |||||||||
ㅍ | 92 | 12 | 110 | 3 | 266 | 1353 | 64 | 1 | 1 | 1902 | ||||||||||
ㅎ | 6438 | 52 | 358 | 871 | 618 | 748 | 10 | 9095 | ||||||||||||
합계 | 61116 | 3187 | 44762 | 44265 | 88 | 15562 | 14398 | 23126 | 83 | 49182 | 4426 | 154598 | 46840 | 733 | 10021 | 300 | 4097 | 2870 | 55856 | 535510 |
겹받침 또는 받침 뒤의 첫소리 때문에 생기는 닿소리 글쇠의 이음 잦기(결합 빈도)를 셈하여 다음 표에 나타내었다.
뒷닿소리 | |||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ㄱ | ㄴ | ㄷ | ㄹ | ㅁ | ㅂ | ㅅ | ㅆ | ㅇ | ㅈ | ㅊ | ㅋ | ㅌ | ㅍ | ㅎ | 합 | ||
앞 닿 소 리 |
ㄱ | 6282 | 537 | 2039 | 965 | 3958 | 2955 | 3619 | 16 | 22604 | 7553 | 649 | 12 | 414 | 416 | 10091 | 62110 |
ㄴ | 12000 | 3941 | 19231 | 4154 | 3600 | 5974 | 9508 | 74 | 34209 | 18111 | 2383 | 174 | 1231 | 540 | 24027 | 139157 | |
ㄷ | 660 | 282 | 85 | 5 | 16 | 51 | 1030 | 110 | 45 | 20 | 2304 | ||||||
ㄹ | 6520 | 68 | 2585 | 4469 | 2326 | 2950 | 2874 | 4280 | 20542 | 4615 | 1011 | 56 | 156 | 650 | 4140 | 57242 | |
ㅁ | 4234 | 287 | 3788 | 720 | 724 | 981 | 3614 | 34 | 12607 | 2876 | 1612 | 3 | 530 | 213 | 3865 | 36088 | |
ㅂ | 2170 | 30280 | 1093 | 1092 | 587 | 1874 | 5243 | 11 | 7738 | 2643 | 333 | 1 | 29 | 40 | 1845 | 54979 | |
ㅅ | 561 | 747 | 1844 | 122 | 238 | 706 | 3 | 13072 | 416 | 167 | 2 | 7 | 1031 | 18916 | |||
ㅆ | 3978 | 6546 | 6560 | 13278 | 5394 | 1944 | 37700 | ||||||||||
ㅇ | 19875 | 1089 | 6014 | 4162 | 3207 | 8385 | 11318 | 8 | 29908 | 8237 | 3560 | 54 | 1739 | 1002 | 16759 | 115317 | |
ㅈ | 682 | 173 | 170 | 4 | 5 | 186 | 440 | 138 | 248 | 21 | 2067 | ||||||
ㅊ | 17 | 6 | 6 | 21 | 4 | 6 | 24 | 3 | 1 | 88 | |||||||
ㅋ | 1 | 1 | |||||||||||||||
ㅌ | 243 | 245 | 79 | 3 | 9 | 380 | 1882 | 67 | 3 | 2911 | |||||||
ㅍ | 92 | 12 | 110 | 3 | 266 | 1353 | 65 | 1 | 1902 | ||||||||
ㅎ | 7302 | 549 | 749 | 3 | 1757 | 3795 | 876 | 10 | 15041 | ||||||||
합 | 64617 | 44762 | 44353 | 15565 | 14557 | 23394 | 52806 | 4426 | 154598 | 47651 | 10021 | 300 | 4101 | 2870 | 61802 | 545823 |
이음 잦기가 높은 닿소리는 ㅇ, ㄴ, ㄱ, ㅂ, ㅎ, ㄹ 차례였다. 낱내의 끝소리 또는 겹받침의 앞소리로서 앞닿소리로 나오는 잦기는 ㄴ, ㅇ, ㄱ, ㄹ, ㅂ, ㅆ, ㅁ,ㅅ 차례였다. 겹받침의 뒷소리 또는 낱내의 첫소리로서 뒷닿소리로 자주 나오는 것은 ㅇ, ㄱ, ㅎ, ㅅ, ㅈ, ㄴ, ㄷ, ㅂ, ㄹ, ㅁ, ㅊ 차례였다.
거센소리 ㅊ, ㅋ, ㅌ, ㅍ, ㅎ끼리의 이음 잦기는 매우 낮았다.
앞닿소리 | 뒷닿소리 | 합 | |
---|---|---|---|
ㅇ | 11'5317 | 15'4598 | 26'9915 |
ㄴ | 13'9157 | 4'4762 | 18'3919 |
ㄱ | 6'2110 | 6'4617 | 12'6727 |
ㅂ | 5'4979 | 2'3394 | 7'8373 |
ㅎ | 1'5041 | 6'1802 | 7'6843 |
ㄹ | 5'7242 | 1'5565 | 7'2807 |
ㅅ | 1'8916 | 5'2806 | 7'1722 |
ㅁ | 3'6088 | 1'4557 | 5'0645 |
ㅈ | 2067 | 4'7651 | 4'9718 |
ㄷ | 2304 | 4'4353 | 4'6657 |
ㅆ | 3'7700 | 4426 | 4'2126 |
ㅊ | 88 | 1'0021 | 1'0109 |
ㅌ | 2911 | 4101 | 7012 |
ㅍ | 1902 | 2870 | 4772 |
ㅋ | 1 | 300 | 301 |
이 통계표들을 참고하여 다음 장에서 새 2벌 자판 설계안을 만들어 본다.
덧글을 달아 주세요