차례

4. 국회 회의록 통계 분석

  이 장에서는 국회에서 공개한 2011. 9.1~2011.10.14의 국회 회의록의 한글 및 부호·숫자 등의 잦기를 분석한다. 이 자료를 근거로 삼아 뒤에서 새 2벌 자판을 설계하고 여러 2벌 자판들을 견주려고 한다. 엄밀히 비교하려면 더 많은 글을 다양하게 비교해야겠지만, 회의록으로서 오늘날 쓰이는 대화문의 낱소리 잦기를 모자라게나마 파악하는 데에 뜻을 두고자 한다. 대화와 연설을 담은 국회 회의록은 글말을 담은 자료와 한글 낱소리 잦기가 다를 수 있다. PDF 파일을 텍스트 파일로 바꾸면서 쪽의 머리글, 꼬리글 내용이 잘못 섞여 들어간 부분도 조금 있다.

303.7z

텍스트 파일로 바꾼 국회 회의록 (2011. 9.1~2011.10.14)


  통계 분석에는 조합형 한글 코드를 다루는 김용묵님의 간단한 한글 타자 행동 분석기를 바탕으로 글쓴이가 기능을 고치고 더한 도구를 썼다. 로마자는 셈하지 않았고, 자판들에서 바로 넣을 수 없는 특수기호는 셈하지 않거나 다른 기호로 바꾸었다. 가운뎃점은 공병우 최종 자판에만 들어가 있으므로 문맥에 따라 붙임표(-)나 쉼표로 바꾸었고, 거꾸로 공병우 최종 자판에는 없는 '&'는 셈하지 않았다. 거듭 들어간 빈 칸과 빈 줄은 하나로 셈하였다.

[표 1] 통계에 셈한 문자 요소
한글 낱소리부호숫자기타
첫소리 169'8148 쉼표(,) 1'8661 0 7251 빈 칸 50'3399
가운뎃소리 169'8148 마침표(.) 4'0550 1 5601 줄바꿈 4'8060
끝소리 76'5756 쌍점 (:) 2 2 4161    
    큰 따옴표(") 1048 3 2442    
    작은 따옴표(') 2634 4 1731    
    물음표(?) 7915 5 1996    
    느낌표(!) 371 6 1232    
    빗금 (/) 13 7 1263    
    붙임표, 뻐기(-) 1144 8 1174    
    물결표(~) 103 9 1399    
    더하기(+) 13        
    여는 손톱묶음 ( 1724        
    닫는 손톱묶음 ) 1724        
    % 1006        
416'20527'69082'825055'1459

(1) 낱소리 잦기

  먼저 회의록의 낱소리 잦기와 2벌 자판으로 넣을 때의 타수를 셈한다. 뒤에서 만들 2벌 자판은 'ㅆ' 글쇠를 따로 넣으려 하므로 'ㅆ'의 타수를 따로 셈하였다.

[표 2-1] 닿소리 잦기와 타수
 잦기타수타수 비율타수
순위
첫소리끝소리첫소리끝소리닿소리첫소리끝소리닿소리
25'4946 7'5317 26'9406 7'6223 34'5629 6.31% 1.79% 8.10% 3
1'4460 577              
11'0377 25'5964 11'0377 26'1821 37'2198 2.59% 6.14% 8.72% 2
13'8383 2333 15'1672 2333 15'4005 3.55% 0.05% 3.61% 7
1'3289                
10'6046 11'4538 10'6046 11'5367 22'1413 2.49% 2.70% 5.19% 4
6'8190 4'8362 6'8190 4'8521 11'6711 1.60% 1.14% 2.73% 10
8'1771 5'3736 8'2653 5'7530 14'0183 1.94% 1.35% 3.28% 9
882                
15'2965 1'8631 15'2965 2'2255 17'5220 3.58% 0.52% 4.11% 5
5519 3'7704 5519 3'7704 4'3223 0.13% 0.88% 1.01% 11
38'0308 13'1448 38'0308 13'1448 51'1756 8.91% 3.08% 11.99% 1
16'5546 1997 16'7294 2075 16'9369 3.92% 0.05% 3.97% 6
1748                
3'6692 921 3'6692 921 3'7613 0.86% 0.02% 0.88% 12
3499 1 3499 1 3500 0.08% 0.00% 0.08% 15
1'5435 2917 1'5435 2921 1'8356 0.36% 0.07% 0.43% 13
1'1717 1905 1'1717 1905 1'3622 0.27% 0.04% 0.32% 14
13'6375 9095 136375 1'5041 15'1416 3.20% 0.35% 3.55% 8
  15              
  78              
  5779              
  314              
  159              
  185              
  0              
  4              
  0              
  167              
  3609              
합계169'814876'5756169'814877'6066247'421439.79%18.19%57.98% 

..

 [표 2-2] 홀소리 잦기와 타수
 잦기타수타수
비율
타수
순위
겹홀소리
타수
33'0976 36'6217 8.58% 1 3'5241
8'2400 8'4771 1.99% 7 2371
1'1816 1'1816 0.28% 11  
1237 1237 0.03% 14  
18'6486 21'5773 5.06% 5 2'9287
8'4483 8'4598 1.98% 8 115
7'1190 7'1190 1.67% 9  
1'1390 1'1390 0.27% 12  
15'2305 21'7682 5.10% 4 6'5377
3'5241        
2371        
2'7765        
2'4001 2'4001 0.56% 10  
11'4110 16'4575 3.86% 6 5'0465
2'9287        
115        
2'1063        
1'0971 1'0971 0.26% 13  
19'9504 22'7501 5.33% 3 2'7997
2'7997        
27'3440 30'1437 7.06% 2 2'7997
합계1698148179315942.02%  
국회 회의록 닿소리 잦기

[그림표 2-1] 닿소리 잦기


홀소리 잦기

[그림표 2-2] 홀소리 잦기

닿소리 타수

[그림표 2-3] 닿소리 타수

홀소리 타수

[그림표 2-4] 홀소리 타수



(2) 닿소리 이음 잦기

  다음은 받침과 첫소리의 이음 잦기를 나타낸 표이다.

[표 3-1] 끝소리와 첫소리의 이음 잦기
 합계
6139 96 520 2029 10 965 3955 2944 11 3604 16 22006 7530 18 649 12 414 416 9873 61207
33   15                 527 2             577
                      15               15
11417 583 3941 19215 16 4154 3600 5956 18 9508 74 34209 17639 394 2383 174 1231 540 18248 133300
1   1                 72             4 78
841   491 357           884 0 3101 105             5779
660   282 85     5 16   51 0 1030 110   45       20 2304
5351 855 68 2570 15 4469 2167 2753 12 2874 4280 20542 4484 131 1011 56 152 650 3973 56413
14   2       3         71 3           218 311
48   1                 108 0           0 157
62   3 3           2   75 7           19 171
                                      0
1                     3               4
                                      0
23   6 34           2   76 23             164
2958 1228 286 3786 2 720 724 980 1 3614 34 12499 2840 36 1612 3 530 213 3865 35931
2095 13 30277 1090   1092 587 1869 5 1632 11 7663 2636   333 1 29 40 1826 51199
306   647 562     2 3   672 1 1250 133             3576
208 47 100 1267 15   120 218 17 34 2 11807 166 117 167   2 7 1031 15325
3978   6546 6560           13278   5394 1944             37700
19548 327 1089 5984 30 4162 3207 8366 19 11318 8 29908 8201 36 3560 54 1739 1002 16759 115317
681   172 170     4 5   186   368 138   248       17 1989
17   6 6     21 4   6   24     3     1   88
1                                     1
204 38 245 79     3 9   380   1879 67           3 2907
92   12 110       3   266   1353 64 1       1   1902
6438   52 358           871   618 748   10         9095
합계 61116 3187 44762 44265 88 15562 14398 23126 83 49182 4426 154598 46840 733 10021 300 4097 2870 55856 535510

  겹받침 또는 받침 뒤의 첫소리 때문에 생기는 닿소리 글쇠의 이음 잦기(결합 빈도)를 셈하여 다음 표에 나타내었다.

[표 3-2] 닿소리 글쇠의 이음 잦기
 뒷닿소리



6282 537 2039 965 3958 2955 3619 16 22604 7553 649 12 414 416 10091 62110
12000 3941 19231 4154 3600 5974 9508 74 34209 18111 2383 174 1231 540 24027 139157
660 282 85   5 16 51   1030 110 45       20 2304
6520 68 2585 4469 2326 2950 2874 4280 20542 4615 1011 56 156 650 4140 57242
4234 287 3788 720 724 981 3614 34 12607 2876 1612 3 530 213 3865 36088
2170 30280 1093 1092 587 1874 5243 11 7738 2643 333 1 29 40 1845 54979
561 747 1844   122 238 706 3 13072 416 167   2 7 1031 18916
3978 6546 6560       13278   5394 1944           37700
19875 1089 6014 4162 3207 8385 11318 8 29908 8237 3560 54 1739 1002 16759 115317
682 173 170   4 5 186   440 138 248       21 2067
17 6 6   21 4 6   24   3     1   88
1                             1
243 245 79   3 9 380   1882 67         3 2911
92 12 110     3 266   1353 65       1   1902
7302 549 749 3     1757   3795 876 10         15041
64617 44762 44353 15565 14557 23394 52806 4426 154598 47651 10021 300 4101 2870 61802 545823

닿소리 글쇠 이음 잦기 비율

[그림표 3] 닿소리 글쇠 이음 잦기 비교


  이음 잦기가 높은 닿소리는 ㅇ, ㄴ, ㄱ, ㅂ, ㅎ, ㄹ 차례였다. 낱내의 끝소리 또는 겹받침의 앞소리로서 앞닿소리로 나오는 잦기는 ㄴ, ㅇ, ㄱ, ㄹ, ㅂ, ㅆ, ㅁ,ㅅ 차례였다. 겹받침의 뒷소리 또는 낱내의 첫소리로서 뒷닿소리로 자주 나오는 것은 ㅇ, ㄱ, ㅎ, ㅅ, ㅈ, ㄴ, ㄷ, ㅂ, ㄹ, ㅁ, ㅊ 차례였다.

  거센소리 ㅊ, ㅋ, ㅌ, ㅍ, ㅎ끼리의 이음 잦기는 매우 낮았다.

[표 3-3] 닿소리 이음 잦기 합
 앞닿소리뒷닿소리
11'5317 15'4598 26'9915
13'9157 4'4762 18'3919
6'2110 6'4617 12'6727
5'4979 2'3394 7'8373
1'5041 6'1802 7'6843
5'7242 1'5565 7'2807
1'8916 5'2806 7'1722
3'6088 1'4557 5'0645
2067 4'7651 4'9718
2304 4'4353 4'6657
3'7700 4426 4'2126
88 1'0021 1'0109
2911 4101 7012
1902 2870 4772
1 300 301

  이 통계표들을 참고하여 다음 장에서 새 2벌 자판 설계안을 만들어 본다.

2011/10/30 23:01 2011/10/30 23:01
보람말로 얽힌 글타래
<자판 / 두벌식> 글갈래의 다른 글
글 걸기 주소 : http://pat.im/trackback/847

덧글을 달아 주세요