モールスの工夫 | きまぐれノート

　昔、至急電報のことを「ウナ電」と言っていました。ウナギとは関係ありません。英語の「urgent」（至急）の略号「UR」のモールス符号が「・・－　・－・」（トトツー　トツート）で、それを和文モールス符号に当てはめると「ウナ」になることに由来します。
　アメリカの画家・モールス（Samuel Finley Breese Morse, 1791--1872）は、離れて暮らす妻の死を1週間後にようやく手紙で知った悲しみが動機となって、電信を発明しました。それは、短い信号（・）と長い信号（－）を組み合わせた符号に従って電流をオン・オフすることによって文字を伝えるという方式で、彼が作ったその符号をモールス符号といいます。モールス符号は電報や無線電信に長い間使われました。
　英字と仮名文字のモールス符号は次のとおりです。

A	イ	・－
	ロ	・－・－
B	ハ	－・・・
C	ニ	－・－・
D	ホ	－・・
E	ヘ	・
	ト	・・－・・
F	チ	・・－・
G	リ	－－・
H	ヌ	・・・・

I	゛	・・
	ル	－・－－・
J	ヲ	・－－－
K	ワ	－・－
L	カ	・－・・
M	ヨ	－－
N	タ	－・
O	レ	－－－
	ソ	－－－・
P	ツ	・－－・

Q	ネ	－－・－
R	ナ	・－・
S	ラ	・・・
T	ム	－
U	ウ	・・－
	ヰ	・－・・－
	ノ	・・－－
	オ	・－・・・
V	ク	・・・－
W	ヤ	・－－

X	マ	－・・－
Y	ケ	－・－－
Z	フ	－－・・
	コ	－－－－
	エ	－・－－－
	テ	・－・－－
	ア	－－・－－
	サ	－・－・－
	キ	－・－・・
	ユ	－・・－－

	メ	－・・・－
	ミ	・・－・－
	シ	－－・－・
	ヱ	・－－・・
	ヒ	－－・・－
	モ	－・・－・
	セ	・－－－・
	ス	－－－・－
	ン	・－・－・
	゜	・・－－・

　モールス符号の決め方は非常に不規則に見えます。たとえば

A	・
B	－
C	・・
D	－・
E	・－
F	－－

（最初の信号は1文字ごとに短・長・短・長の順に変化し、二つ目の信号は、最初の2文字にはなし、以降2文字ごとに短・長と変化するという具合です）
のように規則的に変化させた符号をアルファベット順に割り当てていけばもっと覚えやすそうですが、なぜモールスはそうしなかったのでしょうか。
　実は、モールスは文字の使用頻度を考慮していたようです。つまり、使用頻度の高い文字に短い符号を割り当てれば、平均して電報の送信時間を短くすることができる、言い換えれば、一定時間内に多くの電報を送信できるというわけです。

　次に示すのは、英語における文字の使用頻度の順^(*1)に英字とそのモールス符号を並べたものです。符号長とは、その符号を伝送するのに短い信号（・）の何倍の時間がかかるかを示すものです（長い信号（－）の伝送時間は短い信号の2倍です）。

順位	文字	使用頻度（約1000字中）	モールス符号	符号長
1	E	131	・	1
2	T	105	－	2
3	A	86	・－	3
4	O	80	－－－	6
5	N	71	－・	3
6	R	68	・－・	4
7	I	63	・・	2
8	S	61	・・・	3
9	H	53	・・・・	4
10	D	38	－・・	4
11	L	34	・－・・	5
12	F	29	・・－・	5
13	C	28	－・－・	6

順位	文字	使用頻度（約1000字中）	モールス符号	符号長
14	M	25	－－	4
15	U	25	・・－	4
16	G	20	－－・	5
17	Y	20	－・－－	7
18	P	20	・－－・	6
19	W	15	・－－	5
20	B	14	－・・・	5
21	V	9.2	・・・－	5
22	K	4.2	－・－	5
23	X	1.7	－・・－	6
24	J	1.3	・－－－	7
25	Q	1.2	－－・－	7
26	Z	0.77	－－・・	6

　この表では、文字の使用頻度の順位と符号の短さの順位とはあまり一致していないように見えます。しかし、このデータは英語の文章に基づく統計で、電報文での文字の使用頻度はこれとは違うかもしれません。また、モールスは英語以外の言語（フランス語など）も考慮していたかもしれません。
　ともかく、モールスが文字の使用頻度を考慮したであろうことは見てとれます。最も使用頻度が高い「E」に最も短い符号が割り当てられています。符号長3までの文字はすべて使用頻度で上半分の順位にあり、最も長い符号長7の文字はすべて下半分の順位にあります。生起確率の高い情報に短い符号を割り当てるという可変長符号化方式の原点が、情報理論ができる100年以上も前、すでにここにあったのです。

　しかるに、和文モールス符号はどうでしょうか。最初の表を見ればおわかりのとおり、ABC順の符号をほぼイロハ順の文字に割り当てています。そして、途中の所々の文字「ロトルソヰノオ」、および終わりの方に連続する文字「コエテアサキユメミシヱヒモセスン」に、英字にない符号（いずれも符号長6以上）を割り当てています。このような恣意的な決め方には、文字の使用頻度の考慮など微塵も見受けられません。
　仮名文字の使用頻度についてのデータを見つけることができなかったので、新聞の三面記事の本文から、仮名文字にして1000字分ほどを抜き出して集計してみました。同じように符号長と対比して示します。

順位	文字	使用頻度（約1000字中）	モールス符号	符号長
1	゛	109	・・	2
2	イ	79	・－	3
3	シ	71	－－・－・	8
4	ン	62	・－・－・	7
5	ウ	54	・・－	4
6	カ	41	・－・・	5
7	タ	40	－・	3
8	ト	40	・・－・・	6
9	ニ	40	－・－・	6
10	ク	36	・・・－	5
11	ヨ	34	－－	4
12	テ	33	・－・－－	8
13	ケ	31	－・－－	7
14	ツ	31	・－－・	6
15	キ	25	－・－・・	7
16	ハ	24	－・・・	5
17	ヤ	22	・－－	5
18	ノ	21	・・－－	6
19	ヲ	20	・－－－	7
20	サ	18	－・－・－	8
21	コ	17	－－－－	8
22	チ	15	・・－・	5
23	マ	14	－・・－	6
24	ホ	13	－・・	4

順位	文字	使用頻度（約1000字中）	モールス符号	符号長
25	ル	13	－・－－・	8
26	オ	12	・－・・・	6
27	リ	12	－－・	5
28	フ	11	－－・・	6
29	メ	11	－・・・－	7
30	モ	11	－・・－・	7
31	ユ	10	－・・－－	8
32	ラ	10	・・・	3
33	ソ	9	－－－・	7
34	セ	7	・－－－・	8
35	ナ	7	・－・	4
36	ミ	6	・・－・－	7
37	エ	5	－・－－－	9
38	ス	5	－－－・－	9
39	ネ	5	－－・－	7
40	レ	5	－－－	6
41	ヘ	4	・	1
42	ワ	4	－・－	5
43	ヒ	3	－－・・－	8
44	ア	2	－－・－－	9
45	ロ	2	・－・－	6
46	ヌ	1	・・・・	4
47	ム	1	－	2
48	゜	0	・・－－・	7

　もちろん、これはあまりにサンプルの少ない統計ですから、仮名文字の使用頻度の順位はあてになりません。しかし、使用頻度が高そうな「シ」「ン」の符号が長い一方、短い符号が割り当てられている「ヘ」「ム」の使用頻度は高そうにないということはおわかりいただけるでしょう。

　もしかしたら、和文モールス符号には、符号の順番を欧文モールス符号とほぼそろえることによって覚えやすくするという意図があったのかもしれません。また、「イ：伊藤（・－）」「ロ：路上歩行（・－・－）」「ハ：ハーモニカ（－・・・）」など、暗記のための語呂合わせがうまくできているから、これでよかったのだと言う人がいるかもしれません。しかし、仮名文字の使用頻度を考慮した決め方はあったはずで、そうすれば電報の送信時間はもっと短くなったはずです。また、そのように決めても暗記のための語呂合わせの言葉は作れたはずです。
　和文モールス符号は、たとえ習得のための“初期コスト”が低かったとしても、電報を送信する時間が長い、つまり、習得後の“運用コスト”が高いものになってしまっていたのです。

　私は、大学でコンピュータネットワーク技術を講義する時、「技術を開発した先人の工夫を見抜かなかった表層的な猿真似」の悪しき例として、この和文モールス符号を挙げています。

(*1) Information Theory, Stanford Goldman, 1953より。斎藤雄一・著「〈図解〉デジタルのしくみ」（日本実業出版社）から引用。

（2003/4/28追記）　京都大学の安岡孝一さんから情報をいただきました。安岡さんの「国際モールス符号の誕生」のページによると、現在の欧文モールス符号を決めたのはモールス自身ではなく、現在の符号がほぼでき上がったのは1851年のドイツ・オーストリア電信会議で、その後、1868年の国際電信会議で国際モールス符号が合意されたのだそうです。アルファベット文字は長短の信号四つまでで表されているということから私が読み取ったところでは、「長い信号の伝送時間は短い信号の2倍」という計算による符号長だけでなく、電鍵を叩く回数も重視されたように思われます（モールス自身も、最も使用頻度が高い「E」に最も短い符号を割り当てていたようです）。和文モールス符号は、ドイツ語のウムラウト付き文字を含む、ドイツ・オーストリア電信会議の版の符号をほぼ「イロハ…」の順に割り当てたものだそうです。
　安岡さん、ありがとうございました。