記号辞典を作り直す(Wnn4のみ)


Wnn4 では, 普通の記号が「普通に」登録されている。 これでは意味が通じないので, 例をあげて説明しよう。
いじょうにより, このようなけっかが...
を Wnn4 で変換して, 運が悪いとこうなる。
≧により, このような結果が...
何とも脱力してしまう。そう, 「記号」であっても, 普通の単語と同様に登録されているのである。まぁこれは, 他の大抵の FEP でもそうである。しかし, Wnn4 では, その構文解析のいい加減さともあいまって:-), 本当は普通の熟語が出てきて欲しいところにさえ記号が出てきたりするのである。

じゃぁどうすればいいかというと, 答えは簡単で Wnn6 の真似をすれば良いのである。 Wnn6 では記号は @ に読みをつなげた形で登録されている。つまり, 例えば前出の ≧ を入力するには,

@いじょう
と入力する必要がある。

こうすればまず間違えないし, 逆に 「以上」ではなく, 「≧」の記号を出したいときは確実に記号を出すことができる。

というわけで, やりかたである。これには Wnn の辞書を書き換える権限が必要である。 なお, 古い辞書をバックアップしといた方がいいかも知れません。

  1. まず, dtoa を使って元の記号辞書をテキストファイルに展開する
    dtoa <辞書ファイルのある位置>/symbol.dic > /tmp/tmp.symbol
    なんて感じ。うちだと dtoa をフルパスで指定する必要があるので,
    /usr/local/bin/Wnn4/dtoa /usr/local/lib/wnn4/ja_JP/dic/pubdic/symbol.dic > /tmp/tmp.symbol
    などとした。
  2. 読みがなの先頭に @ を加える。dtoa の出力したファイルはひと目見れば フォーマットはすぐわかるでしょうから, あとはエディタ使うなり, sed,perl,sed なんでやってもらってもいいです。
  3. 新しいファイルで辞書を作り直す
    atod <辞書ファイルのある位置>/symbol.dic < /tmp/tmp.symbol
    でよい。
あとは, jserver を立ち上げ直せば良い。 頻度ファイルが使えなくなるかも知れないけど, 気にしない:-)

戻る (って, どこに戻るんだろう)
とみながたけひろホームページ