SourceForge.jp

染み抜き君(仮)

 染み抜き君は、青空文庫の入力補助プログラムです。

どんなプログラム?

 染み抜き君は、青空文庫のテキストをJIS X0213にある漢字を気にせず使ってテキスト入力を行い、
最後にJIS X0208のルールに収まるように、包摂対象文字の置換や外字の外字注記化を行うプログラムです。

どんな風に使うの?

 青空文庫のテキスト入力をしていて、難しそうな文字が出てくる度に、包摂や外字注記に該当しないかな?と気を遣うのは大変です。そこで

  • 入力時のファイルフォーマットはUTF-8で
  • 外字だろうが、包摂だろうが気にせずどんどん入力
  •  していき、テキスト入力、誤字訂正を完了させてしまいます。
    最後まで入力と誤字訂正が終わったら、染み抜き君に入力が完了したテキストをドラッグ&ドロップします。
    すると、包摂対象文字は第一・第二水準の該当漢字に置き換わり、外字は※[#「」、第?水準p-rr-cc]形式の外字注記に書き換わった、「ドロップしたファイル名_x0208.txt」と、元テキストのどこをどう変えたかという、「ドロップしたファイル名_log.txt」というファイルができます。
    あとは、_log.txtを見ながら、染み抜き君が変更を行った箇所を確認していけばOKです。

    嬉しいところ

     染み抜き君は、青空文庫の外字注記プロジェクトが作成した、外字注記辞書のコピーを持っています。
    (作成に尽力して下さっている小林さん、しださんに感謝!)
    ですので、外字の外字注記化を行うときに、大抵の文字に一緒に字体説明を付け加えてくれます。
     場合によっては、字体説明が入らない外字注記ができてしまうことがあるかも知れません。これは、辞書がたまたまその文字を知らなかったという事なので、字体説明を書き加えた後で、外字注記プロジェクトに教えてあげましょう。
     一気に変わっちゃって、外字注記は明らかに違うから解るけど、包摂はどこの文字が置き換わったの?という心配も不要です。
    染み抜き君で変換したときに出来た、_log.txtというファイルの中にどこがどう変更されたかが全部載っていますので、一見見分けの付かない包摂された文字も、字体説明が空白な外字注記もすぐに見つかります。
     提出前に、一度はこのファイルの中を見て、変更内容を確認するようにしてください。

    細かい使い方

     染み抜き君は、ドラッグ&ドロップアプリケーションなので、ダブルクリックで、ファイルと設定を指定してという使い方が出来ません。
    そのため、条件の設定はアプリケーションと同じフォルダーにファイル「43drop.conf」というファイルを作ってを作って入力ファイルの文字コードの指定をします。
    43drop.confはファイルが「ある」か「ない」かで動作が決まりますので、内容は空でも構いません。
    このファイルのあり・なしで

  • あり:UTF-8で
  • なし:sjis2004で
  •  入力ファイルを処理します。 ここを間違えると、出力ファイルが文字化けの荒らしになりますので、気をつけて下さい。

    あと、安全のため、元テキストはコピーを取って、壊れても大丈夫なようにしておいて下さい。

    最後に

     このプログラムを使うようになり、入力は外字を気にせずにできるようになると、外字注記無しで誤字チェックを行うのがいかに楽かが解ると思います。
    この楽さに慣れたら、みんなで、X0213化を早くしようよ!と呼びかけましょう。
    そうすれば、外字注記の殆どは無くせるようになりますので。