形態素解析辞書縮減編集

昨年から、点訳エンジンを作成し、開発を大体終えました。

Linux環境では、今年前半で動きましたが、客先の要望から、Android環境での利用をすることになっており、ポーティングが必要でした。

私としては、mecabを主張し、受け入れられました。辞書は、mecabの基本辞書と、NeoLogdをシステム辞書に統合して使いました。

Android環境では、Native Interfaceを使って呼び出したいとのことなので、インタフェースを用意したり、mecabのポーティングをしたり、辞書を編集したりと大変でした。

最も時間がかかったのは、客先の使用するハードウェアのメモリが小さいため、辞書を縮減しないととても使えないということです。

NeoLogdを使うと 800MB近い!という難題です。

調べると、記号で始まるエントリーやひらがな・カタカナで始まるエントリー、超長いエントリー、テレビ番組名、芸能関係、絵文字、なんともはや行数が100million単位です。

これを半分にしたい!という目標のもと、プログラムを別に作って、削減に取り組んでいます。

さらには、点訳エンジンなので、分かち書きのための追加作業も待っています。

毎日作業の連続です。

ステッピングモーター・セミナー

先日、オリエンタルモーター社のセミナーに参加させていただきました。

ステッピングモーター実践講座で、女性講師が3時間ほどにわたり、丁寧に指導してくださいました。

会場のみやこめっせの専用部屋は満杯状態で、各テーブルに2名座り、間に、実機と操作盤が置かれていました。

午前は、理論を教えていただき、午後は、実践編といった感じで、指導が適切なので、非常に面白かったです。

私の定義

私という応用情報処理技術者は、20代から存在していた。だが、初めはどでかい制御コンピュータを前に、固いボタンを押して、図面やデータを作っていただけだった。

それは、机がコンピュータのデスクトップというか、ディスプレイとコンピュータが一体の代物であり、ディスプレイとキーボードが目の前にあって、足の前にまでその本体があり、専用の機械で、専門の社員が配置していた。フロッピーディスクは5インチ。何枚ものFDを大事に持ち歩いていた。

データ元は、工場に何をどう配置・制御するかを専門技術者が客先と話して決めた図面だった。水力発電所、火力発電所など、巨大な産業の事業者が注文されるので、さまざまなコンポーネントが並んでいた。

あまり深い知識は必要なかったので、5年間お世話になり、最後の数年はパソコンも導入されてきた。まあ、専用のパソコンなのだが。。