[PR]この占いで運命を切り開け!:無料診断でわかる血液型のヒミツ

*MS-IME補強計画*
1,初めに
 2,学習させよう 3,辞書のメンテナンス 4,単語/用例の登録 5,変換トレーニングウィザード 6,品詞 7,ユーザー辞書 8,MS-IME2002のかな漢字変換の仕組み システム辞書の利用方法

MS-IME補強計画に戻る       TOPに戻る



7、ユーザー辞書





☆☆☆ ユーザー辞書使用にあたって ☆☆☆


☆ダウンロードされたユーザー(システム)辞書の動作保証をいたしません。
 また、これらの使用が原因で発生したいかなる障害、損害等に対しても、作者は一切責任は持ちませんし、何の補償もいたしません。
☆すべて自己責任で使用等してください。自己責任の取れない方は使用しないで下さい。
☆上に書いてある注意書きの意味がわからない人は使用しないで下さい。





☆☆☆ 四字熟語辞書 ☆☆☆



 登録熟語数はおよそ2,350語。ユーザー辞書ではなく、システム辞書になっています。
 登録内容は、
  @(全角文字)に続いて、2、3、4文字および普通の読みの4通りで変換できるようになっています。(結局のところ、合計約9,400語のデータが登録されています。)
 例えば
  「墨子兼愛」と変換したい場合は、
   @ぼく
   @ぼくし
   @ぼくしけ
   @ぼくしけんあい
      の4種類の読みから変換できるようになっています。
  また、@あい と入力し、変換すると以下のような変換候補が現れます。

     BMPE.gif


  なお、「MS-IME2002」の標準辞書との重複登録に対しては、暫定版ということで、特に配慮はしていません。(将来的には、ユーザーコメントとして簡単な意味などもつける予定ですので、そのときに調整しようかと考えていますが、いつになるか全く不明です。)
 システム辞書の利用方法がわからない方は「システム辞書の利用方法」を参考にして、本辞書をご利用下さい。

※漢字が見当たらないため、一部ひらがなが含まれている熟語が数語あります。
 正しい漢字が見当たらないため、現在の漢字で表記してあるものが数語含まれています。(漢和辞典で調べましたのでバグではありません)    (この項 01,20 追加)




【 DOWN LOAD 】






☆☆☆ カタカナ語辞書 ☆☆☆
   


 標準辞書に登録されていないカタカナ語を変換すると、本来ならば、名詞、姓、名、人名として学習されるべき単語が、さ変形動名詞として登録される場合が多いようです。
 このような誤った品詞でカタカナ語が学習されることを防ぐために前もって、辞書にカタカナ語を登録しておこうという趣旨で作成した辞書です。
 登録語数はまだ612語に過ぎませんが、この辞書を使用することによって、少しは無駄な単語の学習が少なくなります。また、本サイトで述べているように、ユーザー辞書のメンテナンスをする手間が、少しは減ります。

【辞書の特徴】
 ・カタカナ語612語を登録したシステム辞書。
 ・市販の製品のシステム辞書を辞書ツールで登録したものではなく、すべての単語は手打ちで入力・確認をしてあります。
 ・バスツアー、ゴムタイヤ、ポイントゲッター、ヘアピンカーブなどのように、2語、または3語で変換されるような複合語は基本的に登録されていません。
  ※本来のAI変換を生かすために複合語の登録は基本的にしておりませんが、意味から考えて登録してあるものもあります。
 ・一般的なカタカナ語を登録してあります。現在のところ、最新のカタカナ語、姓、名、人名などには対応していません。
 ・登録カタカナ語に対する用例は登録してありません。

【使用方法】
 本サイトの「システム辞書の利用方法」などを参考にしてください。

【登録単語例】
 ・サバイバー、クリエイター、チャンプ、キーピング、グチる、パシリ、オタク、オギャーなど。(品詞は名詞が中心ですが、動詞や感動詞、副詞的名詞、形容動詞、副詞、形動名詞などもわずかですが含まれています。)
(注意)ユーザー辞書に登録したカタカナ単語は、すでにシステム辞書にあらかじめ登録されている同音語の単語よりも優先的に変換されるようになりますが、使用していくうちに、単語の頻度情報が変わり、うまく変換されるようになっていきます。



【 DOWN LOAD 】
現在ダウンロードできません




☆☆☆ 用例辞書 ☆☆☆

予告だけです。


 初期状態ではうまく変換されない、主に「2文字+2文字」で構成されている熟語を登録。
カタカナ語辞書と同様にすべて手作業で確認しました。
【特徴】
 ・登録用例は少ないですが、100用例以上
 ・初期状態ではうまく変換されない、主に「2文字+2文字」で構成されている熟語を登録
    用例登録することにより、MS-IMEの格フレーム変換を妨げず、本来のA.I.変換が機能します。
    複合語を1語で登録すると、MS-IMEの格フレーム変換がうまく働かないため、用例として複合語を登録するのが最良と考えました。
    用例学習することによりうまく変換されるようになるか、いつまでたっても用例学習されないのかの確認はしていません。あくまでも初期状態ではうまく変換されないものを用例登録したものです。

 ・後ろによく使われそうな動詞を続けて入力してもうまく変換できない用例のみを収録
 ・特殊なものではなく、一般的な用語を収録

 ※用例登録したユーザー辞書をシステム辞書として作成すると、システム辞書の作成画面上ではうまく登録されているのですが、実際に文章中で確認してみると、用例登録が有効に機能しないことが判明しました。そのため、用例辞書として、公開するのは、見合わせることにします。正しい品詞のチェックなどでずいぶんと手間をかけましたが、しょうがないです。






☆☆☆ 話し言葉追加辞書ミニ ☆☆☆


 登録熟語数はわずか169語と少々さびしいですが、話し言葉でよく使われると考えられる動詞も登録されています。

【辞書の特徴】
 ・話し言葉でよく使われる単語、169語を登録したシステム辞書。
 ・すべての単語は手打ちで入力・確認をしてあります。
 ・ウザったい(形容詞)のような単語も登録することができるのですが、話し言葉優先モードではうまく変換されますので、このような単語は登録していません。

【使用方法】
 本サイトの「システム辞書の利用方法」などを参考にしてください。
 ※話し言葉優先変換モード専用には指定できませんのでご注意ください。
 ※使用する場合は、話し言葉優先モードにし、辞書ツールでシステム辞書のチェックボックスにチェックを入れて使用してください。使用しない場合は必ずチェックをハズしてください。

【登録単語例】
 ・ジコる、事故る、ダベる、シラケる、キモい、イケメン、スッピン、素っぴんなど

【変換の比較例】(話し言葉優先モード)
・標準:機能帰りに字こっちゃってさー。もうたまんないよー。
・使用時:機能帰りにジコっちゃってさー。もうたまんないよー。
   ※A.I.変換が働くため「機能」は、「昨日」にはなりません。)



【 DOWN LOAD 】
現在ダウンロードできません





☆☆☆ 政経辞書ミニ ☆☆☆


 登録熟語数はわずか356語ですが、少しは変換しやすくなると思います。。

 【辞書の特徴】
 ・政治・経済というほどのたいした単語は含まれてはいませんが、多少は変換しやすくなるような単語が登録されています。
 ・すべての単語は手打ちで入力・確認をしてあります。
 ・文節区切りや、変換を数回繰り返せば変換できるような単語ばかりですし、いわゆる専門辞書といわれるものに含まれているような難しい単語は含まれていません。標準辞書に含まれていてもいいような、一般的な単語(?)が登録されています。
 ・登録されている単語が変換の第一候補になりますので、初期状態の変換とは異なった変換が行われる場合があります。
 ・不要だと思う単語は「抑制単語」として、変換候補からはずしてください。※登録するよりも変換候補に現れないようにするほうが簡単です。

【使用方法】
 本サイトの「システム辞書の利用方法」などを参考にしてください。
 ※使用する場合は、辞書ツールでシステム辞書のチェックボックスにチェックを入れて使用してください。使用しない場合は必ずチェックをハズしてください。

【登録単語例】
 ・厚労省、経産省、国交省、自公保、甲欄、要普免、など



【 DOWN LOAD 】
現在ダウンロードできません





☆☆☆ ことわざ・慣用句辞書F ☆☆☆

 初期状態では一発変換されないことわざ・慣用句といわれるもののうち、代表的と考えられるもの236語を登録しました。好みに合わない登録語は抑制単語にしてください。※登録品詞はすべて慣用句です。

【登録基準】
1、MS-IMEの変換基準に合わせ、硬めの表現になるように登録
 例えば、「たまにきず」を変換すると、初期状態では、「玉に瑕」のように変換されます。ちょっとした文章では、「玉にきず(傷、キズ)」あたりを使うのではないでしょうか。この「瑕」という漢字は常用外の漢字で、普段ではまず使わない漢字です。また、「球」「傷」という漢字を変換の第一候補になるように学習させてもやはり、「玉に瑕」と変換されます。
 一方、「いそのあわびのかたおもい」では、「磯のあわびの片思い」が標準の変換ですが、正式には「磯の鮑の片思い」です(アワビ、あわびでもいいと思いますが)。「あわび」「かたおもい」の第一候補は「あわび」「片思い」ですから、「アワビ」「片想い」がそれぞれ第一候補になるように学習させた後変換すると、「磯のアワビの片想い」と変換されます。このことから、「磯のあわびの片思い」という標準の変換はたまたま第一候補ずつの組み合わせによる変換だと考えられます。
  以上のことから、MS-IMEのA.I.変換による変換では、ことわざ・慣用句はやや硬めの表現(本来の正しい表現)に変換されるように調整されていると考えられます。逆に、本来の表現に変換されない場合は、A.I.変換が働かず、たまたまそのような変換になったり、誤ったA.I.変換が働いたことによるものと推定されます。※全体的に変換自体が硬い表現が得意な気がしますが。
 これらのことを勘案し、登録語は、硬めの表現、本来の表現(辞書に載っていた表現)に強制的に変換されるように登録する。
 「身から出た錆」(さび、サビでもちょっとした文にはかまわないと思いますが)もこのタイプです。
 ※実際のところ、ことわざ・慣用句を使用する場合は、硬い表現だったり、教養をチラッとのぞかせたりする場合だったりでしょう。そんな時には、しっかりとした表現の方がいいのではないでしょうか。
2、「船頭多くして船山へ上る」のような、語尾が活用して使用される可能性のあるものは基本的に登録しない。
3、「玉磨かざれば光なし」「武士は食わねど高楊枝」「見猿聞か猿言わ猿」「焼け木杭に火がつく」「思い半ばに過ぐ」「思えば思わるる」などのように、標準ではまっとうに変換されないものは、上記2、にかかわらず、語尾が活用する可能性のあるものも登録する。


【使用方法】
 本サイトの「システム辞書の利用方法」などを参考にしてください。

【登録例】
 ・上記【登録基準】を参照



【 DOWN LOAD 】





☆☆☆ 補強辞書 ☆☆☆
NEW!!


 上記の『カタカナ語辞書』『話し言葉追加辞書』『政経辞書』を一つにまとめ、単語データの修正・削除を行い、ジャンルにこだわらない追加辞書としました。
 なお、今回はJ-POP関係の単語(RUI、柴咲コウ、EXILE、X JAPAN、L'Arc〜en〜Ciel、B'z、LUNA SEAなど約230語、カタカナにも変換できます。)を新規に登録しました。
・総登録語数 … 2,931語
・登録語の特徴
 『カタカナ語辞書』『話し言葉追加辞書』『政経辞書』は上の各種辞書の説明をご覧ください。
 J-POP関係の単語は自分の知っているメジャーだと思う、主にグループ名が登録されています。また、「ラルク」の読みでも「L'Arc〜en〜Ciel」と変換されたりもします。
・あるジャンルは英大文字、あるジャンルは英小文字に変換されたりして不統一な部分があるかもしれませんし、登録語のミスがあるかもしれませんがバージョンアップで直していきます。

《注意》
 解凍時にパスワードが必要となります。パスワードは「giftoflife」(半角英小文字で10文字)です。
 パスワードの意味を知りたい方はここをクリックしてください。
  (2004.08.05 リンク先からパスワードを探していただく方法を廃止しました。)



【 DOWN LOAD 】








[PR]何かを探す前に無料占い:当たる!無料占い『スピリチュアルの館』