新かな配列練習道場

~単打最多の最凶かな配列を10本指で調教しよう~

ノールック漢字変換のススメ[高速タイピング]

ノールック漢字変換とは漢字変換結果を見ずに確定するスキルのことである。

変換候補を見て「どれにしようかな」などといちいち考える必要がなくなり、もっと重要なことに思考を傾けられるようになる。漢字変換を無意識化したければ目を瞑って漢字を出せるようにするしかない。

 

ここでは以下のツイートついて詳しく説明していきたいと思う。

極端な例で漢直という手段もあるが、このツイートのようにふつうの漢字変換であってとうまく利用することで候補選択の煩わしさから逃れることができる。

 

 

下準備

学習機能をオフにしよう

タイピストの隅野氏がMicrosoft IMEを駆使しているのは有名だ。

同氏の土俵であった毎日パソコンコンクールではMicrosoft IMEの初期状態、学習機能無しという制限がある。学習機能を切ることで常に変換候補が同じ並び順となるため、それを丸暗記してるのだそうだ。思い通りの漢字を出すためにはスペースを何回押したらいいのかが分かっていて、変換結果をいちいち確認しないから速く打てるというわけだ。

実際に学習機能をオフにしてみよう。すると毎回同じ変換候補が出ることの安心感を体験できる。

 

ただしMicrosoft IMEを初期状態のまま学習オフで使うというのはまったく実用的ではない。少なくとも自分の名前が変換ですぐに出せなかったらその時点で面倒だと思うだろう。Microsoftが指定した変換リストではなく、使用者が最もよく使う漢字が常に一番上に来るべきである。

実際、Microsoft IMEの学習機能はデフォルトでオンだし、これが主流となっている。ただしこれだけだと周知の通り同音異義語で躓くわけだ。思い/想い/重い、作る/創る/造る、三/産/酸、などなど、ほぼ無限に例を挙げられる。直前で使った変換を覚えていない限り、これらの漢字をすぐに出すことはできない。

 

したがって自分がよく使う順番で変換リストが固まっていることが望ましい。1番目と2番目ならば実際にそれが可能である。残念ながら3つ以上の変換候補を好きな順番で固定する方法は無いが、別の手段で解決しうるのであとで説明しよう。

 

Microsoft IMEから脱却し、Google日本語入力を導入しよう

Microsoft IMEには欠点が三つある。

①初期状態の変換リスト (システム辞書) が荒ぶっており、文脈変換の精度が低い。

②スペースキーを押してから変換候補が表示されるまでラグがある。

③不要な変換候補を削除する方法がない。

 

もちろん使い方によってはMicrosoft IMEにも良さはあると思うが、基本的にGoogle日本語入力のほうが優れている。こちらには上記の事柄の逆で

①デフォルトでも変換の制度がかなり高く要修正変換が比較的少ない。

②変換にラグがなく、軽い。

③「抑制単語」登録により、使わない変換をリストから削除できる。

といったメリットがある。

 

というわけで、ここではGoogle日本語入力で学習機能をオフを想定して説明する。

 

システム辞書とユーザー辞書

辞書には二種類ある。我々が普通に編集できるのはユーザー辞書である。一方でIMEの内部にある辞書をシステム辞書といい、こちらを編集することはできない。

システム辞書でどんな単語登録がされているのかを直接知ることはできず、ユーザー辞書内の単語とのバッティングは常に起こりうる。ある単語は名詞登録しただけでリストの一番上にくるのに、別に単語はそうではないといったことが起こるのはこれのせいである。

 

IMEの辞書の作り込み例

変換候補の並び順を覚えると効率が良いという概念は隅野氏のおかげで有名なのだけど、肝心の隅野氏は漢字変換法の詳細までは情報発信しない (企業秘密なのだろう)。

またIME辞書登録自体はよく知られているのに、実際に辞書をどのように作り込んでいるのかなかなか紹介してくれる人がいない。それもしかたなく、辞書には仕事やプライベートに関する単語がびっしり入っているはずで、ふつうの人は公開しようにもできないからだ。

 

ということで私が公開いたしましょう。

めんめんつ辞書20200416.txt - Google ドライブ

ちなみに仕事で使っている辞書はこれとは別にある。

これは私用で使う辞書であり、特に歌詞タイピングゲームをやっていることから皆様があまり使わなそうな単語が目立つが、ともあれ辞書の作り込みの一例としてかなり参考になると思う。テキストデータだと見にくいが、辞書ツールでの表示はこんな感じ。

f:id:menmentsu:20200416220325p:plain

詳しくはこれから説明するが、短縮よみ・独立語・抑制単語といった見慣れない登録があるのが目立ち、まずはこの3つを使いこなす事が重要である。

 

辞書登録のコツ

ここから本題で、Google日本語入力、初期設定、学習機能オフを想定してます。

 

「短縮よみ」は一番上

本来、短縮よみ登録は「ホムポ」→「ホームポジション」、「なまえ」→「モモ・ベリア・デビルーク」のように長すぎて打つのが面倒な場合に使うものだ。

しかし特筆すべき点は短縮よみ登録は変換リストで常に一番上に表示される事である。

 

逆にいえば他の登録、たとえばよく使う単語を名詞登録したとしても常に一番上に表示してくれるとは限らない。きのう→「昨日」を名詞登録しても「機能」が出続ける。これはシステム辞書 (=始めからデフォルトで備わってる辞書) で一部の単語が優先度が高く設定されているためだ (おそらく「機能」も内部的に名詞登録されていて、それとぶつかってるのだと思う)。学習機能オフでシステム辞書を確実に上書きできる唯一の方法が短縮よみ登録なのである。

 

「独立語」は二番目

独立語には変換リストの二番目に表示させたい単語を登録する。独立語は優先度の低い短縮よみ登録のようなもの。

なお短縮よみ登録をしていない読みの単語に対してはシステム辞書との競合となり、挙動が複雑になる。ざっくりいって常用語であれば二番目に表示され、そうでなければ一番目に表示される。

  

「抑制単語」でリストをすっきり

抑制単語には不要な変換候補を入れる。 絶対に使わない漢字や誤変換が怖い単語を登録しよう。

例えば「そうたい」→「相対」を一発で出したいけど一番上には「早退」がある。このようなとき「早退」を抑制単語登録すると「相対」が一番上にくるようになる。絶対に早退しない人ならこれは有効だろう。

私は仕事で「号館」をよく使うのだけど間違って強○が出てしまったら大変なことになるので抑制単語に入れてある。これが本来の抑制機能の使い方だろう。

 

抑制単語登録はひらがなからひらがなに変換される挙動を防ぐことができる。たとえば「りんご」は変換してもひらがなのままでいるので「林檎」を一発で出すことはできない。そういうときに「りんご」を抑制単語に登録する必要がある (多分リンゴも抑制必要)。ひらがなだけを入力したければ変換せずに確定すればよいだけなので、単文節変換しかしないならひらがな変換はまったく必要ない。

なお、抑制単語登録は基本的に他の変換でも適用されるので注意が必要だ。たとえば「りんご」抑制すれば「黄りんご」「紫りんご」も抑制される。一方で青りんご赤りんご緑りんごは出せるので、システム辞書に含まれている単語には適用されないようだけれど、これは例外的と考えてよい。

 

そもそもひらがな変換が何故用意されてているのかというと、多文節変換でひらがなのほうが自然な文節をあえて漢字変換しないようにするためである。たとえば「あなたはてんさい」は「あなたは天才」に変換される。「あなたは」は漢字にしないケースが多いので、システム辞書にこれが登録されているのだろう。

ひらがな変換を抑制単語登録するか、それともあえて残して漢字の短縮よみ登録だけで頑張るか難しいところなのだが、ふつうの単語ではひらがなを抑制し、「みたい」「ところ」「できる」のような日本語文で汎用的であるひらがな単語では抑制しないほうがよいだろう。

   

同様にカタカナ変換を防ぐのも有用だ。そもそも既にカタカナ変換をF7、無変換、Ctrl+iで出している人ならスペースでカタカナ変換する必要がない。たとえば「キミ」は変換リストの上に来やすく「君」が二番目になりがちだ。そこで「キミ」を抑制単語にするとスペースで「君」、無変換キー等で「キミ」というように確実に打ち分けることができる。

とはいえ例えば「ラーメンが」はせっかくまとめて出せるにも関わらずラーメンを抑制すると「ラーメン」を確定してから「が」を打たなければならず、効率的ではなくなる。カタカナ語は外来語はそのままにして、日本語のカタカナ表現のみを抑制単語に入れるのが良いと思う。

 

品詞登録は便利だが短い語句や常用語では注意

短縮よみ登録の欠点は一つの変換にいちいち登録しなければいけないことで、変換時に他の文字が混じっていると適応されないことだ。

その点で従来の品詞登録は便利である。たとえば「倭の国」を名詞登録しておけば「倭の国は」「倭の国に」「倭の国を」などなど、名詞+助詞の変換にも自動的に反映される。動詞登録も便利であり基本形さえ登録しておけば活用形も自動的に反映される。

 

しかし品詞登録の落とし穴はシステム辞書とバッティングしやすいことだ。

たとえば「昨日」を名詞登録しても一番上には「機能」が出続ける。これはシステム辞書の登録が優先されるためと考えられる。

 

また短い語句の登録も注意であり、品詞の派生単語が登録されることで予期せぬ変換まで登録されてしまう。たとえば「知る」を動詞ラ行五段で登録すると「しり」→「知り」が反映され、「尻」は一番目に出なくなる。短い語句の派生単語だと想定外の異なる単語とバッティングしやすい

 

短縮よみ登録に不便を感じたら品詞登録に、品詞登録で不便を感じたら短縮よみ登録に切り替え、試行錯誤しながらどちらがいいか感覚を掴んでいくしかない。

 

名詞登録ばかり使っている人も多いと思うが、動詞登録も便利である。基本形に対して五段活用なら[動詞○行五段]、上一段・下一段活用なら[動詞一段]として登録する。名詞サ変は基本形ではなく名詞の形で登録する (「寝坊する」ではなく「寝坊」を登録)。

 

漢字打ち分けテクニック集

ここまでで変換リストは短縮よみ登録で一番目、独立語登録で二番目が自由に決められると分かったが、それでは三番目以降はどうすればよいのか。

残念ながらGoogle日本語入力で変換リスト三番目以降を好きに指定する方法は存在しない

しかし、もともとスペースを3回以上連打するのも実用的ではないし、また覚えるのもたいへんになるので、同音異義語の多い単語では別の方法でノールック漢字変換を試みたい。ここでは私が知っている範囲で漢字変換のコツを紹介する。

単文節変換

漢字変換の基本は単文節変換で、ここでもこれを暗黙の前提として説明してきた。単文節はだいたい3~6カナ程度であり、このくらいならIMEで変換結果が一つに定まることも多い。また変換を誤ってもバックスペース連打で修正できる範囲である。文節による区切りは発声のリズムとも相性が良いだろう。

単文節変換では対応しきれない変換や漢字の打ち分けについては以下のような補助テクニックがある。

単漢字変換

送り仮名を無視して漢字一字を出すための変換である。たとえば

ごん→言、ちょく→直、り→離、どう→道、おさむ→治、が→我

などがある。これにより「いって」→「行って」、「ごん/って」→「言って」というようにノールックで打ち分けることができる。

タイピング的には打鍵数が増加しがちであるが、それでもノールックで無意識化で変換できることのほうが効率面で重要だ。

 

また、単漢字での読みに拘らず、送り仮名を省いただけの

と→解、ちか→誓、ひろ→拾、で→出、よろこ→歓、したた→滴

などを登録し、変換後に送り仮名を追加するのもよい。たとえば「ちかい」→「近い」、「ちか/い」→「誓い」という要領で打ち分けできる。

 

さらに、濁音化/清音化させて連想しやすい形で登録するのも良い。

ぢ→血、ばなし→話、きつく→気付く、がし→菓子、ざめ→醒

 

マニアックなとこだと、Google日本語入力ではいくつか中国語読みも登録してあり

ふぁ→化、ふぁん→帆、ひゃん→香、ちゅん→春

などは使えそうだ。特に春は「はる」も「しゅん」も同音異義語だらけなので便利である。詳しければ他の中国語を追加しても良い。

 

単漢字変換は短縮よみまたは独立語として登録しよう。品詞として登録すると意味なく活用したり、助詞とセットの変換も追加されて辞書のノイズが増えるのでNGだ。

 

多文節変換

多文節変換は非常にバリエーションが多く全てを網羅して登録するのは非現実的ではあるが、頻出するセットの文節は登録すると便利である。たとえば

やまをこえる→山を越える、かたがうごく→肩が動く、わたしをよんで→私を呼んで

などはまるごと品詞登録してしまおう。これにより「超える」「方が」「読んで」などの誤変換を防げる。

 

日本語では変換前の文字が多くなればなるほど変換後の結果が一意的に定まりやすくなるという傾向があるので、うまく利用しよう。

 

熟語バックスペース

これは高度なテクニックだ。タイピングガチ勢が行っている方法で、正直私は全然使いこなせないのだけど紹介する。

漢字一字だけをピンポイントで出すのは難しいが、熟語とセットなら出せることがある。そういうときは熟語を出してからバックスペースを押せばよい。たとえば

創→創立BS、還→還元BS、視→視野BS

などがある。タイピング的にはかなり複雑であるが、それでも打ち間違いさえしなければ目を瞑ってできるのでポテンシャルは高いのだろう。これらは他の手段が適用しにくいため、漢字変換で迷子になるよりはマシである。

また、熟語の二字目でも一応以下のようにすればよい。

涯→生涯[←]BS[→]、庫→倉庫[←]BS[→]

カーソルキーを駆使するのはあまり現実的ではないから、なにかしらの手段でショートカット登録をするのがよい。 私はかえうちでCtrl+Enterに「Enter」「←」「BS」「→」をマクロ登録している (詳しくは割愛します)。

  

他のテクニックとの比較したときのデメリット

私の主観が入ると思うが、諸手法との比較をしてみる。

ノールック漢字変換

打ち分け方法が1パターンではなく、漢字ごとに最適な方法を覚える必要がある。とはいえ基本的に自分で考えて登録した打ち分け方法が基となるため、人が考えたものを覚えるよりは暗記しやすいだろう。

他方で単文節以内での変換が前提となるためいわゆるまとめ変換とは相性が悪く、細切れでの変換操作が前提となる。

さらに例えば「ごん/って」→「言って」という入力は特に脳内発声ある人には違和感がありそうだ。私は慣れたけれども。

一番の欠点は辞書ツールを開きながら作業しなければならないことだった。最初は大変かもしれない。理想の辞書が完成したらあとは一切編集しなくて良いと思うが、その時はなかなか来ない。書くテーマによって辞書を分けるのもよさそうだ。私は私用と仕事用で分けている。仕事用辞書は1000語程度しか登録してないが専門的な内容とメールくらいしか打たないのでこれで十分だ。一方で私用辞書は現在7300語であり、それでもまだまだ全然未完成という感触である。

 

まとめ変換

多文節変換のうち特に変換文字が長いもので、もっぱらシステム辞書と学習機能に頼るものがまとめ変換である。

日本語は長文になればなるほど同音異義語の誤変換が少なくなるメリットを利用したものだ。

ただし誤変換が減るというのは傾向でしかなく、常に変換後確認作業は必要である。これは無意識化が絶対にできない。

また誤変換したときの修正作業が大変で、カーソルキーや再変換機能を駆使する必要があり、この辺のテクニックは別途必要だ。正確性100%のタイピングだとしても必ず修正作業が伴い、時間と思考のロスとなる。

 

特に変換対象にひらがなのままにしておきたいものがある時は厄介だ。たとえば

「よろしくおねがいいたします」→「宜しくお願い致します」「よろしくお願い致します」「よろしくお願いいたします」

はどのように打ち分けたらよいだろうか。ノールックで打つには単文節変換か辞書登録に頼らなければいけない。

 

予測変換

昨今では非常に実用性が高くなった予測変換。フリック以上に速く入力できないスマホでは必須ともいってよい。

しかし常用文や今までよく打ってきた文でしか活用しにくい。

また、無意識化は不可能で、一字打つたびに常に予測変換結果と照らし合わせなければいけず、タイピングにも集中できないし思考判断と視点移動が大変だ。

 

チャット、ブログ系など、使う単語・構文が限定的になりやすい浅めの文章ではたしかに有用だと思うし、スマホでは大活躍中だ。

 

漢直

未経験なので恐縮だが、漢直のデメリットは以下の3つだろうか。

・覚える量が膨大で、漢字の読み仮名は基本的に役に立たない。

・キーボード配列の幅がきかない。QWERTY前提だったり、専用配列を前提としたものが多い。

・タイピングの打鍵効率が悪くなりうる。

 

今まで覚えてきた漢字の読み仮名を入力に生かさない (連想法もあるらしいが) というところにかなり思い切りがありそうだ。

極端な例だけれど、「魑魅魍魎」は普通の漢字変換なら「ちみもうりょう」と打ってスペースを押せばよいだけである。しかし漢直ではどえらいことになるのではないか。もちろん漢直を使うにしても普通のIMEとの併用が現実的かもしれないが、常に2つの漢字変換システムを並行して想定しながら入力作業するのも大変そうだ。

とはいえ、マスターしたときの無意識化効果はおそらく最大なので、その点で漢直の立場が揺らぐことはなさそう。

  

その他細かいこと

Google日本語入力は文脈変換といって、直前に打つ文字によって次の変換候補が変わることがたまにある。うまく機能しているぶんにはよいが、これにより短縮よみ登録が必要な単語が増えてしまい、少し面倒である。文脈変換はなぜか標準でオフにする機能がないのだが、以下のような手段で一応撲滅できる。

設定は面倒だけれど (かえうち使う方法しか思いつかない)、これしかなかった。マニアック中のマニアックな領域なので無視してくれて構いません。。

 

また、ここではGoogle日本語入力を前提として説明してしまったがMicrosoft IMEでも短縮よみ登録機能はあるため、ある程度は真似できると思う。

 

そういえば最初は学習機能オンにしておいて、ある程度学習させたらオフにする派閥もあるようなので、そちらのほうがお手軽かもしれない。ただしGoogle日本語入力はシステム辞書の自動更新時にバッティングする学習を忘却するらしく、また学習状態の他のPCへの移植・バックアップも面倒なので、これはこれで大変だ。

 

単語登録指針まとめ

以上の事柄をふまえ、私は単語登録作業をだいたい以下のパターンで行っているので参考になればと思う。 f:id:menmentsu:20200418134452p:plain

これは気づいたら自分がそうやってたというだけであり、これが正解ではないので各々で試行錯誤されたい。システム辞書とのバッティングの感覚を掴むと要領が分かると思う。

 

どういう単語をどういった理由でどのように登録しているかは後日例を挙げて説明したい。ただしノールック漢字変換は各個人がオンリーワンの方法を生み出せることがポイントで、人の真似するのは勉強になるけれど重要なのは自分であれこれ辞書をいじれるようになることである。

 

ここまでしてまでノールックで漢字変換したいか?と思われるかもしれないが、「同じように入力すれば同じように変換される」事は偉大であり、学習機能オフでしかこれを体験できない。その枠組のなかでいかに漢字変換を好きに編集して、無意識化するかを考えると上記のようにならざるをえなかった。

それでもGoogle日本語入力は初期設定でもかなり優秀なIMEであり、大部分の漢字変換は学習機能オフにしてても思い通りにできるだろう。たまに変換に戸惑うところがあるから、そういう単語についてだけ対応すればよい。

 

たしかにいろいろと面倒なのだけど、Google 日本語入力の初期システム辞書・学習機能オフの状態でユーザー辞書を編集しまくるというのは漢字変換を無意識化するには最も効率良い方法だと思っている。既存の漢直とは違い、自分がよく使う漢字に注力できるのでオンリーワンの変換システムとなる。IMEや漢直を自分用に1から自作するよりは遥かに簡単だろう。学習機能オンだと常に変換リスト候補が流動的に変化し、常に不安に駆られ、確認操作をせざるをえない。

 

そもそも学習がオンであってもここでの辞書編集技術は役に立つと思うので、そういう世界もあるんだなぁ程度に知っていただるだけでも幸いである。