Home > 2007年12月10日

2007年12月10日

スペル修正プログラムをJavaScriptで再現&改悪してみた

いつか読むとtaggingしたまま放置して、ようやく読んだ
スペル修正プログラムはどう書くか原文はこっち)。

僕もJavaScriptで同じようなものを作ってみました。
(途中まで読んだ速効!Pythonプログラミングが一応役に立った・・・かな?)

仕組みは原文の通り。

ド文系の僕でも読めたので、興味のある人は是非。オススメです。
前半の数式で一瞬怯みますが、ちゃんと文章でも解説してくれてます。

簡単に説明すると、

  • トレーニング
    - 英文に出現する単語&出現数を記憶する。
  • タイポ生成
    - 入力内容の1字違い&2字違いの全パターンを生成。
  • 候補提示
    - タイポと記憶した単語を照合し、出現数が最も多いものを候補とする。

って感じです。

ただ、僕のはもっとショボいです。

まず、1文字違いしか考慮してません。(2字違いを計算するとかなり重かった)
あと、10語/sなんてとんでもありません、ムリです。
さらに、精度も駄目です。(流石に6Mのテキストをjsに読ませるわけにはいきません・・・・)
※ 代わりと言ってはなんですが、複数の候補を返せるようにしてみました。

とまぁ、グダグダながらも一応完成。

それを使ったサンプルも作成中。

近日公開!

・・・すいません、大袈裟です。

それでは、今日は以上です。

参考記事とソース(結構長い)は続きに入れます。

PR

Continue reading

Home > 2007年12月10日

Search
Loading
Feeds
Links
スポンサードリンク

Page Top