Home > 2007年12月10日
2007年12月10日
スペル修正プログラムをJavaScriptで再現&改悪してみた
- 2007-12-10 (Mon)
- JavaScript
いつか読むとtaggingしたまま放置して、ようやく読んだ
スペル修正プログラムはどう書くか(原文はこっち)。
僕もJavaScriptで同じようなものを作ってみました。
(途中まで読んだ速効!Pythonプログラミングが一応役に立った・・・かな?)
仕組みは原文の通り。
ド文系の僕でも読めたので、興味のある人は是非。オススメです。
前半の数式で一瞬怯みますが、ちゃんと文章でも解説してくれてます。
簡単に説明すると、
- トレーニング
- 英文に出現する単語&出現数を記憶する。 -
タイポ生成
- 入力内容の1字違い&2字違いの全パターンを生成。 - 候補提示
- タイポと記憶した単語を照合し、出現数が最も多いものを候補とする。
って感じです。
ただ、僕のはもっとショボいです。
まず、1文字違いしか考慮してません。(2字違いを計算するとかなり重かった)
あと、10語/sなんてとんでもありません、ムリです。
さらに、精度も駄目です。(流石に6Mのテキストをjsに読ませるわけにはいきません・・・・)
※ 代わりと言ってはなんですが、複数の候補を返せるようにしてみました。
とまぁ、グダグダながらも一応完成。
それを使ったサンプルも作成中。
近日公開!
・・・すいません、大袈裟です。
それでは、今日は以上です。
参考記事とソース(結構長い)は続きに入れます。
PR
Home > 2007年12月10日
- Search
-
Loading
- Feeds
- Links
- スポンサードリンク
