N-Gram?型のインデックスを作る
データーベースに検索システムを持たせることに成りました。
N-Gram巻末を持たせることにしましょう。
N-Gram自体は単なる組み合わせなので、目茶苦茶簡単な部類ですが、インディックスの内容は検索頻度の高いものが
先頭にくるように工夫してあげたり。インデックスの更新のストレスを減らす努力をするなどを考えると、
拡張性豊かな設計が望まれると思います。 ここらへんは気長にやるとしますか。
その他の予定
- n-Gram検索エンジンである
- データベースはネットワーク型データーベースにする。
- 接続する機器はすべて全文検索できる程度の能力を持っていることを想定
- 使いやすさとインターフェイスはBobyの意見を聞く。
発展的な課題。
- コミュニケーションが取れるデーターベース作り
- パフォーマンスが低下しいる、または活動を停止しているコンピューターをうまく避けてパフォーマンスを維持するシステムの構築
- 特化した内容にカスタマイズした機能は高度に抽象化してあげて汎用性をもたせる。
- 多くの形式に対応させる。
- 文字の問題が大変そう。