大量の文書から1秒で検索する

全文検索エンジン「俊司」

 パソコンなどで文書を一元的に管理するための全文検索エンジンです。
 単語はもちろん、30文字までならば文字列の完全一致で検索できます。しかも検索もれが全くありません。
 データベース特有のめんどうな設計もいらず、すぐに導入できます。


特長
超高速検索 100万件の文書を1秒以内に検索します。
記事の件数が増えても検索速度はほとんど変わりません。
インデックスがコンパクト データ登録/更新時のインデックス作成も高速です。
CD-ROMにも組み込み可能。実績もたくさんあります。
検索式不要 電卓感覚で検索条件を入力すればよく、検索式を書く必要はありません。操作を間違えたときに取り消す機能もあります。
検索結果の数が多すぎたり少なすぎたりしたときには、AND、OR、NOTの操作で追加、削除ができます。
例えば「京都」という言葉で検索してみたら「東京都」という言葉を含んでいる文書が混ざっていた。そこで「東京都」という言葉を含んでいる文書を捨てたいというときには、検索結果に「NOT 東京都」の操作で簡単に削除できます。
同義語辞書 12万語の同義語辞書が付属しています。この同義語辞書の機能を設定すると 、ほかの書き方で書いてある文書も探し出します。例えば、「アメリカ」を表す 言葉 には「アメリカ合衆国」「U.S.A.」「米国」「米」「合衆国」「アメリカ州」「米州」などいろいろあります。「アメリカ」で検索したときに、「アメリカ」の同義語で書かれている文書も探し出します。また、「インターフェ ース」「インタフェース」「インターフェイス」「インタフェイス」や「打ち合わせ」「打ち合せ」「打合せ」「打合わせ」「打合」のような表記の異なる言葉 も検索できます。ユーザー語の登録機能や学習機能もあります。

機能
分野指定の検索機能 見当違いの分野の文書を検索してしまうことを防ぐために、文書を登録するときに例えば政治、経済、科学などの分野を指定しておいて、特定の分野の文書だけを検索できます。1つの文書を複数の分野に登録できます。また複数の分野を指定しての検索jもできます。分野はディレクトリ構造とは無関係に設定できます。
セキュリティ機能 パスワードによる管理ができます。
機密保持のため文書によって読める人を限定できます。さらにシステムを保護するため人によって使える機能を制限できます。
更新機能 前回の更新後に変更された文書だけを登録できます。
指定された期日より古い文書の登録を抹消できます。
記事中の文字の扱い方

 下記オプションも用意しています。

全角/半角文字の区別をする/しない
大文字/小文字の区別をする/しない
全角や半角の空白を無視する/しない
中点(・)コードを無視する/しない
改行(CR) コードを無視する/しない
タブ(TAB) コードを無視する/しない

用途
インターネットの記事検索
新聞社の記事検索
図書館の蔵書検索
特許情報の検索
判例集、法律集検索(CD-ROM)
グループウエア
ヘルプデスク
SFA(Sales Force Automation)
ナレッジマネジメント
CD-ROM出版物の本文記事検索
大量のテキスト文書の検索

応用事例
河北新報記事データベース 「KD(カーデー)」(河北新報社)

雑誌記事検索(PDFinderCD-ROM検索)「日経BP書店」(日経BP社) 

関連ソフト
「俊司くん」

「俊司forWeb」

資料
全文検索

お問い合わせ・ご購入はこちらへ

株式会社 言語工学研究所