KWIC Finder使用レポート


※上記の広告は60日以上更新のないWIKIに表示されています。更新することで広告が下部へ移動します。

基本的な使用の手順

  1. 検索するコーパスデータ(フォルダかファイル)を指定する.
  2. 検索する文字列を入力する.
  3. 必要であれば検索条件を指定する.

どんな検索ができるか

  1. 単純な文字列の検索:コーパスから探したい文字列(例「パソコン」)を抽出する.検索結果は保存し,エクセルで分析ができる.
  2. 二つ以上の異なる文字列の検索:AND/OR/NEAR/NOTを用いて,2つ以上の検索語同士の共起条件を指定することができる.NEARは,指定した行数内で二つの語が共起していれば、一致とみなして抽出することができる。
  3. 一致方式を選択して検索:検索語を部分/前方/後方/完全一致の中から指定して検索できる.部分一致以外は単語レベルで一致するものが抽出される.例えば,後方一致で「~的」という接尾辞を探したり,完全一致では独立した単語(例「本」)を探すことができる.
  4. 正規表現を使った文字列の検索:正規表現を用いた文字列検索にも対応している.例えば,動詞の活用で「~と思{う/い/って/わない}」など,正規表現を使えば一つずつ検索する手間を省くことができる(例"と思[ういっわ]").
  5. 同義語検索:二つ以上の異なる文字列を同義語とする.例えば,表記が異なる語(「終る/終わる」など)を同義語に設定すると,同義語のいずれかを検索文字列に入力すれば全て抽出される.OR検索の設定がいちいち面倒な時に利用できる.
  6. その他:フレーズ検索,絞込み検索などの検索機能やオプションがあるので,目的に応じて組み合わせて使用できる.

問題点など

  1. 一致検索なので検索する品詞の指定ができない.例えば助詞「は」の検索では,「は」を含む他の文字列(例「はやく」)も抽出されてしまう.
  2. 一文内での共起関係を検索するのが困難である。