E-KWICのみをダウンロードされる方はこちら


※上記の広告は60日以上更新のないWIKIに表示されています。更新することで広告が下部へ移動します。

個人保有データ解析のためのE-KWIC

  • E-KWICの仕様に合わせてデータを加工すれば、個人保有のデータに対しても形態素解析済みデータを検索することができます。
  • 以下の手順に従って、操作してください。
  1. こちらからE-KWICをダウンロードする
  2. E-KWIConly.zipを適当なところに解凍する。
  3. E-KWICの使い方の詳細は同梱の「E-KWICマニュアル.pdf」をご覧ください。
  4. dataフォルダ内に形態素解析済みデータを入れてください。以下の二点に留意してください。
    1. 茶筌(Chasen)」で形態素解析したデータを入れてください。
    2. ファイル名は「必ず」KYコーパスの規定に従ってください。
KYコーパスでは「ENM02」といったような、「3つのローマ字+2桁の数字」という番号がついていますが、その1つめのローマ字は、その被験者の母語を表しています。中国語ならC、英語ならE、韓国語ならKです。そして、2つめのローマ字は、OPIにおける言語能力の判定結果を表しています。初級(Novice)ならN、中級(Intermediate)ならI、上級(Advanced)ならA、超級(Superior)ならS です。3つめのローマ字はサブレベルを表しており、「-下(low)」ならL、「-中(mid)」ならM、「-上(high)」ならHです。ただし、超級にはサブレベルはありません。また、上級も、ただの「上級」と「上級-上」の2つに分かれているのみです。ですから、「超級」と、ただの「上級」の場合には、「3つのローマ字+2桁の数字」ではなく、「2つのローマ字+2桁の数字」になっています。最後の「2桁の数字」は、同じ母語で同じレベルのものの中での通し番号です。(KYコーパスのreadme.txtより引用)