コーパス日本語学のための情報館
http://w.atwiki.jp/corpus-ling/
コーパス日本語学のための情報館
ja
2013-04-18T23:23:14+09:00
1366294994
-
0207
https://w.atwiki.jp/corpus-ling/pages/75.html
*教材ドメイン名に関する投票フォーム
1.拠点で開発中の日本語教材「つくば日本語eラーニング」のドメイン名について「良い!」と思うほうに投票をお願いします。
#vote(http://e-nihongo.tsukuba.ac.jp[15],http://e-japanese.tsukuba.ac.jp[1])
2.補足情報
-e-nihongoは、「http://www.e-nihongo.net/」というサイトがすでに存在します。tsukuba.ac.jpドメインでは存在しませんので、ドメインの取得には影響しません。
-e-japaneseも、「http://www.e-japanese.jp/」というサイトがすでに存在します。tsukuba.ac.jpドメインでは存在しませんので、ドメインの取得には影響しません。
3.投票がおわった方は、足跡を残してください。
- 投票しました。よろしくお願い致します。 -- 李 (2013-02-08 09:16:14)
- 投票しました。どうぞよろしくお願い致します。 -- 朴 眞煥 (2013-02-08 10:03:57)
- 投票しました。下のほうのURLにはつながりませんでした。 -- 酒井 (2013-02-08 13:26:04)
- 投票しました。よろしくお願いいたします。 -- 堀 聖司 (2013-02-09 00:16:06)
- 120417isc -- ISC (2013-04-12 10:07:34)
#comment
2013-04-18T23:23:14+09:00
1366294994
-
研修会
https://w.atwiki.jp/corpus-ling/pages/74.html
*2013年12月21日 研修会参加宣言フォーム
-16:45開始
-E教室
**投票(クリック)をお願いします。
#vote(参加します[4],たぶん参加します[0])
**足後を残す
- ぜひ参加させてください。 -- 段 (2012-12-13 15:23:52)
- 楽しみにしています -- 加納千恵子 (2012-12-13 16:52:44)
#comment
2012-12-17T08:25:44+09:00
1355700344
-
コーパス紹介(学習者)
https://w.atwiki.jp/corpus-ling/pages/73.html
サイト移転しました。
[[http://jhlee.sakura.ne.jp/>http://jhlee.sakura.ne.jp/]] から御覧ください。
#contents()
----
*はじめに
+現在、日本国内で比較的に低コストで入手可能なコーパス・言語資源の概要と入手方法を紹介します。
*話し言葉を収録した学習者コーパス
**日本語学習者会話データベース
+内容:9日本語学習者とテスターの会話データ390件。学習者の属性情報とレベル判定付
+入手方法:ウェブ上で利用。要認証[[https://dbms.ninjal.ac.jp/nknet/ndata/>https://dbms.ninjal.ac.jp/nknet/ndata/]]
**KYコーパス(第二言語としての日本語学習者の話し言葉)
+内容:90人分のOPIテープを文字化した言語資料である。90人の被験者を母語別に見ると、中国語、英語、韓国語がそれぞれ30人ずつであり、さらに、その30人のOPIの判定結果別の内訳は、それぞれ、初級5人、中級10人、上級10人、超級5人ずつある。
+入手方法:利用申請書を郵送する。詳細は[[こちら>http://opi.jp/shiryo/ky_corp.html]]
**CHILDES(The Child Language Exchange System)
+内容:国際的な言語獲得研究のためのデータベースプロジェクトです。日本語幼児のデータもあります。解析用のツールも公開されています。
+入手方法:ウェブページからダウンロード。[[詳細はこちらから>http://childes.psy.cmu.edu/index.html]]
+関連文章: [[宮田Susanne 編 Brian MacWhinney 監修(2004)『今日から使える発話データベースCHILDES入門』ひつじ書房>http://www.amazon.co.jp/%E4%BB%8A%E6%97%A5%E3%81%8B%E3%82%89%E4%BD%BF%E3%81%88%E3%82%8B%E7%99%BA%E8%A9%B1%E3%83%87%E3%83%BC%E3%82%BF%E3%83%99%E3%83%BC%E3%82%B9CHILDES
2013-05-28T00:22:54+09:00
1369668174
-
コーパス紹介(母語話者)
https://w.atwiki.jp/corpus-ling/pages/72.html
サイト移転しました。
[[http://jhlee.sakura.ne.jp/>http://jhlee.sakura.ne.jp/]] から御覧ください。
#contents()
----
*はじめに
+現在、日本国内で比較的に低コストで入手可能なコーパス・言語資源の概要と入手方法を紹介します。
+主に現代語の研究を想定したものです.
*書き言葉
**現代日本語書き言葉均衡コーパス
+内容:1億語規模の現代日本語の書き言葉コーパス。利用方法は3つ
+利用方法1(オンラインコーパスツールで利用)
++[[少納言>http://www.kotonoha.gr.jp/shonagon/search_form]]:文字列検索のみ対応,データのダウンロード不可
++[[中納言>https://chunagon.ninjal.ac.jp/]]:文字列検索,品詞による検索,長単位検索,データのダウンロード可
++[[NINJAL-LWP for BCCWJ>http://ninjal-lwp-bccwj.ninjal.ac.jp/]]:辞書引き的に使えるオンラインコーパスツール,データのダウンロード不可
+利用方法2(DVDで利用):[[コーパス開発せんたーBCCWJ>http://www.ninjal.ac.jp/corpus_center/bccwj/apply/]]
**青空文庫
+内容:ネット上の電子図書館『青空文庫』の公開作品を一枚に収録しています。
+入手方法1:「蔵書○○○○」という形で毎年更新版を500円で販売しています。現在は完売に購入はできないようです。
+入手方法2:『インターネット図書館 青空文庫』を購入するとDVD-ROM(青空文庫4843作品ほか収録)が付いてきます。
+関連論文:[[夷石寿賀子, 千葉 庄寿, 陳君慧 (2006)「『青空文庫』を言語コーパスとして使おう―メタデータ構築による歴史的・社会言語学的研究への応用の試み―」(言語処理学会第12回年次大会 (NLP2006) 発表論文集 pp.915-918)>http://www.fl.reitaku-u.ac.jp/LINC/projects/langTech/pub/nlp2006.pdf]]
+茶漉による青空
2013-05-28T00:22:40+09:00
1369668160
-
corp-book
https://w.atwiki.jp/corpus-ling/pages/71.html
#search2(submit=論文検索,or,title=キーワード,)
----
|キーワード1|キーワード2|著者|発行年|論文名|ジャーナル名|出版元|使用コーパス|分析手法|備考|種別|
|日本語学|文法論|佐治伸郎|2007|TextImiを用いた言語研究の事例|日本認知言語学会論文集(7),pp.524-527.|日本認知言語学会|産経新聞|頻度分析|分析ツール: TextImi|研究論文|
|日本語学|意味論|濱野寛子,李在鎬|2007|助数詞「本」のカテゴリー化に関する一考察|南雅彦(編著), 言語学と日本語教育(5), pp.73-90|くろしお出版|読売新聞|クラスタ分析|NULL|研究論文|
|日本語学|文法論|南部智史|2007|定量的分析に基づく「が/の」交替再考|言語研究(131), pp.115-150|日本言語学会|国会会議録|クロス表,ロジスティック回帰分析|NULL|研究論文|
|日本語学|文法論|荻野綱男|2006|形容動詞連体形における「な/の」選択について: 田野村氏の結果を WWW で調べる|計量国語学(25)7, pp. 309-318|計量国語学会|ウェブコーパス|頻度分析|NULL|研究論文|
|日本語学|文法論|加藤晴子|2006|中日対訳コーパスにみる"来""去"と「くる」「いく」の対応状況|応用言語学研究8, pp. 87~104|明海大学大学院応用言語学研究科|中日対訳コーパス(北京日本学研究センター)|記述分析|NULL|紀要論文|
|日本語学|文法論|玉岡賀津雄|2006|「決定木」分析によるコーパス研究の可能性: 副詞と共起する接続助詞「から」「ので」「のに」の文中・文末表現を例に|自然言語処理(13)2, pp.169-179|言語処理学会|新潮文庫100冊|決定木分析|分析ツール: AnswerTree(SPSS)|研究論文|
|日本語学|文法論|洪雅瑛|2006|台日対訳コーパスから見た数量詞使用に関する研究|電子情報通信学会技術研究報告. TL, 思考と言語(106)363, pp. 37-42|情報処理学会|光華雑誌コーパス|頻度分析|NULL|研究論文|
|日本語学|文法論|李在鎬,黒田航,大谷直輝,井佐原均|2006|名詞との共起関係に基づく構文の定義|日本認
2010-03-04T14:52:22+09:00
1267681942
-
0223
https://w.atwiki.jp/corpus-ling/pages/70.html
*2月23日講演のためのアンケート
1.皆さんのOSのバージョンについて教えてください。あなたのPCのOSはどれですか。該当するものに「投票」ボタンをクリックしてください。
#vote(Windows XP[10],Windows Vista[3],Windows 7[1])
2.MSオフィスのバージョンについて教えてください。あなたのPCのオフィスのバージョンはどれですか。
#vote(MS office XP[3],MS office 2003[5],MS office 2007[5])
3.エクセルの関数について教えてください。自分の状況にもっとも近いと思われるものに「投票」してください。
#vote(よく使っている[1],少し使ったことがある[11],聞いたことはあるが使ったことはない[2],聞いたことも使ったこともない[0])
4.あなたは、[[2009年10月の李の講演会>http://www.dc.ocha.ac.jp/dics-jacs/lecture/lec20091020/]]に参加しましたか。
#vote(参加した[5],参加していない[9])
2010-02-23T11:42:37+09:00
1266892957
-
コメント/TLC
https://w.atwiki.jp/corpus-ling/pages/69.html
-曜日については土曜日の最後で固定するのが良いと思います。 - 李 2009-06-10 17:39:05
--場所については、新宿でよければ、基金の会議室も利用できるし、浦和の基金の会議室を使うこともできます。 - 李 2009-06-10 17:41:11
-毎月最終土曜日、場所は新宿が皆さん便利かと思います。東京学芸大学でも会場は提供できます。よろしくお願いします。 - 岡 智之 2009-06-11 10:32:09
2009-06-11T10:32:08+09:00
1244683928
-
TLC
https://w.atwiki.jp/corpus-ling/pages/68.html
#pcomment(reply)
2009-06-10T17:21:39+09:00
1244622099
-
Ngram検索
https://w.atwiki.jp/corpus-ling/pages/67.html
-使い方
+IDとパスワードを入力する.IDは「Ngram」,パスワードは「enuguramu」
+検索対象のコーパスを選択する.
+検索したいキーワードを入れる.
+各コーパス内での集計結果が表示される.
#元データは復元できませんので,ご了承ください.
-こちらから入ってください
**[[http://jhlee.sakura.ne.jp/ngram_search/>http://jhlee.sakura.ne.jp/ngram_search/]]
-格納データの詳細
|コーパス名|タイプ頻度|トークン頻度|
|教科書初中級| 33016| 152418|
|教科書中上級| 15552| 65238|
|教科書上級| 92553| 495259|
|KYコーパス初級| 1419| 5464|
|KYコーパス中級| 5765| 26519|
|KYコーパス上級| 19958| 106225|
|KYコーパス超級| 12208| 62092|
|NHKコーパス| 401772| 2093727|
|新書| 299370| 2263322|
|新聞| 318570| 3353092|
+教科書とは,日本語学習者向けの教科書のことです.全部で70種類ほどです.内部開発のもので,一般には流通していません.ご了承ください.
+新聞データは「[[日英新聞記事対応付けデータ>http://www30.atwiki.jp/corpus-ling/pages/17.html#id_fcbdff91]]」を使っています.
+新書とNHKコーパスは内部開発のもので,一般には流通していません.ご了承ください.
-あなたはこのページの&counter()番目の閲覧者です。
2009-05-29T21:43:42+09:00
1243601022
-
日本語コーパスから抽出した形容詞の語彙表
https://w.atwiki.jp/corpus-ling/pages/66.html
*はじめに
-複数の日本語コーパス形容詞の活用別出現頻度をまとめた資料です。
-データ本体はエクセル形式(2003バージョン)になっております。
-[[こちらからダウンロードしてください。>http://jhlee.sakura.ne.jp/geo-backup/J-corpus/Jcorp-Adj-v1.xls]]
-関連論文:[[小川典子・李在鎬・土屋智之・横森大輔(2008)「コーパス調査による形容詞の連体形と連用形の頻度」,2008日本語教育学会国際研究大会>http://jhlee.sakura.ne.jp/geo-backup/jcpdf/ICJLE20080420final.pdf]](韓国,ブサン)
----
-あなたはこのページの&counter()番目の閲覧者です。
----
----
2009-05-09T23:37:50+09:00
1241879870