コーパス日本語学のための情報館
http://w.atwiki.jp/corpus-ling/
コーパス日本語学のための情報館
ja
2013-06-27T13:49:11+09:00
1372308551
-
KWICツール(E-KWIC)
https://w.atwiki.jp/corpus-ling/pages/57.html
*引越しました。http://jhlee.sakura.ne.jp/
*「タグ付きKYコーパス」(Ver 2.0)と検索ツール「E-Kwic」の配布に関する案内ページ
**お知らせ(2013.5.27)
- これまでエクセルで仕様できるシステムとして「タグ付きKYコーパス」を配布してきました。
- しかし、OSのバージョンアップおよびエクセルのバージョンアップで利用できなくなるケースが多発してまいりました。
- ウェブブラウザでOSやオフィスのバージョンに関係なく利用できるシステムを作成しました。
- これに伴い、「タグ付きKYコーパス」(Ver 2.0)と検索ツール「E-Kwic」を停止致します。
- ウェブ版の「タグ付きKYコーパス」は[[こちらから入ってください>http://jhlee.sakura.ne.jp/kyc/]]。
----
-あなたはこのページの&counter()番目の閲覧者です。
----
2013-06-27T13:49:11+09:00
1372308551
-
管理者
https://w.atwiki.jp/corpus-ling/pages/52.html
*http://jhlee.sakura.ne.jp に引越しました。
*http://jhlee.sakura.ne.jp に引越しました。
*http://jhlee.sakura.ne.jp に引越しました。
**李在鎬
-[[筑波大学・人文社会系・准教授>http://www.trios.tsukuba.ac.jp/Profiles/0001/0007486/profile.html]]
-- 独)国際交流基金日本語試験センター専門研究員/桜美林大学国際研究科研究員(2011.8.31退職しました)
-- 2009.4に情報通信研究機構(NICT)を退職しました。→"jhlee@nict.go.jp"は使用できません。jhlee.n (at-mark) gmail.comにご連絡ください
- 博士(人間環境学)、京都大学
- 専門:コーパス言語学、認知言語学、第二言語教育
- 所属学会:日本認知科学会,日本教育工学会,日本認知言語学会、計量国語学会(理事2011~)、日本言語学会(広報委員2009~)、言語処理学会(大会委員2009)、関西言語学会、日本語用論学会,日本語教育学会
- 主催する研究会:[[東京言語学コロキウム(TLC)>http://www15.atwiki.jp/tlc-ken/]]
#ref(http://jhlee.sakura.ne.jp/geo-backup/leepic-small.jpg)
*研究プロジェクト(進行中)
1. 国立国語研究所共同研究プロジェクト(2010年~)
--研究課題名:[[コーパス日本語学の創成プロジェクト>http://www.ninjal.ac.jp/research/project/a/sousei/]]
--分担内容:コーパスデータの統計的評価
2. 科学研究費補助金 (分担者)(2011~2014年度)
--研究種目と分野:基盤研究(A) 日本語教育
--研究課題名:汎用的日本語学習辞書開発データベース構築とその基盤形成のための研究
--研究代表者:砂川 有里子(筑波大学)
3. 科学研究費補助金 (分担者)(2011~2013年度)
--研究種目と分野:基盤研究(C) 言語学
--研究課題名:感覚語彙の歴史的変化における構文と意味の相互関係:認知類型論的コーパス対照研究
--研究代表者:進藤三佳(京都外国語大学)
4. 科学研究費補助金 (分担者)(2012~2016年度)
--研究種目と分野:基盤研究(A) 日本語教育
--研究課題名:海外連携による日本語学習者コーパスの構築-研究と構築の有機的な繋がりに基づいて-
--研究代表者:迫田久美子(国立国語研究所)
5. 科学研究費補助金 (分担者)(2012~2015年度)
--研究種目と分野:基盤研究(C) 教育工学
--研究課題名:Webから獲得した言語知識をベースとするインタラクティブな外国語学習法の開発
--研究代表者:野澤元(京都外国語大学)
6. 科学研究費補助金 (代表者)(2013~2015年度)
--研究種目と分野:基盤研究(C) 日本語教育
--研究課題名:読解教育支援を目的とする文章難易度判別システムの開発(課題番号:25370573)
7. 科学研究費補助金 (分担者)(2013~2015年度)
--研究種目と分野:基盤研究(B) 日本語教育
--研究課題名:多言語背景の児童を対象とした多層分岐適応型日本語力診断オンラインテストの開発
--研究代表者:酒井たか子(筑波大学)
*研究プロジェクト(終了)
1. 博報『[[第二回ことばと文化・教育>http://www.hakuhodo.co.jp/foundation/subsidy/index.html]]』研究助成 グループ研究(代表)(2007年度)
--研究代表者:李在鎬
--研究課題名:定量的手法に基づく日本語の記述的研究:教育的応用の観点から
2. 科学研究費補助金(代表) (2007~2008年度)
--研究種目と分野:若手研究(B) 日本語学
--研究課題名:コーパス分析に基づく認知言語学的構文研究と日本語教育文法へ
3. 科学研究費補助金(分担者)(2008年度)
--研究種目と分野:特定領域研究 [[日本語コーパス(公募班)>http://www.tokuteicorpus.jp/]]
--研究課題名:日本語コーパスを応用した文章の難易測定の研究(課題番号:19011003)
--研究代表者:柴崎秀子(長岡技術科学大学)
4. 科学研究費補助金 (分担者)(2008~2009年度)
--研究種目と分野:基盤研究(B) 外国語教育
--研究課題名:韓国語語彙データベース構築と外国語サイバー・ユニバーシティ用韓国語WEB辞書開発(課題番号:19320082)
--研究代表者:曹 美庚(九州大学)
5. Korean Studies Grant 2008 (分担者)(2008年度)
--研究課題名:韓国語学習者のコーパス構築→[[成果物>http://www12.atwiki.jp/kccorpus/]]
--研究代表者:林 炫情(山口県立大学)
6. 田島毓堂語彙研究基金 (代表)(2009~2010年)
--研究課題名:コーパス基盤の用例辞書構築について
7. 科学研究費補助金(研究成果公開促進費)(2010~2011年度)
--研究種目と分野:学術図書 (言語学)
--研究課題名:コーパス分析に基づく認知言語学的構文研究(課題番号:225076)
8. 国立国語研究所共同研究プロジェクト(2010年~)
--研究課題名:[[日本語学習者用基本動詞用法辞典の作成>http://www.ninjal.ac.jp/research/project/bc/youhoujiten/]]
--分担内容:日韓対照グループ、ウェブ展開グループ
9. 科学研究費補助金 (代表者)(2010~2012年度)
--研究種目と分野:基盤研究(C) 日本語教育
--研究課題名:自然言語処理の技術を利用したタグ付き学習者作文コーパスの開発(課題番号:22520537)
--[[研究成果を見る(コーパスを使う)>>http://www34.atwiki.jp/jccorpus/]]
10. 科学研究費補助金 (分担者)(2010~2012年度)
--研究種目と分野:基盤研究(C) 日本語教育
--研究課題名:日本語教育のためのコーパスに基づく文法項目データベース構築と検索システムの公開
--研究代表者:堀 恵子(東洋大学)
11. 科学研究費補助金 (分担者)(2011~2012年度)
--研究種目と分野:基盤研究(C) 日本語教育
--研究課題名:大規模試験としての日本語口頭能力測定における評価システムに関する研究
--研究代表者:野口 裕之(名古屋大学)
*研究業績一覧
-できるだけPDFで閲覧可能なようにしていますが、共著論文の一部は諸事象により、公開していません。お読みになりたい方は[[問い合わせ]]フォームにてご連絡いただければ、現物を発送することもできます。
**著書
+李 在鎬(2003)「認知事象の複合的制約に基づく結果構文再考:構文現象の体系的記述を目指して」、[[『認知言語学論考』No.3>http://www.amazon.co.jp/%E8%AA%8D%E7%9F%A5%E8%A8%80%E8%AA%9E%E5%AD%A6%E8%AB%96%E8%80%83%E3%80%88No-3%E3%80%89-%E5%B1%B1%E6%A2%A8-%E6%AD%A3%E6%98%8E/dp/489476220X/ref=sr_1_12/503-2011803-5012727?ie=UTF8&s=books&qid=1190615167&sr=1-12]]、ひつじ書房、pp.183-262.
+黒田 航・李 在鎬(2007)「Pattern Matching Analysis (PMA) を用いた日本語の結果構文の共述語分析」、小野 尚之 (編)[[『結果構文研究の新視点』>http://www.hituzi.co.jp/books/346.html]] ひつじ書房.
+李在鎬(2010)『認知言語学への誘い』[[開拓社 言語・文化選書>http://www.kaitakusha.co.jp/book/sensho.html]]・・・[[アマゾンへリンク>http://www.amazon.co.jp/gp/product/4758925178/ref=s9_wishf_gw_i1?ie=UTF8&coliid=I3E7BOABAST8YR&colid=MUGSZ2IKUJNR&pf_rd_m=AN1VRQENFRJN5&pf_rd_s=right-csm-2&pf_rd_r=05HPPXHJSEZBG6MM82E1&pf_rd_t=101&pf_rd_p=477470556&pf_rd_i=489986]]
+[[中本敬子・李在鎬(編著)、辻幸夫(監修)(2011)『認知言語学研究の方法 内省・コーパス・実験』ひつじ書房>http://www.hituzi.co.jp/hituzibooks/ISBN978-4-89476-520-7.htm]]
+[[李在鎬(2011)『コーパス分析に基づく認知言語学的構文研究』ひつじ書房(科学研究補助金 成果公開促進費による出版物)>http://www.hituzi.co.jp/hituzibooks/ISBN978-4-89476-531-3.htm]]・・・[[アマゾンリンク>http://www.amazon.co.jp/%E3%82%B3%E3%83%BC%E3%83%91%E3%82%B9%E5%88%86%E6%9E%90%E3%81%AB%E5%9F%BA%E3%81%A5%E3%81%8F%E8%AA%8D%E7%9F%A5%E8%A8%80%E8%AA%9E%E5%AD%A6%E7%9A%84%E6%A7%8B%E6%96%87%E7%A0%94%E7%A9%B6-%E3%81%B2%E3%81%A4%E3%81%98%E7%A0%94%E7%A9%B6%E5%8F%A2%E6%9B%B8-%E8%A8%80%E8%AA%9E%E7%B7%A8-%E6%9D%8E-%E5%9C%A8%E9%8E%AC/dp/4894765314/ref=sr_1_3?ie=UTF8&qid=1300769874&sr=8-3]]
+[[李在鎬(2012)「IT質問調査の実践」荻野綱男・田野村忠温(編)『講座 ITと日本語研究8 質問調査法と統計処理』明治書院>http://www.meijishoin.co.jp/book/b99268.html]]
+[[近藤安月子・小森和子(編)(2012)『日本語教育事典』「15.コーパス」を担当>http://www.kenkyusha.co.jp/purec/#ISBN978-4-7674-9109-7]]
+李在鎬(2012)「コーパス分析に基づく構文研究」[[『ひつじ意味論講座 第2巻 構文と意味』(澤田治美 編)、ひつじ書房>http://www.hituzi.co.jp/hituzibooks/ISBN978-4-89476-502-3.htm]]
+[[李在鎬、石川慎一郎、砂川有里子(2012) 『日本語教育のためのコーパス調査入門』くろしお出版>http://www.9640.jp/xoops/modules/bmc/detail.php?book_id=39237&prev=new]]
+李在鎬・柴崎秀子(2012)「文章の難易度と語彙の関連性に関する考察~学年の違いを特徴づける語彙的要素とは何か~」『コーパスとテキストマイニング』(共立出版)【[[アマゾンリンク>http://www.amazon.co.jp/%E3%82%B3%E3%83%BC%E3%83%91%E3%82%B9%E3%81%A8%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88%E3%83%9E%E3%82%A4%E3%83%8B%E3%83%B3%E3%82%B0-%E7%9F%B3%E7%94%B0-%E5%9F%BA%E5%BA%83/dp/4320110331]]】
+李在鎬(2013)「日本語学習者における助数詞の習得について:コーパス解析に基づくアプローチ」児玉一宏・小山哲春(編)『言語の創発と身体性』(ひつじ書房)pp.565-582
#ref(http://jhlee.sakura.ne.jp/izna.jpg,height=200,width=115)
#ref(http://www.hituzi.co.jp/hituzibooks/img/9784894765313.jpg,height=220,width=120)
#ref(http://www.hituzi.co.jp/hituzibooks/img/9784894765207.jpg,height=220,width=120)
#ref(http://www.hituzi.co.jp/hituzibooks/img/489476220X.jpg,height=220,width=120)
#ref(http://www.meijishoin.co.jp//images/book/99268.jpg,height=220,width=120)
#ref(http://www.kenkyusha.co.jp/purec/images/7674-9109b.jpg,height=220,width=120)
#ref(http://www.bookmailclub.com/bmc/img/book_39237.jpg,height=220,width=120)
#ref(http://www.hituzi.co.jp/hituzibooks/img/9784894765023.jpg,height=220,width=120)
#ref(http://ec2.images-amazon.com/images/I/41DKO3eB%2BVL._SL500_AA300_.jpg,height=280,width=170)
**論文
+李 在鎬(2001)「他動詞文のゆらぎ現象に関する構文的アプローチ」,『言語科学論集』(No.7)(京都大学)、pp.1-21.[[*** PDFで読む>http://jhlee.sakura.ne.jp/geo-backup/paper/PLS2001.pdf]]
+李 在鎬(2002)「構文の意味的拡張に基づく第二言語の文法習得:コーパスの定量的分析に基づいて」,『言語科学論集』(No.8)(京都大学)、pp. 99-127.[[*** PDFで読む>http://jhlee.sakura.ne.jp/geo-backup/paper/PLS2002.pdf]]
+李 在鎬(2004)「助詞「に」の定量的分析への試み:語法研究の新たな手法を求めて」、『日本認知言語学会論文集』No.4、pp.55-65.[[*** PDFで読む>http://jhlee.sakura.ne.jp/geo-backup/paper/jcla2004.pdf]]
+李 在鎬(2004)「事態認知に基づく構文文法再考」、『言語科学論集』(No.10)(京都大学)、pp.25-51.[[*** PDFで読む>http://jhlee.sakura.ne.jp/geo-backup/paper/PLS2004.pdf]]
+李 在鎬・井佐原 均(2006)「第二言語獲得における助詞「に」の習得過程の定量的分析」、『計量国語学』第二十五巻四号、pp.163-180.[[*** PDFで読む>http://jhlee.sakura.ne.jp/geo-backup/paper/keiryo2006.pdf]]
+李 在鎬・井佐原 均(2006)「統計モデルを用いた助詞「で」の分析」、『KLS』(26)、pp.78-88[[*** PDFで読む>http://jhlee.sakura.ne.jp/geo-backup/paper/KLS26_lee.pdf]]
+中本敬子・李 在鎬・黒田航(2006)「日本語の語順選好は動詞の意味に還元できない文レベルの意味と相関する—心理実験に基づく日本語の構文研究への提案—」、『認知科学』、Vol.13,No.3、pp.334-352[[*** PDFで読む>http://clsl.hi.h.kyoto-u.ac.jp/~kkuroda/papers/nakamoto-et-al-06-jcss-submitted.pdf]]
+鈴木 幸平 , 李 在鎬 , 黒田 航(2006)「実験に基づく「流れる」の語形の意味グループ」『日本語用論学会大会研究発表論文集』 (2), 243-246[[***CiNii>>http://ci.nii.ac.jp/naid/40016324195]]
+濱野 寛子・李 在鎬(2006)「多変量解析に基づく助数詞「本」のカテゴリー化」『認知言語学論文集』(No.7)pp.553-556
+李 在鎬・黒田 航・大谷 直輝・井佐原 均(2006)「名詞との共起関係に基づく構文の定義」、『認知言語学論文集』(No.7)pp.160-170[[*** PDFで読む>http://jhlee.sakura.ne.jp/geo-backup/paper/jcla2006.pdf]]
+李 在鎬・黒田 航・井佐原 均(2006)「名詞の概念的役割解釈における類型化の試み」、『第8回大会発表論文集』、pp.153-160[[*** PDFで読む> http://jhlee.sakura.ne.jp/geo-backup/paper/PSJ2006.pdf]]
+Nakamoto Keiko, Kuroda Kow, Lee Jae-Ho (2006) "Preferred word order in Japanese correlates with nonlexical --perhaps superlexical-- meaning: Evidence from psycholinguistic experiments", [[Proceedings of the Seventh Tokyo Conference on Psycholinguistics>http://www.amazon.co.jp/Proceedings-Seventh-Tokyo-Conference-Psycholinguistics/dp/4894763397]], Hituzi Syobo Publishing Company, pp.197-222
+Yoshikata Shibuya, Kow Kuroda, Jae-Ho Lee, and Hitoshi Isahara (2006) "Specifying deeper semantics of a text using MSFA". IEICE Technical Reports, Vol.106, No.299, pp.27-32
+佐野香織・李在鎬(2007)「KH Coderで何ができるか~日本語習得・日本語教育研究 利用への示唆~」、『言語文化と日本語教育』(No.33), pp.47-48[[*** PDFで読む>http://jhlee.sakura.ne.jp/geo-backup/Wikicorpus/jcpdf/researchconcept.pdf]]
+濱野寛子・李 在鎬(2007)「助数詞「本」のカテゴリー化をめぐる一考察-統計的手法を用いて」『言語学と日本語教育Ⅴ』、くろしお出版.[[*** PDFで読む>>http://jhlee.sakura.ne.jp/geo-backup/paper/hamano-lee-kurosio.pdf]]
+李 在鎬・鈴木 幸平・永田 由香・黒田 航・井佐原 均(2007)「動詞「流れる」の語形と意味の問題をめぐって」『計量国語学』第26巻2号, pp.64-74[[*** PDFで読む>>http://jhlee.sakura.ne.jp/geo-backup/jcpdf/lee-et-al2007.pdf]]
+黒田 航 , 李 在鎬 , 渋谷 良方 , 野澤 元 , 井佐原 均(2007)「概念の「乗物」についての考察 : 意味記述の単位と語彙記述の単位のズレを中心にしたオントロジーと言語との対応づけの一般問題(言語理解とオントロジーシンポジウム)」電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 106(518), 25-30[[***CiNii>>http://ci.nii.ac.jp/naid/110006202607]]
+李 在鎬、伊藤健夫(2008)「決定木を用いた多義語分析:多義動詞「出る」を例に」、日本認知言語学会論文集 8, 55-65[[*** PDFで読む>>http://jhlee.sakura.ne.jp/geo-backup/paper/lee_ito2008.pdf]]
+黒田 航・李 在鎬(2008)「WWWを丸ごとデータにすると何がわかるか」、[[『日本語学(2008年2月号)』27-2:pp. 22-37, 明治書院>http://www.meijishoin.co.jp/search/?BOOK_ID=ZAS003310]][[*** PDFで読む>>http://jhlee.sakura.ne.jp/geo-backup/paper/nihongaku-kuroda_lee.pdf]]
+林 ヒョンジュン・李 在鎬・淺尾 仁彦(2008)「韓国語学習者コーパスの構築 : 韓国語学習者作文コーパスにおける検索ツールの開発(言語と学習)」『電子情報通信学会技術研究報告. TL, 思考と言語』 108(297), 21-26, [[*** CiNii>>http://ci.nii.ac.jp/naid/110007100754]]
+李 在鎬(2008)「用法基盤による言語研究の方法論とその実践に向けて」,『人環フォーラム』No.22, pp.44-46.
+李 在鎬(2008)「移動動詞に対する実験的分析」,『言葉と認知のメカニズム』pp.87-101, ひつじ書房.[[*** PDFで読む>>http://jhlee.sakura.ne.jp/geo-backup/paper/lee-y-kanreki.pdf]]
+李 在鎬・横森大輔・土屋智行(2009)「コーパス調査による形容詞の連体形と連用形」,『コーパスを利用した国語辞典編集法の研究』(特定領域研究日本語コーパス平成20年度研究成果報告書), pp 103-110.[[*** PDFで読む>>http://jhlee.sakura.ne.jp/geo-backup/paper/lee-et-al-jcorp-200903.pdf]]
+李 在鎬(2009)「助数詞と多変量解析」,『日本語学(2009年6月号)』28-7:pp.44-57, 明治書院.[[*** PDFで読む>>http://jhlee.sakura.ne.jp/geo-backup/paper/nihongogaku-LeeJaeHo.pdf]]
+李 在鎬(2009)「コーパス分析と認知言語学」『日本認知言語学論文集』No.9, pp.437-443.
+李 在鎬(2009)「タグ付き日本語学習者コーパスの開発」『計量国語学』27-2, pp.60-72.[[*** PDFで読む>>http://jhlee.sakura.ne.jp/geo-backup/paper/lee2009.pdf]]
+李 在鎬、林炫情、浅尾 仁彦、曺美庚(2010)「韓国語学習者作文コーパス(KC Corpus)について」『朝鮮語教育』
+林 ヒョンジュン・李 在鎬・黄チョンナン・淺尾 仁彦(2011)「韓国語学習者作文コーパス(KC Corpus)と韓国語教育への活用」『山口県立大学学術情報』4, 43-51.[[***CiNii>>http://ci.nii.ac.jp/naid/110008428864]]
+李 在鎬(2011)「日本語能力試験の挑戦:新しい日本語能力試験を例に」『月刊日本語学(明治書院)』30-1,pp.95-107[[***CiNii>>http://ci.nii.ac.jp/naid/40017652656]]
+李 在鎬(2011)「大規模テストの読解問題作成過程へのコーパス利用の可能性」『日本語教育』148号, pp.84-98[[***PDFで読む>>http://jhlee.sakura.ne.jp/geo-backup/paper/lee2011.pdf]]
+李 在鎬、川端一光、矢澤理子,堀川有美(2011)「日本語能力試験の新たな取り組み」『言語教育評価研究』第2号, pp.64-72[[***CiNii>>http://ci.nii.ac.jp/naid/40018999609]]
+李在鎬・柴崎秀子(2012)「文章の難易度と語彙の関連性に関する考察~学年の違いを特徴づける語彙的要素とは何か~」『コーパスとテキストマイニング』,共立出版, pp.181-192.
+朴善婤,玉岡賀津雄,李在鎬(印刷中)「韓国語の2字漢字語の語彙性アスペクトによる動詞化および形容詞化の予測」『Studies in Language Sciences: Journal of the Japanese Society for Language Sciences」
**書評論文
+李 在鎬(2005)「書評論文:本多 啓(2005)アフォーダンスに基づく認知意味論」、『語用論研究』(No.7)、pp.147-164
**学会発表
+李 在鎬(2002)「構文の意味的動機付けに関する一考察:「XがYにVする」を例に」、日本言語学会124回研究大会(東京外国語大学)(『大会予稿集』、pp. 226-231)
+李 在鎬(2003)「語法の観察に基づく結果構文再考:構文の制約を中心に」日本言語学会126回大会(青山学院大学)、(『大会予稿集』、pp.130-135)
+李 在鎬(2003)「助詞「に」の定量的分析への試み:語法研究の新たな手法を求めて」、第4回日本認知言語学会(明治学院大学)、(conference handbook pp.47-50)
+李 在鎬(2004)「電子化コーパス利用による韓国語複数形接辞「-deul」の定量的分析」、日本言語学会128回大会(東京学芸大学)、(『予稿集』、pp.375-380)
+李 在鎬(2004)「助詞「に」の使用に見られる漸進的習得過程に関する一考察」、2004年春季日本語教育学会全国大会(東海大学)(『予稿集』、pp.77-82)
+李 在鎬(2004)「自動移動構文の習得からみた文法習得:中間言語的アプローチの精緻化に向けて」、2004年日本語教育学会国際研究大会(昭和女子大学)、(『予稿集1』、pp.71-76)
+李 在鎬(2005)「多変量解析を用いた構文の記述」、自然言語処理学会第11回年次大会(香川大学), (『大会論文集』pp.269-272)
+李 在鎬(2005)「構文の意味的制約に関する認知言語学的考察」、自然言語処理学会第11回年次大会(香川大学), (『大会論文集』、pp.1123-1126)
+李 在鎬、井佐原 均(2005)「統計モデルを用いた助詞「で」の分析」関西言語学会第30回記念大会(関西大学)
+李 在鎬、井佐原 均(2005)「語順の意味的動機付けを求めて」、日本言語学会130回研究大会(国際基督大学)(『予稿集』, pp. 226-231)
+李 在鎬、井佐原 均(2005)「第二言語獲得過程に見られる動詞島構文をめぐる一考察」言語科学研究会第7回年次大会(上智大学)
+LEE, Jae-Ho & OTANI, Naoki(2005)”Toward a description of its grammatical phenomena based on a cluster analysis” In 9th International Cognitive Linguistics Conference: Language, Mind and Brain, (Yonsei University, Seoul, Korea) pp.117.
+OTANI, Naoki & LEE, Jae-Ho(2005)”Cognitive and quantitative approaches to English phrasal verb: Asymmetrical characteristics in composite structure” In 9th International Cognitive Linguistics Conference: Language, Mind and Brain, (Yonsei University, Seoul, Korea) pp.121
+李 在鎬、濱野寛子(2005)「多変量解析に基づく助数詞「本」のカテゴリー化」、第6回日本認知言語学会ワークショップ(御茶ノ水女子大学)(conference handbook pp.225-228)
+李 在鎬、大谷 直輝、井佐原 均(2005)「名詞との共起関係に基づく構文の定義」、第6回日本認知言語学会(御茶ノ水女子大学)(conference handbook pp.66-69)
+黒田 航、李 在鎬、井佐原 均(2005)「結果述語と結果構文の定義を再考する: 結果構文の共述語分析の提案」、日本英語学会ワークショップ(九州大学)
+李 在鎬、黒田 航、井佐原 均(2005)「名詞の概念的役割解釈における類型化の試み」、第5回日本語用論学会(京都大学)(『予稿集』pp.101-104)
+李 在鎬、井佐原 均(2006)「助詞「に」の習得をめぐる定量的アプローチ」、Fifth International Conference on Practical Linguistics of Japanese (ICPLJ5)(San Francisco State University, San Francisco, USA)
+濱野寛子、李 在鎬(2006)「助数詞「本」のカテゴリー化をめぐる一考察-統計的手法を用いて」、Fifth International Conference on Practical Linguistics of Japanese (ICPLJ5)(San Francisco State University, San Francisco, USA)
+李 在鎬、井佐原 均(2006)「自己組織化マップを用いた助数詞の分析」、自然言語処理学会第12回全国大会(慶応大学)
+NAKAMOTO, Keiko, LEE, Jae-Ho, KURODA, Kow (2006) "Preferred Word Order of a Japanese Sentence Correlates with its Constructional Meaning: Evidence from a Psycholinguistic Experiment",The 7th annual Tokyo Conference on Psycholinguistics. (Keio University, Tokyo, Japan)
+李 在鎬、井佐原 均(2006)「名詞の制約の階層化と文意の問題:分類木に基づく一般化」、関西言語学会ワークショップ(甲南大学)
+LEE Jae-Ho & ISAHARA Hitoshi(2006)"A Cognitive Approach to Japanese Constructional Phenomena: Evidence from Motion Construction and Resultative Construction" International Conference on Japanese Language Education 2006(Columbia University, New York,USA)
+NAKAMOTO, Keiko & LEE, Jae-Ho & KURODA, Kow (2006) "Constructional meaning affects preferred word order of a Japanese sentence: Psycholinguistic experiments on caused motion and possession constructions."The Fourth International Conference on Construction Grammar (Tokyo University, Tokyo, Japan) pp. 76
+李 在鎬・井佐原 均(2006)「統計的手法に基づく韓国語副詞「jal」の一考察」、日本語言語学会133回大会(札幌学院大学)
+鈴木幸平、李在鎬、黒田航(2006)「実験に基づく「流れる」の語形の意味グループ」、日本語用論学会第9回大会、(桃山学院大学)
+李 在鎬・佐野香織・秋澤委太郎(2007)「第二言語学習者の名詞使用について:KYコーパスを用いて」、第二言語習得研究会(御茶ノ水女子大学)
+李 在鎬, 永田由香, 鈴木幸平, 黒田航, 井佐原均 (2007)「語形と意味」『言語処理学会第13回年次大会発表論文集』(pp.1050-1053)
+黒田 航, 李 在鎬, 渋谷良方, 河原大輔, 井佐原均 (2007)「自動構築された格フレーム辞書の精度向上を見こんだ人手評価と比較実験」『言語処理学会第13回年次大会発表論文集』(pp.1054-1057)
+佐野香織・李 在鎬・秋澤委太郎(2007)「定住外国人の名詞使用-自然言語処理分析ツールを用いた研究事例-」、日本語教育学会(桜美林大学)
+李 在鎬・黒田 航・渋谷良方・河原大輔・井佐原均(2007)「コーパス分析に基づく連体表現の使用調査」、第134回日本言語学会(麗澤大学)、(『大会予稿集』、pp.422-427)
+OSAKI, Azusa & LEE, Jae-Ho(2007)”A Hierarchy of Semantic Constraints in Japanese Fictive Motion” In 10th International Cognitive Linguistics Conference.(Kraków, Poland)
+李 在鎬・佐野香織・秋澤委太郎(2007)「初級学習者の名詞使用と 文生成の問題 」、OPI国際シンポジウム(京都)(『予稿集』、pp.91-97)
+李 在鎬、濱野寛子(2007)「助数詞の習得に見られる非対称性」、第24回日本認知科学会(成城大学)
+李 在鎬、伊藤健夫(2007)「決定木を用いた多義語分析:多義動詞「出る」を例に」、第8回日本認知言語学会(御茶ノ水女子大学)
+[[李在鎬・玉岡賀津雄・林炫情(2008)「韓国語の話しことばと書きことばにおける音素,音節,音節結合の出現頻度」、日本言語学会(学習院大学)(予稿集、pp.390-395)>http://jhlee.sakura.ne.jp/geo-backup/jcpdf/LSJ2008final.pdf]]
+[[李在鎬・玉岡賀津雄「日本語コーパスの使用法と解析」麗澤大学言語研究センターおよび言語科学会(2008年度会員講習会)共催>http://jhlee.sakura.ne.jp/geo-backup/jcpdf/reitaku0705.pdf]]
+[[小川典子・李在鎬・横森大輔・土屋智行 (2008).「コーパス調査による形容詞の連体形と連用形の頻度」,2008日本語教育学会国際研究大会(韓国,ブサン)(『予稿集2』 pp. 154-157)>http://jhlee.sakura.ne.jp/geo-backup/jcpdf/ICJLE20080420final.pdf]]
+李在鎬(2008)「形態素情報からみたOPIデータ」,[[2008日本語教育学会国際研究大会>http://2008icjle.pufs.ac.kr/zbxe1/]](韓国,ブサン)
+淺尾仁彦・李在鎬 (2008) 「日本語学習者コーパス検索ツールの開発」,言語科学会第10回年次大会(静岡県立大学)
+Natsuko Nakagawa, Lee Jae-ho and Yoshihiko Asao (2008) Difference between literal and metaphorical usage of verb forms in Japanese. [[LCC.Brighton, UK.>http://www.languageandcognition.net]]
+[[李在鎬(2008)「コーパス分析と認知言語学」、日本認知言語学会(名古屋大学)>http://jhlee.sakura.ne.jp/geo-backup/jcpdf/JCLA2008.pdf]], [[配布資料(エクセル版)>http://jhlee.sakura.ne.jp/geo-backup/jcpdf/JCLA2008-siryo.xls]]
+Tsuchiya Tomoyuki, Lee Jae-Ho, Yokomori Daisuke, Ogawa Noriko (2008) “A Corpus-based approach to Japanese Adjectives in Adnominal and Conjunctive Form.” 5th International Conference on Construction Grammar. University of Texas, Austin.
+黒田航, 李在鎬, 野澤元, 村田真樹, 鳥澤健太郎(2009)「鳥式改の上位語データの人手クリーニング」,言語処理学会2009年次大会(鳥取大学)
+李在鎬, 長谷部陽一郎, 柴崎秀子(2009)「読解教育支援のためのリーダビリティー測定ツールについて」,言語処理学会2009年次大会(鳥取大学)
+李在鎬, 土屋智行,横森大輔(2009)「形容詞の頻度調査」,平成20年度特定領域研究「日本語コーパス」公開ワークショップ(東京工業大学)
+李在鎬(2009)「日本語の習熟レベルの計算論的推定について:習得レベルを決定づける要因は何か」(JSAA-ICJLE2009)
+土屋智行、李 在鎬、横森大輔(2009)「日本語における形容詞の活用と使用頻度」(JSAA-ICJLE2009)
+[[李在鎬、林炫情、浅尾 仁彦、曺美庚(2009)「韓国語学習者作文コーパス(KC Corpus)について」朝鮮語教育研究会10周年記念大会>>http://jhlee.sakura.ne.jp/kcc-doc/lee-et-al2009.pdf]]
+李在鎬・秋本瞳(2010)「均衡コーパスと日本語教育」『特定領域研究日本語コーパス公開シンポジウム予稿集』
+李在鎬,柴崎秀子(2009)「国語教科書を使った語彙の難易度に関する研究」(語彙研究会)
+李在鎬・横森大輔・土屋智行(2009)「形容詞の語義判定に関する実験的調査」『日本語言語学会139回大会予稿集』
+林炫情・玉岡賀津雄・李在鎬(2009)「韓国語のオノマトペと動詞の共起パターンに関するコーパスとヒトの言語産出の比較研究」『日本語言語学会139回大会予稿集』
+李在鎬・秋本瞳・大出美和子(2010)「均衡コーパスは日本語学習者にどこまで理解できるか :日本語能力試験出題基準に基づく語彙調査」『2010年日本語教育国際研究大会』
+堀恵子・江田すみれ・堀恵子(2010)「日本語教育のためのコーパスに基づく文法項目データベース構築と検索システムの公開をめざして」『2010年日本語教育国際研究大会』
+李在鎬(2010)「可視化に基づく助数詞分析:共起ネットワークを用いて」『日本言語学会140回大会予稿集』pp.116-121
+李在鎬(2010)「大規模試験においてコーパスはどう位置付けるべきか」『2010年度(平成22年度)日本語教育学会秋季大会予稿集』
+進藤三佳,李 在鎬,渋谷良方(2010)「感覚形容詞の語用論的意味変化に見る統語構造の影響」日本語用論学会第13回大会
+パクソンジュ, 玉岡 賀津雄, 李 在鎬(2010)「韓国語漢字語の-hada 付加による動詞および形容詞化の動作性アスペクトによる予測」日本言語学会第 141回大会
+李在鎬(2011)「話し言葉における能力評価の定量的分析―コーパスに基づく検証と応用に向けて―」[[ICPLJ7>http://www.sfsu.edu/~japanese/conference/]]
+李在鎬・砂川有里子(2012)「コーパスを活用した日本語語彙表の構築」日本語教育国際大会パネルセッション日本語教育につながるコーパス研究―現状と今後の展望―(名古屋大学)
+李在鎬・赤瀬川史(2012)「均衡コーパスから抽出した基本動詞100語の格フレーム」日本語教育国際大会(名古屋大学)
+迫田久美子・木下藍子・小西円・李在鎬(2012)「日本語学習者の縦断的会話コーパスの構築と習得研究-3年間のデータから文法習得の過程を探る- 」(2012年日本語教育国際研究大会ポスター発表)
+迫田久美子・木下藍子・小西円・李在鎬(2012)「日本語学習者の縦断的会話コーパス『C-JAS』の構築 」(2012.10.14 2012年日本語教育学会 秋季大会 デモンストレーション)
+迫田久美子・木下藍子・小西円・李在鎬(2012) 「 日本語学習者のタグ付き発話コーパス『C-JAS』-C-JAS(Corpus of Japanese as a second language)開発と利用- 」(多文化共生における日本語教育研究」研究発表会 ポスター発表)
+李在鎬 ・林炫情・宮岡弥生・柴崎秀子(2012)「言語処理の技術を利用したタグ付き日本語学習者コーパスの構築」(日本語教育学会2012年度秋季大会デモンストレーション)
**講演
+李 在鎬「文意の実現における名詞の貢献について」(特定領域研究日本語コーパス辞書編集班研究集会)(青山学院大学/07.05.21)
+李 在鎬「コーパス分析に基づく日本語研究」[[(広島大学総合科学研究科・総合科学研究プロジェクト「言語と情報研究」公開セミナー)(広島大学/07.12.02)>http://home.hiroshima-u.ac.jp/ias/kyoiku/g-5_seminar/kako19.htm]]
+李 在鎬「日本語コーパスの使用法と解析法」(2008年度日本言語科学会との共催企画)(麗澤大学/08.07.05)
+李 在鎬「コーパス分析と日本語(教育)研究、認知言語学」[[(大学院教育改革支援プログラム・比較日本学教育研究センター・女性リーダー育成プログラム主催/2009.10.20>http://www.dc.ocha.ac.jp/dics-jacs/lecture/lec20091020/]]
+李 在鎬「日本語コーパスの最新の検索エンジンと分析」(名古屋大学対話創成力養成プロジェクト/2010.1.23-24)
+李 在鎬「日本語学・日本語教育学と実証的研究法」(お茶の水女子大学/2010.2.23)
+李 在鎬「学習者コーパスと教材開発について」(東京大学工学部日本語教育部門/2010.3.5)
+李 在鎬「日本語コーパスの日本語教育への応用について」(長岡科学技術大学国際センター/2010.9.9)
+李 在鎬「学習者コーパスの構築における課題-タグ付きKYコーパスの開発経験から-」[[(多文化共生社会における日本語教育研究」公開研究会/国立国語研究所/2010.11.20)>http://www.ninjal.ac.jp/event/project-meeting/49-20101120/]]
+李 在鎬「認知言語学における多義研究」シンポジウム「より充実した日本語教育を目指して」(日本女子大/2010.11.27)
+李 在鎬「コーパス分析に基づく認知的構文研究」(名古屋大学/2011.12.2)
+李 在鎬「コーパス研究の現在」(明治大学/2012.6.21)
+李 在鎬「日本語と韓国語:似ているようで違う」(群馬県立女子大学/2012.6.23)
+李 在鎬「日本語教師のためのコーパス分析」(2012年度 日本語教師研修コース/2012.6.30)
+李 在鎬「リーダビリティ研究の知見を利用したKYコーパスの定量的分析:自動判別に向けて」(日本語プロフィシェンシー研究会 2012年度第2回例会/2012.11.10)
**一般向け連載
-이재호의 일본 엿보기「교토의 상식, 일본의 비상식」『일본어 저널』(다락원) (李在鎬の日本探訪「京都の常識、日本の非常識」『日本語ジャーナル』2001.5月号(Darakwon))
-이재호의 일본 엿보기「주거로 본 내부와 외부의 문화」『일본어 저널』(다락원) (李在鎬の日本探訪「住まいから見た内と外の文化」『日本語ジャーナル』2001.6月号(Darakwon))
-이재호의 일본 엿보기「혼수문화」『일본어 저널』(다락원) (李在鎬の日本探訪「嫁入り道具」『日本語ジャーナル』2001.7月号(Darakwon))
-이재호의 일본 엿보기「수학여행」『일본어 저널』(다락원) (李在鎬の日本探訪「修学旅行」『日本語ジャーナル』2001.8月号(Darakwon))
-이재호의 일본 엿보기「두개의 이름」『일본어 저널』(다락원) (李在鎬の日本探訪「二つの名前(在日韓国人)」『日本語ジャーナル』2001.9月号(Darakwon))
-이재호의 일본 엿보기「독립하지 않는 젊은이 독신귀족」『일본어 저널』(다락원) (李在鎬の日本探訪「独立しない若者、独身貴族」『日本語ジャーナル』2001.10月号(Darakwon))
-이재호의 일본 엿보기「2002년 월드컵 공동개최, 지금 그리고 이후」『일본어 저널』(다락원) (李在鎬の日本探訪「2002年ワールドカップ共同開催、今とこれから」『日本語ジャーナル』2002.6月号(Darakwon))
-이재호의 일본 엿보기「나를 찾아 떠나는 여행 거리의 악사들. 스트리트 뮤지션」『일본어 저널』(다락원) (李在鎬の日本探訪「自分探しの旅、ストリートミュージシャン」『日本語ジャーナル』2002.7月号(Darakwon))
-이재호의 일본 엿보기「탈규격화 교육(유토리 교육)」『일본어 저널』(다락원) (李在鎬の日本探訪「脱規格化教育(ゆとり教育)」『日本語ジャーナル』2002.8月号(Darakwon))
-이재호의 일본 엿보기「애완동물과 함께 만들어가는 가정」『일본어 저널』(다락원) (李在鎬の日本探訪「ペットと作り上げていく家庭」『日本語ジャーナル』2002.9月号(Darakwon))
-이재호의 일본 엿보기「일본적 음식문화」『일본어 저널』(다락원) (李在鎬の日本探訪「日本的飲食文化」『日本語ジャーナル』2002.10月号(Darakwon))
-이재호의 일본 엿보기「외래어가 범람하는 일본」『일본어 저널』(다락원) (李在鎬の日本探訪「外来語の氾濫」『日本語ジャーナル』2002.11月号(Darakwon))
-이재호의 일본 엿보기「노벨상과 일본식 고등교육 문화」『일본어 저널』(다락원) (李在鎬の日本探訪「ノーベル賞と日本式高等教育」『日本語ジャーナル』2002.12月号(Darakwon))
-이재호의 일본 엿보기「훈훈한 일본의 정월」『일본어 저널』(다락원) (李在鎬の日本探訪「心温まる日本のお正月」『日本語ジャーナル』2003.1月号(Darakwon))
-이재호의 일본 엿보기「일본의 휴대전화」『일본어 저널』(다락원) (李在鎬の日本探訪「日本の携帯電話(携帯がケータイにかわる時」『日本語ジャーナル』2003.2月号(Darakwon))
-이재호의 일본 엿보기「일본의 스포츠」『일본어 저널』(다락원) (李在鎬の日本探訪「日本のスポーツ」『日本語ジャーナル』2003.3月号(Darakwon))
-이재호의 일본 엿보기「만화왕국 일본」『일본어 저널』(다락원) (李在鎬の日本探訪「漫画王国日本」『日本語ジャーナル』2003.4月号(Darakwon))
-이재호의 일본 엿보기「소자녀화 사회」『일본어 저널』(다락원) (李在鎬の日本探訪「少子化社会」『日本語ジャーナル』2003.5月号(Darakwon))
-이재호의 일본 엿보기「또하나의 일본어, 일본의 방언」『일본어 저널』(다락원) (李在鎬の日本探訪「もう一つの日本語(日本語の方言)」『日本語ジャーナル』2003.6月号(Darakwon))
-이재호의 일본 엿보기「병들어가는 일본 사회 일본의 범죄」『일본어 저널』(다락원) (李在鎬の日本探訪「日本社会の犯罪」『日本語ジャーナル』2003.7月号(Darakwon))
-이재호의 일본 엿보기「흡연천국에서 흡연 지옥으로, 일본의 흡연사정」『일본어 저널』(다락원) (李在鎬の日本探訪「喫煙天国から喫煙地獄」『日本語ジャーナル』2003.8月号(Darakwon))
-이재호의 일본 엿보기「장애인과 함께 사는 사회 마음의 배리어프리」『일본어 저널』(다락원) (李在鎬の日本探訪「障害者と共に生きる心のバリアフリー」『日本語ジャーナル』2003.9月号(Darakwon))
-이재호의 일본 엿보기「일본인의 언어유희 다자레」『일본어 저널』(다락원) (李在鎬の日本探訪「日本人と駄洒落」『日本語ジャーナル』2003.10月号(Darakwon))
-이재호의 일본 엿보기「일본의 성, 그 두가지 모습」『일본어 저널』(다락원) (李在鎬の日本探訪「日本の性、その二つの姿」『日本語ジャーナル』2003.11月号(Darakwon))
-이재호의 일본 엿보기「일본의 수험 전쟁」『일본어 저널』(다락원) (李在鎬の日本探訪「日本の受験戦争」『日本語ジャーナル』2003.12月号(Darakwon))
-이재호의 일본 엿보기「유학생의 입지」『일본어 저널』(다락원) (李在鎬の日本探訪「留学生の立場」『日本語ジャーナル』2004.1月号(Darakwon))
2013-05-30T20:53:21+09:00
1369914801
-
ダウンロード
https://w.atwiki.jp/corpus-ling/pages/55.html
サイト移転しました。
[[http://jhlee.sakura.ne.jp/>http://jhlee.sakura.ne.jp/]] から御覧ください。
*コーパスツール
-[[タグ付きKYコーパスとE-KWIC>http://www30.atwiki.jp/corpus-ling/pages/57.html]]
-[[茶まめ用E-KWIC]]:「茶まめ」で形態素解析したデータをエクセルで検索するためのアドイン。
-[[Ngram検索]]:複数のコーパスから収集した日本語Ngramデータを検索することができます。
*語彙データ
-[[算出に基づく学習者の語彙データベース]]
-[[日本語コーパスから抽出した形容詞の語彙表]]
*謝辞
本データの作成においては、三つの研究助成から援助を受けております。
1)博報『第二回ことばと文化・教育』研究助成(研究代表者:李在鎬)
2)科学研究費補助金(若手(B), 課題番号:19720111)
3)科学研究費補助金(研究代表者:柴崎秀子, 課題番号:19011003))
-----
2013-05-28T00:23:38+09:00
1369668218
-
資料(文献リストなど)
https://w.atwiki.jp/corpus-ling/pages/51.html
サイト移転しました。
[[http://jhlee.sakura.ne.jp/>http://jhlee.sakura.ne.jp/]] から御覧ください。
*文献リスト
+コーパス分析に基づく日本語学・日本語教育の文献リストです。
+文献リストVer06を公開します(2007.11.06)
++Googleドキュメントです。編集はできません。 [[閲覧はこちらから>https://spreadsheets.google.com/ccc?key=0Av7cLesyTKlBdEJ4YzVNV1N4Qndyemp1a3BtVU52aHc&hl=ja&authkey=CNew_b4C]]
----
*コーパス日本語学の特集号など
***『日本語科学』第22号(2007)
-特集名:コーパス日本語学の射程
-収録論文
+巻頭論文
++コーパス日本語学の射程(丸山岳彦・田野村忠温 ): [[PDFで見る>http://www.kokken.go.jp/kanko/kagaku/tokusyugo/JL22_kantou.pdf]]
+寄稿論文
++コーパス日本語学の可能性 ―大規模均衡コーパスがもたらすもの―(前川喜久雄)
++語彙調査からコーパスへ(宮島達夫)
++コーパス言語学と日本語研究(後藤斉)
+研究論文
++多言語コーパスと日本語研究 ―『中日対訳コーパス』の利用研究例から―(曹大峰)
++学習者と母語話者における日本語複合動詞の使用状況の比較 ―コーパスによるアプローチ―」(陳曦)
++コーパス日本語学のための言語資源 ―形態素解析用電子化辞書の開発とその応用―(伝康晴・小木曽智信・小椋秀樹・山田篤・峯松信明・内元清貴・小磯花絵 )
+調査報告
++現代雑誌70誌における漢字の使用実態と常用漢字表 ―国語施策へのコーパスの活用に向けた基礎調査―(小椋秀樹・相澤正夫)
+研究ノート
++日本語研究のためのXMLタグ付けプログラム ―その開発と活用例―(小木曽智信・近藤明日子)
++日本語用例・コロケーション情報抽出システム『茶漉』(深田淳)
詳細:http://www.kokken.go.jp/kanko/kagaku/tokusyugo/
***『月刊言語』2007年7月号
-特集名: インターネットと言語研究――情報を選り分け、活用するために
-収録論文
++コーパスとしてのWWW検索の活用(荻野綱男)
++巨大データの必要性――言語の周辺的・慣習的側面を探るために(滝沢直宏)
++インターネットを利用した日本語の類義分析(杉村 泰)
++英語研究とネット活用(赤野一郎)
++インターネット時代の用例収集――検索エンジンの応用から日本語話し言葉コーパスまで(近藤泰弘)
++ネット上の“言語景観”――東京圏のデパート・自治体・観光サイトから(田中ゆかり・秋山智美・上倉牧子)
++検索エンジンことはじめ(神﨑洋治)
++連想の情報学――思考と響きあう情報空間(高野明彦)
++ウィキペディアのやわらかい未来(岡田登貴)
詳細:http://thistle.est.co.jp/tsk/detail.asp?sku=50707&page=1
***『日本語教育』130号(2006)
-特集名: 〔特集〕コーパスと日本語教育-現状と課題-
-収録論文
+寄稿・研究論文
++日本語コ-パスと日本語教育(大曾美惠子)
++英語コ-パス言語学と英語教育(赤野一郎)
++コ-パス利用のためのコンピュ-タ・リテラシ-(滝沢直宏)
++言語コ-パスの構築と使用をめぐる倫理的問題-インフォ-ムド・コンセントを中心に-(柳町智治)
++KYコ-パスと日本語教育研究(鎌田修)
++CHILDESを使った日本語教育研究(宮田Susanne)
++「女性のことば・職場編」に見る終助詞「わ」の行方(谷部弘子)
+研究論文
++中国人学習者の作文誤用例から見る共起表現の習得及び教育への提言-名詞と形容詞及び形容動詞の共起表現について-(曹紅荃・仁科喜久子)
+調査報告
++疑問文に見られる“Writer/Reader visibility”-中国人学習者と日本語母語話者の意見文の比較-(髙橋圭子・伊集院郁子)
詳細:http://wwwsoc.nii.ac.jp/nkg/journal/j-121-130.htm
***『日本語学』2003年 4月臨時増刊
-特集名: コーパス言語学
-収録論文
+コーパス言語学の発展
++言語理論と言語資料-コーパスとコーパス以外のデータ-(後藤斉)
++古典語研究と現代語研究-コーパス言語学の観点から-(高山善行)
++コーパスと統計(伊藤雅光)
++漢文コーパスと日本語学研究(千田大介)
+データとしてのコーパス
++現代語のコーパスの種類とそれぞれの特徴(松本裕治)
++古典語のコーパス(近藤泰弘)
++コーパスの入手法と利用法-著作権処理をふまえて-(荻野綱男)
++文字コードの現状と将来(笹原宏之・横山詔一・エリク=ロング)
++ネット検索は言語の研究に有用か(田中ゆかり)
++タグ付きコーパスの共有化(石崎雅人)
+コーパス用のソフトウェア
++コーパス検索ソフト(服部匡)
++コーパス処理用ソフトの使い方(浅原正幸)
++データベースソフトの利用(伝康晴)
++コーパス用のオリジナルソフトの作成(小木曽智信)
+コーパスによる各種研究
++コーパスによる文法研究(田野村忠温)
++コーパスによる語彙の研究(石井正彦)
++コーパスによる音声談話の研究(小磯花絵)
++コーパスによる文字の研究(池田証寿)
++コーパスによる幼児の言語習得の研究(白井純子)
++コーパスによる日本語教育の研究-コロケーション及びその誤用を中心に-(大曽美恵子・滝沢直宏)
詳細:http://www.meijishoin.co.jp/search/index.php?BOOK_ID=ZAS002640
----
*報告書
+[[荻野網男(編)(2007)『コーパスを利用した国語辞典編集法の研究』特定領域研究「日本語コーパス平成18年度研究成果報告書>http://www.tokuteicorpus.jp/result/pdf/2006_021.pdf]]
+[[田野村忠温・服部匡・杉本武・石井正彦(2007)『コーパス日本語学ガイドブック』特定領域研究「日本語コーパス平成18年度研究成果報告書>http://www.tokuteicorpus.jp/team/jpling/guidebook/]]
+[[田野村忠温・服部匡・杉本武・石井正彦(2007)『コーパスを用いた日本語研究の精密化と新しい研究領域・手法の開発』特定領域研究「日本語コーパス平成18年度研究成果報告書>http://www.tokuteicorpus.jp/result/pdf/2006_018.pdf]]
----
*コーパスツール資料
+格フレーム辞書について(河原大輔[NICT])⇒[[PDFで見る>http://jcorpus.web.fc2.com/tutorial/case-frame.pdf]]
+KWIC Finderと正規表現(金丸敏幸[NICT])⇒[[PDFで見る>http://jcorpus.web.fc2.com/tutorial/KWIC-finder.pdf]]
+形態素解析によるコーパスツール(李在鎬[NICT])⇒[[PDFで見る>http://jcorpus.web.fc2.com/tutorial/KH-coder.pdf]]
+統計解析ソフトR(淺尾仁彦[京都大学[院]])⇒[[PDFで見る>http://jcorpus.web.fc2.com/tutorial/R.pdf]]
----
*コーパスツール使用レポート
+[[茶まめ>http://www30.atwiki.jp/corpus-ling/pages/36.html]]
+[[KWIC Finder>http://www30.atwiki.jp/corpus-ling/pages/29.html]]
+[[格フレーム辞書>http://www30.atwiki.jp/corpus-ling/pages/35.html]]
+[[KH Coder>http://www30.atwiki.jp/corpus-ling/pages/28.html]]
+[[日本語語彙大系>http://www30.atwiki.jp/corpus-ling/pages/31.html]]
----
2013-05-28T00:23:23+09:00
1369668203
-
テキスト処理ツール
https://w.atwiki.jp/corpus-ling/pages/48.html
サイト移転しました。
[[http://jhlee.sakura.ne.jp/>http://jhlee.sakura.ne.jp/]] から御覧ください。
#contents()
----
*はじめに
-テキストデータを処理するためのフリーソフトウェアを紹介します。
*テキスト検索系ツール
**秀丸エディタ
-機能:大規模ファイルの編集にも適する高機能テキストエディタでコーパスデータの処理のためにも役立つツールと言えます。様々なフリーのマクロが利用できるのも嬉しいですね。
-利用条件:シェアウェア(4,305円)
-動作環境:WindowsVista/XP/Me/2000/98/95/NT
-ダウンロード:[[こちらのサイトから>http://www.vector.co.jp/vpack/browse/pickup/pw6/pw006817.html]]
**andGrep - 絞り込み/否定検索機能付きGREPマクロ
-機能:秀丸用のマクロ。複数の文字列を含む行の抽出(絞り込み検索)や、指定文字列を含まない行の抽出(否定検索)を任意の数の文字列、任意の順序で指定して実行することができます。このマクロで秀丸にKWIC検索機能を実装できます。非常に便利です。
-利用事例: 毎日新聞コーパスから本文のみをテキストデータとして抽出する。
-動作環境:WindowsVista/XP/Me/2000/98/95/NT
-ダウンロード:[[こちらのサイトから>http://www.vector.co.jp/soft/dl/win95/writing/se235520.html]]
*テキスト変換系ツール
**xdoc2txt
-機能: Office文書やPDF/HTMLファイルのテキスト部分を抽出したファイルを作成できるフリーソフト.
-利用条件:フリーウェア
-動作環境:Windows 95/98/Me/NT 4.0/2000/XP
-ダウンロード:[[こちらのサイトから>http://www31.ocn.ne.jp/~h_ishida/xdoc2txt.html]]
**複数テキスト結合
-機能: 特定のフォルダにある複数のテキストファイルを、ひとつにまとめてくれる
-動作環境:WindowsVista/XP/Me/2000/98/95/NT
-利用事例:新潮文庫100冊などの部分テキストを一つのテキストファイルとして結合し、コーパスとして一括格納する
-利用条件: フリー
-ダウンロード:[[こちらのサイトから>http://www.vector.co.jp/soft/winnt/util/se319087.html]]
**文字コード変換ツール for .NET2.0
-機能:テキストファイルの文字コード(Shift-JIS, UTF-8, UTF-7, Unicode, EUC)を相互変換します。テキストファイルの文字コードを変換するには、秀丸などの高機能エディタ等でも可能ですが、このツールを使うと複数のファイルをまとめて変換できるようになります。
-利用条件: フリー
-ダウンロード:[[こちらのサイトから>http://www.vector.co.jp/soft/winnt/util/se372195.html]]
*テキスト加工系(置換など)ツール
**こりゃ便利! Rext
-機能:HTMLファイル、テキストファイル、プログラムのソースコードなどで、複数のファイルをまとめて置換します。残念ながら正規表現には対応していません。
-利用条件: フリー
-ダウンロード:[[こちらのサイトから>http://www.vector.co.jp/soft/win95/util/se231029.html]]
**Devas
-機能: 複数ファイルからテキストを検索、一括置換してくれます。正規表現が使える上に、秀丸などに比べ、非常に高速です。
-利用条件: フリー
-ダウンロード:[[こちらのサイトから>http://www.vector.co.jp/soft/win95/util/se162621.html]]
**EXCEL検索置換
-機能:エクセル内のデータを一括検索し、置換します。目的さえ合えば、非常に便利なツールです。
-利用条件:シェアウェアです(1,500円)。
-ダウンロード:[[こちらのサイトから>http://download.seesaa.jp/contents/win/app/a_other/13803/]]
2013-05-28T00:23:13+09:00
1369668193
-
コーパスツール
https://w.atwiki.jp/corpus-ling/pages/18.html
サイト移転しました。
[[http://jhlee.sakura.ne.jp/>http://jhlee.sakura.ne.jp/]] から御覧ください。
#contents()
----
*はじめに
-コーパスデータを分析するためのツールを紹介します。
-人文系にとっても比較的低コストで使えそうなコーパスツールをまとめておきます。主にWindows版です。
-PCスキルは、設定および操作に要するPCの基礎知識を意味します。星の数が少ないほど設定が簡単という意味です。
*データ抽出系
-いわゆるコンコーダンスソフトです。比較的設定が簡単なものの順に挙げておきます。
**KWIC Finder
-内容:PDF/WORD/EXCEL等のファイル形式に対応したGREP検索・テキストビューア。
-PCスキル:★
-入手方法:ウェブページよりダウンロード。シェアウェア(1000円)ですが、機能限定のフリーバージョンもあります。[[詳細はこちらから>http://www31.ocn.ne.jp/~h_ishida/KWIC.html]]
-コメント:語句を単純に検索する程度なら一番簡単に使えるツールかもしれません。形態素解析を前提にしない分、あと処理に手間と時間はかかりますが、設定や操作は非常に楽です。とりあえず単語の使い方を確認する程度なら、良いと思います。
-[[KWIC Finder使用レポート]]
**KH Coder
-内容:、内容分析(計量テキスト分析)もしくはテキストマイニングのためのフリーソフトウェアです。新聞記事、質問紙調査における自由回答項目、インタビュー記録など、社会調査によって得られる様々な日本語テキスト型データを計量的に分析するために製作されました。
-PCスキル:★
-入手方法:ウェブページよりダウンロード。[[詳細はこちらから>http://khc.sourceforge.net/]]
-コメント:茶筌の形態素解析情報を元に、様々なデータ抽出機能が用意されています。SQLというデータベースソフトを使ってはいますが、インストールは非常に楽です。操作も、簡単なマウス操作で、すべての作業ができるので、比較的簡単と言えます。
-関連文章:
--佐野香織・李在鎬「KH Coderで何ができるか~日本語習得・日本語教育研究 利用への示唆~」、『言語文化と日本語教育』(No.33),pp.94-95.⇒[[PDFで見る>http://www.geocities.jp/cheho0888/Wikicorpus/jcpdf/researchconcept.pdf]]
--[[KH Coder関連文献 >http://khc.sourceforge.net/bib.html]]
-[[KH Coder使用レポート]]
**ひまわり
-内容:国立国語研究所で開発し、言語研究用に設計された全文検索システム。『太陽コーパス』,『日本語話し言葉コーパス』,『分類語彙表』などの既存の言語資料や,自分で作成した XML 文書を検索することができる。
-PCスキル:★
-入手方法:ウェブページからダウンロード。[[詳細はこちらから>http://www2.ninjal.ac.jp/lrc/index.php?%C1%B4%CA%B8%B8%A1%BA%F7%A5%B7%A5%B9%A5%C6%A5%E0%A1%D8%A4%D2%A4%DE%A4%EF%A4%EA%A1%D9]]
**茶器
-内容:奈良先端大学院大学で開発したタグ付きコーパスを管理・検索するためのツール
-PCスキル:★★★
-入手方法:ウェブページからダウンロード。[[詳細はこちらから>http://chasen.naist.jp/hiki/ChaKi/]]
-コメント:インストールに関する詳細な情報は上記のリンク先から入手可能です。英語の分析にも使えるようです。
-関連文章:[[2006年度自然言語処理技術講習会資料(2006.9.4-6)>http://chasen.naist.jp/hiki/20060905/]]
**茶漉
-茶筌をベースに設計された,用例およびコロケーション情報を抽出するシステムです.ウェブ上での使用のみで,青空文庫と名大会話コーパスからデータを取り出すことができます.
-PCスキル:★
-入手方法:ウェブでの閲覧のみ。[[詳細はこちらから>http://tell.fll.purdue.edu/chakoshi-wiki/]]
**SearchXML
-内容:XML文章内を検索するためのツール。利用マニュアルは作成中とのことです。
-PCスキル:★
-入手方法:ウェブ上でダウンロード。ダウンロードは[[こちらから>http://www.fl.reitaku-u.ac.jp/LINC/projects/langTech/pub/SearchXML.exe]]
*データ解析系
-主に自然言語処理のために開発されたもの。設定や操作にはそれなりのスキルを要します。Windowsでの使用を前提にしていない場合が多いです。
**UniDic/茶まめ
-内容:日本語テキストを単語に分割し,形態論情報を付与するための電子化辞書です。形態素解析には『茶筌』を使用しています。
-PCスキル:★
-入手方法:ウェブページからダウンロード。簡単なユーザー登録後に、すぐに使えます。インストールも非常に楽です。[[詳細はこちらから>http://www.tokuteicorpus.jp/dist/index.php]]
-コメント:本体のほかに、茶筌をインストールしなければなりません。インストールに関する詳細は、上記リンクより閲覧できます。直感的で分かりやすいツールだと思います。ファイルの出力オプションも色々用意されていて、使い勝手はかなり良いと思います。
-関連文章:[[伝 康晴(他)(2006)「多様な目的に適した形態素解析システム用電子化辞書の開発」(「日本語コーパス」全体会議電子化辞書班報告)>http://www.tokuteicorpus.jp/result/pdf/2006_017.pdf]]
-[[茶まめ使用レポート]]
**近代文語UniDic
-内容:UniDicをもとにして近代文語文を解析できるようにした形態素解析辞書です。
-PCスキル:★
-入手方法:ウェブページから評価版をダウンロード。[[詳細はこちらから>http://www.kokken.go.jp/lrc/index.php?UniDic%2F%B6%E1%C2%E5%CA%B8%B8%ECUniDic]]
-関連文章:小木曽智信・小椋秀樹・近藤明日子(2008)「近代文語文を対象とした形態素解析辞書の開発」言語処理学会第14回年次大会発表論文集 pp.225-228
**茶筌
-内容:自然言語処理研究の分野で形態素解析のためにもっとも広く使われているフリーソフトウェアです。Win版もあります。KH Coderは茶筌を組み込んでいるので、茶筌を使いたいのであれば、[[KH Coder>http://khc.sourceforge.net/]]を利用することをお薦めします。
-PCスキル:★★
-入手方法:[[Chasen's Wikiよりダウンロード>http://chasen.naist.jp/hiki/ChaSen/]]
-関連文章:文系向け茶筌のインストール方法です。[[麗澤大学言語研究センター作成>http://www.fl.reitaku-u.ac.jp/LINC/projects/langTech/pub/chasen_install.pdf]]
**Juman
-内容:形態素解析ソフトウェア
-入手方法:ウェブページからダウンロード。[[詳細はこちらから>http://nlp.kuee.kyoto-u.ac.jp/nl-resource/juman.html]]
-PCスキル:★★★★
-関連文章:[[JUMAN/KNPのチュートリアルのスライド>http://nlp.kuee.kyoto-u.ac.jp/nl-resource/knp/20050830-practice.ppt]]
**KNP
-内容:係り受け解析ソフトウェア
-入手方法:ウェブページからダウンロード。[[詳細はこちらから>http://www-lab25.kuee.kyoto-u.ac.jp/nl-resource/knp.html]]
-PCスキル:★★★★
-関連文章:[[JUMAN/KNPのチュートリアルのスライド>http://nlp.kuee.kyoto-u.ac.jp/nl-resource/knp/20050830-practice.ppt]]
**MeCab (和布蕪)
-内容:形態素解析ソフトウェア
-入手方法:ウェブページからダウンロード。[[詳細はこちらから>http://mecab.sourceforge.net/]]
-PCスキル:★★★★
**Cabocha
-内容:Support Vector Machines に基づく日本語係り受け解析器
-入手方法:ウェブページからダウンロード。[[詳細はこちらから>http://chasen.org/~taku/software/cabocha/]]
-PCスキル:★★★★
-コメント:楽しいデモがあります。
----
*掲示板
#bbs
2013-05-28T00:23:04+09:00
1369668184
-
コーパス紹介(学習者)
https://w.atwiki.jp/corpus-ling/pages/73.html
サイト移転しました。
[[http://jhlee.sakura.ne.jp/>http://jhlee.sakura.ne.jp/]] から御覧ください。
#contents()
----
*はじめに
+現在、日本国内で比較的に低コストで入手可能なコーパス・言語資源の概要と入手方法を紹介します。
*話し言葉を収録した学習者コーパス
**日本語学習者会話データベース
+内容:9日本語学習者とテスターの会話データ390件。学習者の属性情報とレベル判定付
+入手方法:ウェブ上で利用。要認証[[https://dbms.ninjal.ac.jp/nknet/ndata/>https://dbms.ninjal.ac.jp/nknet/ndata/]]
**KYコーパス(第二言語としての日本語学習者の話し言葉)
+内容:90人分のOPIテープを文字化した言語資料である。90人の被験者を母語別に見ると、中国語、英語、韓国語がそれぞれ30人ずつであり、さらに、その30人のOPIの判定結果別の内訳は、それぞれ、初級5人、中級10人、上級10人、超級5人ずつある。
+入手方法:利用申請書を郵送する。詳細は[[こちら>http://opi.jp/shiryo/ky_corp.html]]
**CHILDES(The Child Language Exchange System)
+内容:国際的な言語獲得研究のためのデータベースプロジェクトです。日本語幼児のデータもあります。解析用のツールも公開されています。
+入手方法:ウェブページからダウンロード。[[詳細はこちらから>http://childes.psy.cmu.edu/index.html]]
+関連文章: [[宮田Susanne 編 Brian MacWhinney 監修(2004)『今日から使える発話データベースCHILDES入門』ひつじ書房>http://www.amazon.co.jp/%E4%BB%8A%E6%97%A5%E3%81%8B%E3%82%89%E4%BD%BF%E3%81%88%E3%82%8B%E7%99%BA%E8%A9%B1%E3%83%87%E3%83%BC%E3%82%BF%E3%83%99%E3%83%BC%E3%82%B9CHILDES%E5%85%A5%E9%96%80-%E5%AE%AE%E7%94%B0-Susanne/dp/4894762269]]
+CHILDESの各種案内: 橋本智也さん(大阪府立大学)のページに有益な情報が載っています。[[こちらから>http://www.first-language-acquisition.jp/childes.htm]]
*書き言葉を収録した学習者コーパス
**日本語学習者による日本語作文と,その母語訳との対訳データベース(作文対訳DB)
+日本語学習者による日本語作文と作文執筆者本人による母語訳のデータベース。作文データの総数は1,565件。
+入手方法:ウェブ上で利用者登録をし、IDとパスワードを発行してもらってからデータベースにアクセス。詳細は[[!こちらから!>http://jpforlife.jp/taiyakudb.html]]
**日本・韓国・台湾の大学生による日本語意見文データベース
+東京外国語大学伊集院郁子先生が構築したもの。日本語を母語とする大学生(134 名)と日本語を学ぶ大学生(台湾57 名、韓国 55 名)が日本語で執筆した意見文を収録したデータベース。
+入手方法:ウェブ上でテキストファイルおよびPDFファイルとして閲覧。ダウンロードも可能。利用者登録不要。詳細は[[!こちらから!>http://www.tufs.ac.jp/ts/personal/ijuin/koukai_data1.html]]
2013-05-28T00:22:54+09:00
1369668174
-
コーパス紹介(母語話者)
https://w.atwiki.jp/corpus-ling/pages/72.html
サイト移転しました。
[[http://jhlee.sakura.ne.jp/>http://jhlee.sakura.ne.jp/]] から御覧ください。
#contents()
----
*はじめに
+現在、日本国内で比較的に低コストで入手可能なコーパス・言語資源の概要と入手方法を紹介します。
+主に現代語の研究を想定したものです.
*書き言葉
**現代日本語書き言葉均衡コーパス
+内容:1億語規模の現代日本語の書き言葉コーパス。利用方法は3つ
+利用方法1(オンラインコーパスツールで利用)
++[[少納言>http://www.kotonoha.gr.jp/shonagon/search_form]]:文字列検索のみ対応,データのダウンロード不可
++[[中納言>https://chunagon.ninjal.ac.jp/]]:文字列検索,品詞による検索,長単位検索,データのダウンロード可
++[[NINJAL-LWP for BCCWJ>http://ninjal-lwp-bccwj.ninjal.ac.jp/]]:辞書引き的に使えるオンラインコーパスツール,データのダウンロード不可
+利用方法2(DVDで利用):[[コーパス開発せんたーBCCWJ>http://www.ninjal.ac.jp/corpus_center/bccwj/apply/]]
**青空文庫
+内容:ネット上の電子図書館『青空文庫』の公開作品を一枚に収録しています。
+入手方法1:「蔵書○○○○」という形で毎年更新版を500円で販売しています。現在は完売に購入はできないようです。
+入手方法2:『インターネット図書館 青空文庫』を購入するとDVD-ROM(青空文庫4843作品ほか収録)が付いてきます。
+関連論文:[[夷石寿賀子, 千葉 庄寿, 陳君慧 (2006)「『青空文庫』を言語コーパスとして使おう―メタデータ構築による歴史的・社会言語学的研究への応用の試み―」(言語処理学会第12回年次大会 (NLP2006) 発表論文集 pp.915-918)>http://www.fl.reitaku-u.ac.jp/LINC/projects/langTech/pub/nlp2006.pdf]]
+茶漉による青空文庫の検索: [[日本語用例・コロケーション抽出システム『茶漉』による検索システム>http://tell.fll.purdue.edu/chakoshi-wiki/]]
+[[大阪大学田野村先生が作成した青空文庫のKWIC>http://www.tokuteicorpus.jp/team/jpling/kwic/]]: 文字列単位の検索とExcelへの出力ができます。
+『「青空文庫」変換スクリプトパッケージ』:青空文庫の文書から『ひまわり』検索用データ(XML 形式のコーパスファイル)を作成するためのツールです。『インターネット図書館 青空文庫』を資料として利用しています。変換対象となったのは,2560作品です。[[詳細はこちらをご覧ください>http://www.kokken.go.jp/lrc/index.php?%C1%B4%CA%B8%B8%A1%BA%F7%A5%B7%A5%B9%A5%C6%A5%E0%A1%D8%A4%D2%A4%DE%A4%EF%A4%EA%A1%D9%2F%C0%C4%B6%F5%CA%B8%B8%CB%A4%CE%CA%B8%BD%F1%A4%F2%A1%D8%A4%D2%A4%DE%A4%EF%A4%EA%A1%D9%A4%C7%CD%F8%CD%D1%A4%B9%A4%EB%CA%FD%CB%A1%A3%B2]]
**新潮文庫の100冊
+内容:新潮文庫で絶版となった、入手不可能な珠玉の100作品を収録しています。テキストコーパスとして利用するには、テキスト化ツールを使ってテキストとして加工する必要があります。[[詳細はこちら>http://homepage1.nifty.com/mshibata/sz100.htm#tool]]。続編に『CD-ROM版 新潮文庫 明治の文豪』、『CD-ROM版 新潮文庫 大正の文豪』などがあります。
+入手方法:[[ウェブから購入するには>http://www.dotbook.jp/voyager/list/voyager.html]]。
**日英新聞記事対応付けデータ
+内容:読売新聞と The Daily Yomiuri から自動作成された日英対応付けコーパスです。
+入手方法:ダウンロードなど[[こちらから>http://mastarpj.nict.go.jp/~mutiyama/jea/index-ja.html]]
+関連論文: Masao Utiyama and Hitoshi Isahara. (2003) Reliable Measures for Aligning Japanese-English News Articles and Sentences. ACL-2003, pp. 72-79.]]
**日英対訳文対応付けデータ
+内容:Project Gutenberg や青空文庫やプロジェクト杉田玄白などの作品について日本語文と英語文との対訳文対応を付けています。
+入手方法:[[ダウンロードなど>http://mastarpj.nict.go.jp/~mutiyama/align/index.html]]
**京都テキストコーパス(Version 4.0)
+内容:毎日新聞の記事に各種言語情報を人手で付与したテキストコーパス
+入手方法:ウェブよりダウンロード。詳細は[[こちら>http://nlp.kuee.kyoto-u.ac.jp/nl-resource/corpus.html]]
+コメント:ここに含まれるのは形態素・構文・関係の付加情報だけで, もとの毎日新聞データは含まれていません。コーパス本来の形に変換するには毎日新聞1995年版CD-ROMが必要です。
**新聞記事データベース
+内容: 毎日、朝日、読売新聞記事のデータ版
+入手方法:利用許諾契約を結ぶことで、研究目的での利用ができます。ただし、非常に高額なので、個人での使用には向かないかもしれません。詳細は[[こちらから>http://www.nichigai.co.jp/sales/announce.html]]
**国会会議録検索システム
+内容:戦後の帝国議会や国会議事録を検索することができます。
+利用方法: ウェブから検索できます。詳細は[[こちらへ>http://kokkai.ndl.go.jp/]]
**判例検索システム
+内容:裁判所の判例情報を検索するシステムです。コーパスとしての利用可能性についてはやや疑問がありますが、テキストデータの検索が可能です。
+利用方法: ウェブから検索できます。詳細は[[こちらへ>http://www.courts.go.jp/search/jhsp0010?action_id=first&hanreiSrchKbn=01]]
**形態素解析済みコーパスの公開
+内容:ウェブでフリーで公開されているテキストに対し、自動的に形態素解析を行い、その情報を付与したものです。データのフォーマットは国立国語研究所で公開している全文検索システム『ひまわり』に準拠しています。利用者の皆様は、本コーパスをダウンロードし、『ひまわり』をパソコンにインストールすれば、単語単位での例文検索、基本形での例文検索、品詞による検索結果の絞り込み、といった作業を簡単に行うことができます。
+入手方法:[[http://nlp.kuee.kyoto-u.ac.jp/NLP_Portal/jeita_corpus/index.html]]
*話し言葉
**日本語話し言葉コーパス
+内容:国立国語研究所・情報通信研究機構・東京工業大学が共同開発した話し言葉データベース
+入手方法:[[『日本語話し言葉コーパス』公開のご案内>http://www.ninjal.ac.jp/csj/]]
+関連サイト:菊池英明先生(早稲田大学)による「CSJの利用ガイド」で分かりやすい解説をしています。[[こちらから>http://www.f.waseda.jp/kikuchi/tips/csj_use.html]]
**BTSによる多言語話し言葉コーパス
+内容:日本語母語話者同士の会話と、日本語母語話者と日本語学習者の会話の文字化資料(CD-ROM)。
+入手方法:[[利用申込書による申請>http://www.tufs.ac.jp/ts/personal/usamiken/corpora.htm]]
+関連論文:[[宇佐美まゆみ(2003)、『多文化共生社会における異文化コミュニケーション教育のための基礎的研究』(科学研究費補助金基盤研究(C) 2:研究代表者 宇佐美まゆみ)研究成果報告書、4-21.>http://www.coelang.tufs.ac.jp/publications/corpora/mojika.pdf]]
**女性のことば・職場編
+内容: 1993年9月~11月に首都圏で収録された音声資料を文字化したもの。対象は有識の20代から50代の女性。19名の協力者に職場でのインフォーマルな場面とフォーマルな場面での自然会話を録音している。書籍にフロッピィディスク付。CVS(コンマ区切り)ファイルをLHAで、圧縮した資料を付属する。
+入手方法:書籍として購入(\3,675)。[[アマゾンで購入したい場合は、こちらをクリック>http://www.amazon.co.jp/%E5%A5%B3%E6%80%A7%E3%81%AE%E3%81%93%E3%81%A8%E3%81%B0%E3%83%BB%E8%81%B7%E5%A0%B4%E7%B7%A8-%E7%8F%BE%E4%BB%A3%E6%97%A5%E6%9C%AC%E8%AA%9E%E7%A0%94%E7%A9%B6%E4%BC%9A/dp/4938669935/ref=sr_1_3?ie=UTF8&s=books&qid=1202426114&sr=1-3]]
**男性のことば・職場編
+内容: 1999年10月~2000年12月に首都圏で収録された音声資料を文字化したもの。対象は有識の20代から50代の男性で、各世代5名で異なる職種・職場からなる19名の協力者に職場でのインフォーマルな場面とフォーマルな場面での自然会話を録音している。書籍にCD-ROM付。CVS(コンマ区切り)ファイルをLHAで、圧縮した資料を付属する。
+入手方法:書籍として購入(\2,940)。[[アマゾンで購入したい場合は、こちらをクリック>http://www.amazon.co.jp/%E7%94%B7%E6%80%A7%E3%81%AE%E3%81%93%E3%81%A8%E3%81%B0%E3%83%BB%E8%81%B7%E5%A0%B4%E7%B7%A8-%E7%8F%BE%E4%BB%A3%E6%97%A5%E6%9C%AC%E8%AA%9E%E7%A0%94%E7%A9%B6%E4%BC%9A/dp/4894761610/ref=sr_1_2?ie=UTF8&s=books&qid=1202426114&sr=1-2]]
**戦時中の話しことば
+戦時中の1936年から戦後の1955年の間に、日本放送協会からラジオで放送された78冊のラジオ台本を文字化し、Unicodeテキストファイル(タブ区切り)としたもの。
+入手方法:書籍として購入(\3,990)。テキストデータCD-ROMが付いてくる。[[アマゾンで購入したい場合は、こちらをクリック>http://www.amazon.co.jp/%E6%88%A6%E6%99%82%E4%B8%AD%E3%81%AE%E8%A9%B1%E3%81%97%E3%81%93%E3%81%A8%E3%81%B0-%E9%81%A0%E8%97%A4-%E7%B9%94%E6%9E%9D/dp/4894762226/ref=sr_1_1?ie=UTF8&s=books&qid=1202444770&sr=8-1]]
**日本語会話データベース
+内容:日本語母国語話者(以下NS)と非母国語話者(以下NNS)の発話パターンの比較分析と日本語教育向けの基礎資料となる言語データベース
+入手方法:ウェブからダウンロード。詳細は[[こちら>http://www.env.kitakyu-u.ac.jp/corpus/]]
*ウェブデータ
**Sketch Engine
+内容:ウェブ上でコーパス検索ができるデータとツールが実装されています。BNCコーパスをはじめ,日本語,ロシア語,スペイン語,フランス語,中国語など,様々な言語のデータを利用することができ,体系化された情報と直観的なインタフェイスで非常に使いやすいデータベースになっています。日本語の元データはウェブで,約4憶語規模のコーパスです。
+コメント:利用はフリーではありませんが,30日間のトライアルアカウントをもらうことができます。正式な利用のためには1年間で約1万円の利用料がかかります。
+入手方法:ウェブからアクセス。[[こちらから入ってください>http://www.sketchengine.co.uk/]]
+関連論文
--[[The Sketch Engine (published: Proc EURALEX 2004, Lorient, France)>http://trac.sketchengine.co.uk/attachment/wiki/SkE/DocsIndex/sketch-engine-elx04.pdf?format=raw]],
--Srdanović, E. I., Erjavec T. & Kilgarriff, A. (2008). A web corpus and word-sketches for Japanese. Sizen gengo syori (Journal of Natural Language Processing) 15/2. 137-159.・・・>[[PDFファイル>https://www.jstage.jst.go.jp/article/imt/3/3/3_3_529/_pdf]]
--スルダノヴィッチ・エリャヴェツ・イレーナ,仁科喜久子(2008)「コーパス検索ツールSketch Engineの日本語版とその利用方法」[[『日本語科学』第23号>http://www.ninjal.ac.jp/products-k/kanko/kagaku/kikan21-30/index.html]], 国書刊行会,59-79.・・・>[[PDFファイル(著者より提供)>http://jhlee.sakura.ne.jp/geo-backup/J-corpus/Srdanovic-Nishina-SkE-Nihongokagaku-2008.pdf]]
**Wikipediaのコーパス化
+内容:長谷部陽一郎さん(同志社大学)による試み。[[ウィキペディア>http://ja.wikipedia.org/wiki/]]をダウンロード後、テキストに変換し、日本語コーパスとして利用するというもの。
+コメント:利用方法の詳細を記した論文があります。非常に面白い試みだと思います。コーパス化に必要な一連の自作ツール(フリー)も同時に公開しています。
+入手方法:1) [[Wikipedia:データベースダウンロード>http://download.wikimedia.org/jawiki/]]から記事をダウンロードする。2)[[http://www.yohasebe.com/>http://www.yohasebe.com/]]にアクセス後、ツールをダウンロード。利用法の詳細は[[こちらの論文をご覧ください>http://elib.doshisha.ac.jp/cgi-bin/retrieve/sr_bookview.cgi/U_CHARSET.utf-8/BD00011587/Body/006009020008.pdf]]
**Webから自動構築した大規模格フレーム
+内容:Webテキストから自動構築した大規模格フレームです。動詞と共起する格助詞と名詞を検索することができます。
+規模:約5億文をの日本語テキストから自動構築し、約5万用言から構成されています。
+入手方法:基本的にはウェブ上での使用のみです。[[詳細はこちらから>http://nlp.kuee.kyoto-u.ac.jp/nl-resource/caseframe.html]]
+関連論文:
++河原大輔, 黒橋禎夫.「高性能計算環境を用いたWebからの大規模格フレーム構築」『情報処理学会 自然言語処理研究会』171-12, pp.67-73, 2006.
++河原大輔, 黒橋禎夫.「格フレーム辞書の漸次的自動構築」『自然言語処理』Vol.12, No.2, pp.109-131, 2005.
++黒橋禎夫, 河原大輔.「格フレームを用いた自然言語処理――基本語彙の整理と格フレームの自動獲得〈上〉」『月刊言語2007年11月号』
+[[「Webから自動構築した大規模格フレーム」の使用レポート]]
*辞書・シソーラス
**日本語WordNet
+内容:Princeton WordNet の日本語版で、日本語の意味辞書。様々な検索用のモジュールがある。
+入手方法:ウェブからアクセス。[[http://nlpwww.nict.go.jp/wn-ja/>http://nlpwww.nict.go.jp/wn-ja/]]
**動詞項構造シソーラス
+内容:人の言葉をコンピュータで処理するために動詞の概念を整理したコンピュータ用の辞書を構築してfreeで配布しています(現在4425語(7473語義))
+入手方法:ウェブからダウンロード。[[詳細はこちらから>http://cl.cs.okayama-u.ac.jp/rsc/data/index.html]]
+研究:[[竹内孔一, 乾健太郎, 竹内奈央, 藤田篤,意味の包含関係に基づく動詞項構造の細分類発表番号: B5-2, 言語処理学会年次大会,2008年3月,東京大学>http://cl.cs.okayama-u.ac.jp/rsc/data/papers/golex.pdf]]
**日本語動詞の結合価
+内容:荻野孝野・小林正博・井佐原均(編著)によるもの。15万文規模の日本語文集合をもとに、「動詞がとりうる格と、その格を担う体言」について整備した、大規模な言語データ集。
+入手方法:書籍を購入(50,400円)すれば,CD-ROMが付属されており,検索用ツールなども公開されている.詳細は[[三省堂>http://www.sanseido-publ.co.jp/publ/nihongo_dosi_ketugoka.html]]参照
**分類語彙表
+内容:国立国語研究所により作成されたもので、延べ約9万6千語の日本語の単語を意味的に分類したものです。
+入手方法:大日本図書より販売されています(\4,700)。書籍内には、PDFファイルのCD-ROMも入っています。詳細は[[国立国語研究所のページ>http://www.kokken.go.jp/kanko/goihyo/syokai/]]参照
**日本語語彙大系
+内容:30万語の収録語は3000種の意味分類を用いて定義されている、大規模の日本語シソーラスです。3000種の意味分類を用いて日本語の文型を定義しています。
+入手方法:[[ウェブより購入可(ISBN: 4001301016; 60,000円)>http://www.iwanami.co.jp/.BOOKS/13/6/1301010.html]]
+関連論文:[[詳細はこちら>http://www.kecl.ntt.co.jp/mtg/resources/GoiTaikei/]]
+書籍についての[[詳細はこちらを>http://www.iwanami.co.jp/hotnews/GoiTaikei/]]
+[[「日本語語彙大系」の使用レポート]]
**IPAL辞書 (動詞,形容詞,名詞)
+内容:日本語の基本語(動詞861語,形容詞136語,名詞1081語) の詳細な文法情報を掲載した電子化辞書です。動詞辞書の場合、動詞の意味グループ別に分かれていて、見出し語の動詞と共起する格助詞、そして名詞の意味特徴が指定されています。
+入手方法:GSKより配布中。[[詳細はこちらを>http://www.gsk.or.jp/catalog/GSK2007-D/catalog.html]]
**EDR電子化辞書
+内容:計算機による言語処理のために開発された辞書です。単語辞書などのいくつかの大規模な個別辞書から構成されています。
+入手方法:[[詳細はこちらから>http://www2.nict.go.jp/r/r312/EDR/J_index.html]]
+コメント:非常に高価な辞書ですので、個人での購入には不向きですが、非常巨大で優れた電子辞書です。
----
2013-05-28T00:22:40+09:00
1369668160
-
トップページ
https://w.atwiki.jp/corpus-ling/pages/1.html
サイト移転しました。
[[http://jhlee.sakura.ne.jp/>http://jhlee.sakura.ne.jp/]] から御覧ください。
----
----
**お知らせ
サイト移転しました。
[[http://jhlee.sakura.ne.jp/>http://jhlee.sakura.ne.jp/]] から御覧ください。
----
2013-05-28T00:22:10+09:00
1369668130
-
メニュー
https://w.atwiki.jp/corpus-ling/pages/2.html
メニュー
-[[コーパス紹介(母語話者)]]
-[[コーパス紹介(学習者)]]
-[[コーパスツール]]
-[[テキスト処理ツール]]
-[[資料(文献リストなど) ]]
-[[ダウンロード]]
-[[管理者]]
-[[問い合わせ]]
2013-05-05T14:47:06+09:00
1367732826