2009年2月28日(土曜日)に京都外国語大学で行なわれた応用コーパス言語学研究会 第2回ワークショップに参加した。講師は「日本人1200人の英語スピーキングコーパス」著書の一人である独立行政法人情報通信研究機構(NICT)言語基盤グループの一員である和泉絵美氏。著名人ということもあり,定員40名はすぐに一杯になり,遠くは沖縄から関東に至るまで全国各地から参加者が集まった。午後1時からの開催であったが,迷って到着した時には12時58分(焦)。座った席の前には大学時代のサークルの先輩であり同業者である広島の大学の先生方がいて,偶然に驚く(笑)。
4時間という長時間のワークショップはPart 1学習者コーパスの応用可能性,Part 2学習者コーパスにおけるアノテーション,Part 3「ネタの宝庫」学習者コーパス,という構成で行なわれた。以下それぞれのパートごとに簡潔なまとめを。
Part 1学習者コーパスの応用可能性
英語教育への応用としては1)学習者言語の記述,2)学習者支援教材/システムの開発(LDOCE, CALDなど学習者用辞書,CUPの教材など,NICTではNICT’s Edenと呼ばれるerror detectionシステムを開発中であり,NICTのコーパスを使ったMicrosoft ESL Assistant などもある),3)学習者による直接参照(これに関してはあまり事例無し)が考えられる。
その中の1)に関してはContrastive Interlanguage Analysis (CIA),Computer-aided Error Analysis (CEA)がある。CIAでは英語母語話者との比較あるいは非母語話者同士の比較などで,学習者の高頻度使用語彙,モダリティ,コロケーション/連語など,その他あらゆる個別の言語項目をトピックとする(文献リスト)。CEAはまだ数が少ないが,多くは文法,語彙レベルで行なわれている。
Part 2学習者コーパスにおけるあのテーション
NICT JLE Corpus Analysis Took, TagEditor, Antconcなどを利用して実際にアノテーションをしてみる。error annotationとしては母語話者による訂正文の付与,母語話者によるコメントの付与,母語話者による評価の付与,エラーの分類及びタグ化,などがある。エラータグ付与補助ツールとして紹介されたのはUniversite Catholique de Louvain Error Editor (UCLEE)やNICTが開発したTagEditor,University of Jaenが開発中のものなど。
Part 3「ネタの宝庫」学習者コーパス
この辺りは駆け足だったのだけれど,Antconcなどを利用した分析についての紹介。
=====================================
具体的な言葉は忘れたけれど,和泉氏が言っていたように商業ベースなのは強い。豊富な(?)資金力及び組織としての力を感じさせるワークショップだった。情報収集力もさすがなもので,開発中のものも含め世界における学習者コーパス関連の情報を得ることができただけでも有意義なワークショップだったと思う。ただ,大規模な学習者コーパスにどのようにエラーのタグを付けるかについては参加者の中からも質問があったように今後改善の余地があるようだ。どこまで主観/客観を分けることができるのか,また自動化/マニュアルの使い分けをどうすれば良いのか,などなど。これは和泉氏というよりも,学習者コーパスにおけるエラーというテーマにかかわるものではあるのだけれど。。。
0 件のコメント:
コメントを投稿