2013年3月25日月曜日

LCSAW 2013


 2013年3月23-24日に神戸大学百年記念館においてLearner Corpus Studies in Asia and the World (LCSAW)と題して国際シンポジウムが開催されました。これは神戸大学の石川慎一郎先生が中心になって作成したThe International Corpus Network of Asian Learners of English (ICNALE)の完成を記念して(?)開催されたもので、学習者コーパスの研究において著名な研究者を世界各地から招いて行われていました。参加者は配布された名簿によれば90名以上(そんなにいるようには見えなかったのだけど)とのことで、多くの参加者は日本人でしたが日本在住で英語を母語とする人も多く参加しており、各発表において英語で活発な議論が行われました。ICNALEの詳細についてはサイトを参照してもらった方が早いと思いますが、コーパスの特徴としては、

(1)アジアの学習者に焦点
(2)ライティングにおける変数をできるだけ統制
(3)学習者を熟達度によって分類
(4)英語母語話者のサンプルも収集

という4点に集約されます。

今回は自分の勉強のために参加したので、勘違いや的外れなまとめが多いかもしれませんが(いつもだけど)、以下いくつかの発表の備忘録。

Granger, S. 
Contrastive Interlanguage Analysis: A Reappraisal

最初の講演。対照中間言語分析の全体像について、そして中間言語に影響を与える変数として母語の話をされた後、その他の変数(習熟度や地域など)も考慮に入れることが重要であると主張されました。International Corpus of Learner Language (ICLE)ではこれらの変数ごとにソートができるそうです(ICLEについては以下の論文も参考になりますね)。

Granger, S. (2003). The international corpus of learner English: A new resource for foreign language learning and teaching and second language acquisition research. TESOL Quarterly, 37(3), 538-546.

また対照中間言語分析、コーパス分析において「英語母語話者を規範としている」という批判に対しては、SLAをはじめとした他の研究でも同様の状況だと批判を一蹴されました。またコーパスのデータに基づくだけではなく実験的手法に基づいたelicitationデータを利用してコーパスデータを補完することの重要性も指摘されました。

Ishikawa, S. 
The ICNALE and Sophisticated Contrastive Interlanguage Analysis of Asian Learners of English. 

石川先生と言えばお馴染みのスライドの上にタイマーを表示させながら、壇上を所狭しと動き回るスタイルでの講演。ICLEやJEFLLコーパスを紹介した後、ICNALEの特長について解説されました。

対照中間言語分析は主に(1)過剰・過少使用、(2)L1の転移、(3)学習者のコミュニケーションにおける回避、(3)(非)英語母語話者の言語使用、(4)非英語母語話者が苦手な側面を扱うものであるとまとめられました。またそれに対する批判のまとめとしてはGranger (2009)があり、それらは主に英語母語話者を規範とすることに対してのものであるそうです。今後より洗練されたものにしていくためにはExternal Conditions、External Validity、Internal Validityの3つが必要になると話を締めくくられました。

また『ウィズダム和英辞典(第2版)』を紹介されましたが、この辞書にはICNALEのデータが活用されているようです(訂正:指摘をいただきました。英和ではなく和英でした(2013.3.25))。

Kirkpatrick, A
The Asian Corpus of English: Motivation and Aims

ASEANの国および中国、日本、韓国のデータを収集したAsian Corpus of English (ACE)の紹介。詳細はThe ACE manual(PDF)および彼の著作を参照のこと(今回の講演と似たような内容としてこんなスライドもオンラインにありました)。

現在はEnglish as a Lingua Franca (ELF)の時代であるとして、このようなコーパスの意義を強調されました。またACEはヨーロッパにおける同等のコーパスVienna Oxford International Corpus of English (VOICE)との比較を主眼に置いているそうです。

両者の比較を行った結果の予備的な考察として以下のようなものを提示されました。

VOIEとACEの比較
・3人称単数の付け忘れ
・動詞の拡張的使用
・同じ付加疑問詞の使用
・指示詞のthisと名詞の複数形の組み合わせ
・通常とは異なる前置詞の使用

VOICEにあってACEにないもの
・who/whichの相互使用
・(不)定冠詞の柔軟な使用
・不可算名詞を複数形として使用

ACEにみられるもの
・過去時制における原形の使用
・冠詞の省略
・複数のsの欠如
・連結詞beの省略

Granger, S. 
The Passive in Learner English: Corpus Insights and Implications for Pedagogical Grammar

1日目の概説的な内容とは打って変わって、受動態に特化した講演でした。

コーパスを利用した受動態についての研究にはStartvik (1996)やGranger (1983)、Biber et al. (1999)などがある。それらの研究の結果明らかになったのは80-90%の文においては行為主が省略されているということ、またgetを利用した受動態は少ないということである。

これら先行研究の結果を踏まえた上で、ICLEとICNALEとの比較を行った。受動態は自動的にPOSタグ付けしたデータから、<Vbe>、<VVN>のタグで検索して取り出した。この方法の限界はHe was recently arrested.のようにbe動詞と過去分詞の間に何かが入っている場合は取り出せないことである(これは解決は難しいにしても何とかしたい問題ですね)。

熟達度が上がると受動態の頻度が高くなるという仮説を立てたが、これは立証されなかった。1つの理由として考えられるのはトピックによる影響とのこと。実際ICNALEの2つのトピックで比較をしてみると”It is important for college students to have a part-time job.”よりも”Smoking should be completely banned at all the restaurants in the country.”のトピックの方が受動態が多用されているという結果であった。また後者のトピックにおいては、

A2   : 20%
B1.1: 28%
B1.2: 37%
B2   : 47%

という割合でbe bannedが利用されており、エッセイの刺激文にも影響されていることがわかる。

次にThe disadvantage can be see in the poor economy status. 

のように過去分詞にできていない間違いについては<Vbe><VV0>で検索をした結果、400件の誤用が見つかった。

またELTの文法テキストを分析した結果、これらコーパスデータの分析結果から明らかになったことはほとんどテキストに反映されておらず、語彙とのかかわりについては絶望的な状況であると指摘した。例外としてはCerce-Murica & Larsen-Freeman (1999)の本(?おそらくリンク先の本だと思うのですが)、Cowan (1998)のThe Teacher’s Grammar of Englishを挙げられました。

最後にコーパスに基づいた研究の結果をテキストの受動態のセクションに活かすためには、

・頻度情報
・lexico-grammarパターンのリスト
・使用域
・学習者が困難と感じる受動態のパターン
・言語グループ特有の困難点

などの情報を追加するべきだと主張されました。

その他、印象に残った言葉としては、

Learner corpus data can contribute to a better understanding of the acquisition of [文法項目など] and better descriptions in ELT tools. 

...”marketability rather than pedagogical effectiveness” is the publishers’ main concern and that many editors are “far more comfortable with rehashes of what has gone before than with something different (and refreshing)” (Harwood, 2005)

などがあります。

======================
ということでコーパスに興味を持ち書籍を読んだりはしていたものの、このようなシンポジウムに参加する機会がなかなか無かったので、とても参考になりました。面白かったのは日本の研究者たちはコレスポンデンス分析等の統計的手法を駆使して分析した結果を発表をしていたのに対し、海外の人たちはコーパスに見られる実例を提示することが中心で、数値と言えば頻度や%、またグラフの提示に留めているということでした。どちらが良いとは言えませんが、英語母語話者は「直感とは異なるデータ(実例)の面白さ」、非英語母語話者は「(直感が無いためか)統計的手続きに則ったデータの確からしさ」に興味があるのかもしれません。

現在世界各地で様々な学習者コーパスが構築されています。今まではコーパスを構築して言語を記述するだけで良かったのかもしれませんが、「学習者」ということばが付いている以上、教育の視点を排除することはできない訳で、現在はコーパスデータを教育に活用するというステージに入っているのでしょう。その視点から言えば、語レベルの分析に留まってしまうとやはり物足りない側面もあるので、今回のシンポジウムでもword clusterやdiscourse markerなど語よりも少し大きな単位で分析をしている発表がいくつかありました。けれども語レベルを超えてしまうとタグ付けの作業等が膨大なものになってしまうので、そこを石川先生が最後にCollaborationということばで締めくくられたように、学習者コーパスの研究だけではなく各分野の研究者たちが協力していくことが大切になってくるのかもしれませんね。

またシンポジウムの中では時折SLAを意識した発言がありましたが、このあたりはどうなのでしょうか。学習者コーパス研究は大きな枠組みでいうとどこの研究に属するのか(SLA?文学?教育?言語学?)ということも少し気になりました(このあたりは詳しくないので私見です)。


百年記念館前の桜
百年記念館からの景色

0 件のコメント: