タグ別アーカイブ: スピーキング

スピーキングの授業の話

はじめに

私は,1年生対象の共通教養科目のListening&Speakingの授業を昨年度から担当しています。昨年度色々と試行錯誤を重ねて,今年度からはその反省も踏まえて改善できていると感じています。一方で,自分の中で授業の型はそれなりにできてきてはいるのですが,課題もそれなりに感じています。この記事では,授業の進め方と今感じている課題の両方についてまとめておこうと思います。

授業の概要

教科書はPearsonのImpact Issues2というものを使っています。版が新しくなったのですが,色々あって(学務的な意味で)新版ではなく旧版を使っています。細かいミスがちょくちょくあったりとかしておいおいと思うところもあるのですが,なんといっても掲載されているトピックというか「ネタ」がとても面白くてタスク向きなので,それが気に入って使っています。

教科書の構成はおもに,次のようなものです。

  1. 会話や語りのリスニングパート
  2. 内容確認
  3. 4人の視点からそのユニットの問題についてのopinionが提示される
  4. 主にペアやグループで行うディスカッション系のタスク
  5. スピーチ

私は授業では1しか扱っていません。2の内容確認はLMSで予習として行わせていて,授業中では教科書に載っている内容確認問題とは少し違う問題をいくつか提示してその答えに注目して聞くようなリスニング活動をやっています。そして,それ以降はスピーキングタスクのための時間です。スピーキングタスクが終わったら,どのような意見にまとまったか,どういった解決策にたどり着いたかなどを教室全体でシェアし,言語的なフィードバックを与えて授業は終了です。

スピーキングタスク

スピーキングタスクの題材は教科書で扱われているものを元にオリジナルで作っています。例えば,「クラスメイトから嫌がらせをされて困っているが,事を荒立てたくないので黙っていようとする女の子と,誰かに相談したほうがいいよと提案する友達」の話であれば,第三者の視点からこの問題を考えるタスクを作ります。2人の共通の友人という設定で,この問題を解決するためにはどうしたらよいかをペアで話し合い,お互いが納得する解決策を出せたらタスク達成というようなものです。

言いたかったけど言えなかったことリスト

授業で使うワークシートには,毎回「言いたかったけど言えなかったこと」を記入するスペースを設けています。授業中にここに書かれたものを見ながらフィードバックを決めたりしています。ただし,もちろん全部を取り上げることはできないので,あとで集めてリスト化して英訳と簡単な解説を付けたものを「言いたかったけど言えなかったことリスト」として翌週に配布するようにしました。最初はワークシートに直接書いていたのですが,同じようなことを書いている学生もいて同じことを何度も書くのは面倒だし,どうせなら全員で共有したほうが学生にとっても有益だろうと考えてこの形にしました。学生には,「自分が思ったこと」をそのまま書くのではなく,できるだけ日本語で「意味順」の形に落とし込むところまではやるように言っています(なかなか浸透していかないのですが…)。

授業の中で,同じタスクを繰り返してやることは時間の制約上なかなか難しいのですが,中には汎用的な表現も出てきたり(「絶対に嫌だ」みたいなのとか)するので,そういう表現は翌週や翌々週の違うタスクで使ってみている学生がいたりします。また,テストでは同じユニットのタスクにあたる可能性もあるので,こういったリストがあることでスピーキングテストのテスト勉強にも少しは役に立っているのかなと思っています。それ覚えさせて言わせているだけじゃんと思われる方もいるかもしれませんが,私は「覚えろ」という指導は一切していませんし,授業中に表現の口頭練習なども一切していません。ただリストを渡しているだけです(注1)。また,どの場面でどの表現を使うかは完全に学習者にゆだねていますし,会話の流れも流動的なので覚えたら必ず使う場面が訪れるとも限りません。

私が重視しているのは,なにか言えなかったことがあっても,それをワークシートに書けばフィードバックが与えられ,そこで新たなリソースを得て次に少しでも「言えた」と思える機会を増やすチャンスが与えられるということです。手間は確かにかかるのですが,学生からも結構好評なので継続してやろうと思っています。

テスト

このテキストは全20ユニットの構成なので,15回の授業やそれを通年で使うことを考えると微妙に回数が合わせずらいということがあったりします。私はむしろそれを逆手にとって,中間と期末をそれぞれ2週に渡って行うように設定しています。テストはペアでのスピーキングとリスニングテストです。

スピーキングテスト

前述のように,私の授業では,各ユニットごとにそのユニットでの話題に関連したなんらかのスピーキングタスクに取り組むことになります。テストの週では,それまでに授業でやった各ユニットのタスク(具体的にはロールプレイ型の意思決定や問題解決タスク)と同じ内容でやや性質の異なるようなタスクに取り組むことになっています。内容は似ているので表現などはそのまま流用できますが,到達すべきゴールやロールプレイの状況設定が異なっているというようなものです。

ペアは毎授業でランダムに組んでいて,テストのときもこちらがランダムに決めたペアでやってもらっています。ただ,当日になるまで誰とやるのかわからないというのは不安もあるだろうということで,テスト1週目の前の週にはテストの実施要領や評価方法の詳細(ルーブリックの観点は後述)とともに2回のテストで誰とペアになっているかのリストを渡しています。

テストを2週に渡って行うことの理由として15週の授業とテキストのユニット数の数合わせという問題に触れましたが,それよりも大事な理由があります。それは,一度ではどのタスクにあたるかでパフォーマンスが変わるという点と,ペアがランダムなのでペアの相手によってもパフォーマンスが変わってしまうという2つの点への配慮です。

中間テストまでは5つのユニットをこなしますので,5種類の中から2つのタスクにテストとして取り組むことになります(中間テスト後から期末テストまでも同様に5ユニットです)。もちろん各ユニットで難易度に差が出ないように作っているつもりですが,学生によっては内容的な親密度や自分の関心などで自分の言いたいことをパッと思いつくようなタスクとそうではないようなものがどうしても(例え内容は授業である程度カバーされていたとしても)出てきてしまいます(この問題については後述)。そこで1度きりではなく,チャンスを2回与えるというわけです。ペアの問題も同様で,さまざまな要因で話がうまく進んだり進まなかったりということは容易に起こり得ます。ただし,自分が話しやすい人とばかり話すのも私としてはいいことだとあまり思っていません。また,友達は考え方も似ている場合が多いので,特に意思決定タスクのように自分の考えと相手の考えを共有してすり合わせていく必要があるようなタイプのタスクでは情報のギャップが生まれづらいという面もあります。

こうしてスピーキングテストを2週に渡って中間と期末で行う,つまり合計で学期中に4回のスピーキングテストがあることで,学生は授業中でも意欲的にスピーキングタスクに取り組んでくれています。授業で一度も経験したことのない話題についてをいきなりテストで話すのは難しいわけですから当然です。結局,授業中でスピーキングタスクをやらせるだけだとなかなかうまくいきませんが,評価のうちの少なくない割合を占めるテストがスピーキングだということを明示し,それが授業中のタスクに基づいているものだということを繰り返し伝えていくことで,授業中の取り組み具合も変わってくるなというのを今学期は実感しています(昨年度は秋学期からこのやり方を導入)。

ピア評価

スピーキングテストでは,学生同士の評価も取り入れています。よって,ペア2組で1つのグループとして,どちらか一方がタスクに取り組んでいる場合にはもう一方のペアはタスクに取り組むペアを観察し,教員が評価するのと同じルーブリックで評価をつけるようにさせています。評価の観点は,(a) 日本語の使用,(b) 沈黙,(c) 共同的なやりとり,(d) タスクの達成の4観点で,(a) ~ (c)は0-2の3段階,(d)のみは0-3の4段階評価にして重み付けしています。これは私がタスクの達成を重視しているからです。このことはもちろん学生にも伝えています。

リスニングテスト

リスニングテストは,1週目は内容理解を中心としたもの,2週目はディクテーションのテストにしています。詳しい内容は割愛。

スピーキングテスト後の書き起こし

順番が前後しますが,スピーキングテストが終わったらリスニングテストの前に書き起こしをさせています。書き起こしの目的は主に2つあります。1つは文法的または音声的誤りに注意を向けさせることです。テスト中はどうしてもタスク達成のためのやり取りに夢中なため,なかなか言語的な側面に注意を向けることが難しくなります。そこで,録音したものを書き起こす機会を作ることで,発話の内容以外の言語的側面に注意を向けさせようという狙いです。

書き起こしといっても全てを書き起こしさせるのは時間的にも無理ですし,10分となるとかなり長くなるので作業自体もしんどくて飽きもきますので,書き起こす部分を一部分に限定する必要があります。限定するには,どの部分を書き起こすようにするかを選択する必要が出てきます。「最初の数分」というような指定ももちろんできますが,せっかくなのでもう少しこの選択に意味を持たせようと考えました。そこで2つ目の目的として,やりとりの中でうまくできた部分に目を向けさせるようと考えました。こう考えたのにもいくつか理由があります。

1つ目は,やりとりのポジティブな部分に目を向けさせることです。なんとかタスク達成できても,どうしてもできなかった部分にばかり目がいってしまうことはよくあります。これ自体は,「もっとうまくできたのに!」とか「なんでこうできなかったんだろう」のように,次への向上心があるという部分もあるので,一概に悪いことだとは思っていません。そうはいっても,うまくできたポイントに目を向けさせることで,タスク後にネガティブな感情だけが残ってしまうことを防ごうという狙いがあります。

もう1つ,いい側面を書き起こさせる理由は,教員が評価する際に聞くポイントを絞るという点です。学生には,「会話の中で,ここの部分はよくできたので,ぜひこのやりとりに注目してほしい,というハイライト部分を書き起こす」ように指示を出しています。こうすることで,「自分の意見を伝えつつ,相手の意見も尊重しながら解決策を見つけることができた」のように,やりとりの内容的な側面に学生の注意を向けさせることもできます。そして,教員が評価をする際にもその部分は特に注意をして聞くようにすることで,ある程度の採点の負担を軽減する狙いがあります。

課題

採点つらい

これが一番の悩みです。正直,ここの部分以外はかなりうまく授業設計ができてきたなという実感があります。しかしながら,どうしても36人~38人のクラスでスピーキングのテストをやろうとすると個別に呼んでというような方法はなかなか時間的にも制約が厳しく,それ以外の時間を有効活用するのも現状では難しいです。そうなると,授業中に録音させたものをあとから聞いて評価するということをせざるをえません。まだペアにしているので18ペアの10分間で済んでいますが,それでも2週に渡ってやっているので,採点にはかなりの時間がかかります。コメントは聞きながら書いているのでそこまで負担には感じませんが,15回目にやるテスト以外は翌週に結果を返す必要があるので1週間という時間的制約の中で採点するのはどうしても自分の時間の他の部分を犠牲にする必要が出てきます(注2)。LMSを活用して効率化を図りたいなと思う部分もありますが,LMSではペアリングして同じ採点を同時に2人に与えるというところが不得意なのでうまい解決策が見つかっていません。

課題の難易度のばらつき

前述したように,テストに用いるタスクは教科書の内容に基づくので内容的な難しさにどうしても差が出てきます。しかしながら,「難易度」を調整することは非常に困難です。なぜなら,どのような内容を難しいと思うかに個人差があるからです。ある学生はUnit5が一番簡単だと思っていても,別の学生はそのUnit5は話しにくいと思うということは起こりえますし,実際にそういうことが起こっていると思います。教科書で扱われる内容に差があるため,それに基づいた課題を作成するとどうしても内容面やトピックに対しての親密度(どれくらい馴染みのある話か)である課題が別の課題よりも難しいと思ったり簡単だと思ったり,ということが発生してしまいます。テスト作成時にも,なるべく難易度の差がでないように工夫してはいますし,これからその精度をより高めていく努力はするつもりですが,どうしても難易度が同一のタスクを作ることはできません。

この問題の解決のためには全員が1つのタスクに取り組むということが考えられます。しかしながら,そういう形を取ることで,「1度うまくいかなくても次はもっと頑張ろう」,という2度取り組むことのメリットを失ってしまいます。私としては,難易度の問題を解消するためにテストタスクを1つにすることで生じるデメリットよりも,2回取り組むことができるということのメリットを重視しており,2回取り組むことで生じるデメリット(課題の難易度の差)についてはやむを得ないと考えています。

テスト用に教科書の内容とは関係のないものをやろうとすると,語彙や表現のレベルで授業でやったことを活かしづらくなり,授業とテストを関連付けることが難しいという別の問題も発生するため,その方向での改善も難しいかなと思っています。

ペアリングとタスクの組み合わせが複雑

ペアリングとタスクの割り当てをランダムにすると言っても,完全なランダムにはできません。なぜなら次のようなことを考える必要があるからです。

  1. 同じタスクを2週続けてやらない
  2. 同じグループの別のペアがやったタスクはやらない
  3. 同じ相手と2週続けてやらない

1をしてしまうと,相手は違うとはいえ同じタスクを繰り返す方が設定や流れがわかっている分難易度が下がってしまうのであり得ません。また,2についても誰かがやっているのを見ていればやりやすいでしょう。もちろん,原理的には1週目が終わった時点で自分が当たらなかったタスクをやったクラスメイトに内容を聞くことは可能です。そうではあっても,やりとりをすべて聞いた状態と内容だけ聞いた状態ではやはり違うと思いますので,前者は現実的に対応可能なので対応するが後者は目をつむるというようにしています。3は内容的な側面以外でのやりやすさへの考慮です。現実的には,学期の中で1度でもペアになったことがあるのとないのとでも違うと思いますが,さすがにそこまでコントロールすることは不可能なのでその部分にも目をつむっています。また,上の1~3を考慮すると,2週目にスピーキングテストに取り組む際には自分がやったものと相手がやったものは絶対にあたらないことになるので,2週目にどのタスクに当たるのかは3つに絞られます。そうした意味でも2週目のほうが対策を立てやすくなりますが,この点についても全員が同じ条件なので学生間の不公平は生まれないと考えています。

3はそこまで確認が難しいわけではないのですが,誰がどのタスクをやったのか,あるいはやっているのを見たのかを確認して,1と2の条件を満たしてタスクを割り当てるのは多少めんどくさいなと思っています。RやExcelの関数を駆使してある程度自動化できないかなと考えたこともあるのですが,ぱっと思いつかないので手作業でやっています。この部分ももっと楽にできたらいいのになというところで,課題だなと思っています。

おわりに

この記事では,私が2018年度,2019年度と取り組んできた1年生向け共通教養科目のListening&Speakingの授業について書いてみました。タスク中心にするという点と,指導・テスト・評価に一貫性をもたせるという点を意識して作ってきて,ある程度形になってきたかなと思っていますが,まだまだ課題も多いです。余談ですが,テキストが来年度は新版になるので,ベースは維持しつつタスクやテストは1から作り直す必要があるので来年度はまた少し大変になるかもしれません。授業での気づきを反映させながら,自分自身にとっても学生にとっても良い授業になるように,これからも考えていきたいなと思います。

こうして書いていて,Twitterで実践(研究)に興味なくなってきたとかつぶやいたのに「自分だいぶ実践に興味あるな」と思い始めています笑

なにをゆう たむらゆう。

おしまい。

 

注1. 本当なら少しくらい口頭練習してもいいかなとも思いますし,LMSとかで音声モデルを提示するだけでもやったほうがいいかなという思いは多少あります

注2. やはり採点してフィードバックして2回目はそこを改善してほしいというところもありますし,学生からしてもそうでないと何をどうすれば良い評価になるのかがわからないので2回目に臨むモチベーションも上がりにくいだろうと考えています。

文法知識の手続き化の謎(Sato and Kimのレビュー)

下記論文を読んでちょっとしたレビューというか考えたことを書き留めておこうと思います。

Sato, M., & McDonough, K. (2019). Practice is important but how about its quality? Contextualized practice in the classroom. Studies in Second Language Acquisition. Advance Online Publication. doi:10.1017/S0272263119000159

ざっくりとした内容は,WH疑問文の習得について,教室内で教師とのやりとりという形での”practice”を5週に渡って繰り返していくと,当該項目の手続き化が起こるかどうかという話です。従属変数は正確さと流暢さという2つの側面。それから,練習セッション前の段階での宣言的知識が,練習での伸びとか練習後の正確さを予測するかというのも研究課題です。

宣言的記憶,手続き的記憶,手続き化

本当は,この辺の用語の説明省こうと思っていましたが,やはり自分の理解と論文でどういう捉え方しているかを照らし合わせたほうがいいと思ったのでこの節では用語の理解の確認をします(そもそもそんなものが必要な概念ってなんなのってなりますけど)。論文に書かれている内容自体に興味があるという方は読み飛ばしてください。

宣言的記憶(declarative memory)は,規則に対する(または規則そのものの)知識であると言われています。キーボードのタイピングの例(嫌いな人は嫌いな例ですけど)でいえば,キーの位置の規則といえばいいでしょうか。または,どのキーをどの指で押下するかという知識と言ってもいいかもしれません。タイピングに慣れないうちは,意識しながらキーの位置を確認して押下しますし,スピードもゆっくりですよね。それが,タイピングの練習を重ねるに連れて,だんだんキーの位置がわかってきて,指の使い方も慣れてくるので押し間違いが減ってスピードがあがると思います。これをスキル習得理論から捉えれば,宣言的記憶から手続き的記憶(procedural memory)に頼った行動に徐々に変化しているということになります。これが手続き化と呼ばれるものです。そして,その状態でさらに練習を続けていけば,キーの位置を確認しなくても「体が覚えている」状態になると思います。いわゆる「ブラインドタッチ」みたいなものができるようになるわけですよね。これが自動化(automatization)です。

手続き化というのはこの論文では,なんらかの行動の正確さとスピードが向上することとであると解釈していいと思います。冒頭のイントロでそのような説明がされているので。同じ行動を何度も繰り返す(練習を重ねる)ことによって,ある行動の正確さとスピードが向上するということです。スキル習得理論(Skill Acquisition Theory)はここでいう正確さとスピードの向上というのが,頭の中のシステム自体の変容だと捉えます。つまり,宣言的記憶(declarative memory)に頼った状態から徐々に手続き的記憶(procedural memory)に移行する,これを手続き化(proceduralization)と呼びます。

宣言的知識はあったのか

さて,論文の内容に入っていきます。私がこの論文で一番もやっとしたところは,宣言的知識・手続き的知識というスキル習得理論を理論的枠組として援用ているにもかかわらず,宣言的知識とは何を指すか,そして手続き化とはどのようなプロセスかといったようなことを無視して無理やり結果を解釈しようとしている点です。

まず,知識の手続き化には宣言的知識を持っていることが不可欠です。宣言的知識を持った状態で練習を重ねることにより手続き的知識を獲得し,それが自動化していくというのがこの理論のベースにあるからです。だとすれば,宣言的知識のテストで宣言的知識を学習者が持っていることを事前に確かめる必要があるでしょう(もちろん,実際にテストはやっています)。ここにばらつきがなければそもそも回帰分析もうまくいかないはずなので,ある程度ばらつきがある学習者を対象にするというのはわかります。そうは言っても,事前の宣言的知識テストのスコアの平均値は59%SD25.12です。正規性の逸脱はしていないという報告があるので正規分布だと仮定すると,半分以下しか正答できなかった学習者もいると考えられます(注1)。そして,平均値で59%も決して高いとは言えませんよね。そのようなテストスコアしかなかった学習者は,果たしてどうやって手続き化したのでしょうか。というか,そもそも手続き化できたと言っていいのでしょうか。Wh疑問文の生成にはwhの移動やsubject-auxiliary inversion, 一般動詞の場合はdo挿入もあります。これらが複雑に組み合わさる文法だからこそ,その中のどの部分の知識はあってどの部分の知識はないのかがわからないと,何の宣言的知識があったのかやその手続き化もブラックボックス化してしまうのではないかと思いました。

行われたcontextualized practiceについて

疑問文の産出をある程度コントロールしながら教室内で意味のあるやり取りを,というのはわかります。その中で最大限できることをやったのだということも。ただ,画像とともに疑問詞が一緒に提示されて,それをもとに疑問文の産出が行われたというのはちょっと引っかかります。あくまで”practice”だからと言われたら何も言い返せませんが,コンテクストを大事にするということをauthenticityを大事にするということだと理解して読み進めた私からすると,それが”contextualized”かあという感想になります。結局,疑問文の生成にかなり意識を集中させることが可能であるという状況での口頭産出練習活動ということですね。結果的には,そういった状況で練習を重ね,ある程度その効果があったとしても,最終的に正確性は65%程度にしかならなかったのだというのは結果を解釈する上で重要なポイントでしょう。

それから,宣言的知識の影響を調べる分析では5回のセッションのうちの2, 3, 4が合計されて1と5は省くという処置をしたということが書いてあったのですが,”so as to avoid the independence of observation for the inferencial statistics”(p.13)というロジックがよくわかりませんでした。隔週でタスクの内容が異なるので,これやるとそのバランスが崩れてしまうのではと思いました。まあそこに突っ込むとそもそも複数クラスでタスクの順番のカウンターバランスとか取っているわけでもないので,ここで言われている流暢さや正確さの発達が単純に時系列の変動だけによるものとは言えないでしょう。タスクのタイプやそこで扱われたテーマによる変動も含まれているはずです。

また,対照群の設定もありませんので,研究自体はケーススタディとして扱われるべきものかと思います。「教室環境だから仕方ない」だけでこのあたりの実験デザインの粗さにすべて目をつむっていいわけではないと個人的には思いますので,今後別のデータでも同様の研究が重ねられていくといいのかなと思います。

事前の宣言的知識の手続き化への影響

結果で,練習前に行った宣言的知識のテストスコアは正確さや流暢さの発達を予測しなかったということが言われています。つまり、事前の宣言的知識を測る文法テストのスコアが高ければ高いほど正確さや流暢さが伸びやすい、あるいはスコアが低ければ低いほど伸びないという現象やその逆で高ければ伸びにくい、低ければ伸びやすいというような関係性がみられなかったということになります。このことを、著者らは次のように解釈しています。少し長いですが引用します。

Interestingly, the scores of the declarative knowledge test, administered prior to engaging in contextualized practice, did not predict the extent of the practice effect on accuracy or fluency changes. This result indicates that having declarative knowledge of a grammatical structure may not be related to the development of the procedural system of that structure when practice is considered as the cause of the changes. Accordingly, it could be said that contextualized practice alone facilitates a positive change in accuracy, on the one hand. On the other hand, the result seems to challenge skill acquisition theory in that learners may not need an explicit understanding of a grammatical structure to benefit from contextualized practice. However, in the current study, all learners possessed some declarative knowledge of the target structure. Hence, it is premature to argue that practice alone is sufficient to develop procedural memory of a grammatical structure. What the results suggest is, instead, that the amount of declarative knowledge was not related to the extent to which each learner benefited from practice (p.21).

事前の文法テストスコアとの相関がなかったことは、知識がなくても練習すれば良いということは意味しないという主張です。その根拠として、参加者の知識がゼロではなかったからと言っています。つまり、なんらかの知識は持った状態で練習をすることの意味はあるということです。ただし、どのくらい知識を持っているかは関係ないとも言っています。しかしながら,これは矛盾していると思います。これをサポートするには、知識の閾値みたいなものを想定する必要があるでしょう。つまり,知識がないとダメであり、かつ知識の量が関係ないとすれば、ある一定程度の知識が必要で、その先のレベルの知識は関係ないという想定になるはずです。そうるすと,その閾値とはどこなのか,その閾値が意味することはなにか,が重要になってきます。これを突き詰めると,前述した宣言的知識のテストスコアの解釈や,それが何を測っているのかという問題に再びぶつかるわけです。

まとめ

まとめると,Sato and Kim (2019)はタイトルがちょっと煽りすぎでは?と思います。確かに,practiceといっても機械的な口頭産出練習じゃだめだ,もっと文脈依存でコミュニカティブなインタラクションの中での練習でなくては,という主張自体はわかりますし,そのことを文法知識の手続き化という理論的な枠組みを当てはめて研究に落とし込んだのは面白いと思いました。ただ,宣言的な文法知識とはいったい何なのか,そして文法的知識が手続き化するとはどういうことなのか,という部分が分野として確立されたものが提示しづらいところが原因で疑問が色々浮かぶ研究かなというのが個人的な感想です。こういうところに失望して教室SLA研究を「研究」としてやることに対しての意欲を自分は失ったんだなぁと再確認することとなりました。論文を読んでからずっと放置していて公開までに3ヶ月かかってしまいましたが,とりあえず,私がこの論文を読んだ感想はそんなところです。

なにをゆう たむらゆう

おしまい。

 

注1: Rのrnorm関数を使い,n = 34, m = 59, sd = 25.1として乱数を発生させ,その中で50を下回る人数を数えるというのを10,000回繰り返すと,中央値は12人,最小値は3人,最大値は20人でした。

タスクタイプとengagementの関係

久しぶりに論文の簡単なレビュー的なものを残しておきます。下記の論文です。

書誌情報
Dao, P. (2019) Effects of task goal orientation on learner engagement in task performance. International Review of Applied Linguistics in Language Teaching. Advance Online Publication doi: doi.org/10.1515/iral-2018-0188

ざっくりとした概要

独立変数

convergent task (意思決定タスク)とdivergent task (意見交換タスク)の2種類
 

従属変数

  • cognitive engagement: idea unitとLanguage Related Episode (LRE)
  • emotional engagement: タスク遂行中に楽しんでるかどうか(笑ったりしていると1とカウントされる)
  • social engagement: 相手の発話への貢献(acknowledging, repeating, commenting, developing each other’s idea, or providing backchannels)
 
これら3つの変数は,全体のターン数で割って比率として分析しています。この他にもemotional engagementについては質問紙調査を実施しています。(5項目で10ポイントのリカートスケール)
 
例:
  • I felt enjoyable when interacting and doing the task
  • I felt interested when interacting and doing the task
  • I felt bored when interacting and doing the task (おそらく逆転項目)

詳細に見たかった部分

 
どんなタスクをやったのかというのが一番気になるところでしたが2つのタスクはそれぞれ次のようなものです。
 
 
意思決定タスク
自分たちの通う大学の問題点をいくつか挙げ,それに対する解決策を提示する。タスクの最後に,問題点と解決策をリストアップしてレポートを書く。問題点と解決策については合意が必要。

意見交換タスク
ペアの相手と共同経営することになった新しいビジネスについて,オンラインショッピングのシステムを作るか,実店舗での店頭販売をベースにするかについてのディベートタスク。タスクの最後に自分の主張の根拠となる理由と,相手の主張に対する反論をリストアップし,それをもとにしてどちらが良いかについてのレポートを書く。論文中には記されていないが,おそらく学習者はランダムにどちらかの立場に立って議論するように求められ,最終的なレポートについても決められた立場から主張を述べなければならないことになっている。2つのタスクの比較については下記の表参照。

 

 
 
Outcome optionの”opened outcome”というのは,答えが決まっていない(学校の問題点や,オンラインショッピングのほうが良いと主張する理由等については学習者の考え次第)という意味で,「誰が犯人かを推測する」,「バラバラの物語の一部を正しい順序に並び替える」といった答えが決まっている問題解決型のタスクとは異なるという意味(だと思われます)。
意思決定タスクは合意に向かう議論になりすが,意見交換型タスクは自分の立場を主張し,相手に反論するだけで,合意形成は求められないというのが大きな違いです。この2つのタスクについて言いたいことがあるのですが,とりあえずそれは後で述べるとして,結果のまとめとして下記の表を見てください。
 
 
 
 
2つのタスクを比較して,統計的な有意差が認められたのはcognitiveとsocialのみでした。emotionalについては,タスク中の発話に基づく分析も,質問紙に基づく分析(本文中のTable 3)もともに統計的な有意差は認められず。この結果は,goal orientationがdivergentかconvergentかでタスク中のやりとりに違いが認められるということを示すとともに,Pica et al. (1993)で言われているように,divergent型の意見交換型タスクは学習者のインタラクションを促進するかという観点において”least effective”であるということを示していると著者は結論づけています。
 
 
LREについては,意思決定タスクのほうが高いという結果が出ていますが,そもそもの回数が少ないので結果の解釈には注意が必要だと述べられています。意思決定タスクでも,1回のタスク中(10分)で平均して2.44回しかLREは出現していません(しかもSDが平均値に近いくらいの値なので,0回というペアもかなりあったことが推測されます)。
 
 
Emotional engagementについては,goal orientationが違うことはあまり影響しないという結果でした。意見交換型のタスクでも,質問紙の結果では10段階で平均8.2(意思決定タスクは8.45)ですから,どちらのタスクもemotional engagementは高いのだろうと思われます。ただし,どちらもSDが5を超えている点には注意が必要になります。
 

タスクの問題点

意見交換型タスクが意思決定タスクに劣ったというのは,予め立場が決められていたことが問題なのではないかと思います。自分が与えられた立場に同意できればともかく,ディベートの場合必ずしも自分の意見と一致する立場で主張を述べなければならないことも多く(コレ自体はcritical thinking的な意味で言えばそこまで問題とも思わないが),それがengagementを低くしてしまったという点もあるように思います。ディベートはどちらの立場からも意見を述べられるようなトピックを扱うのだと言われたらそれはそうかなと思いますが。
 
 
また,意思決定タスクが自分たちの学校についての問題であるのでトピックに対する親密度も関係があったのではないかという点も指摘ができるかもしれません。モノローグタイプのタスクではありますが,トピックの親密度が高いほうが発話が豊かになるという指摘もあります(Qiu, 2019)。
 
 
意見交換型はビジネスの問題で,普段からこの問題に関心がある学生だったのかどうかがわかりません。ビジネス系の学生であれば背景知識も豊富でたくさんのidea unitが出てきたでしょうけれど,そうではない場合にこの問題を語るのは難しい気もしますし,英語の熟達度的にもこちらのほうが専門的な用語が多く必要となってくるのではないでしょうか。もっとも,p.7のセクション2.4のすぐ上のパラグラフで
 
With regard to practical reasons, both tasks were included in the learners’ syllabus and course materials, and the teachers of the participants reported to have used them frequently in their previous teaching activities. The two task topics (university issues and shopping) matched the themes covered in the learners’ theme-based course materials. To reduce a possibility that task topic might have impacted learner engagement, the two topics were selected based on the informal survey that reported university and shopping topics as the learners’ two most favorite topics.
 
という記述はあります。査読者に指摘されたのか,あるいは最初から書いてあるのかは定かではありませんがトピックの親密度という観点についてはディフェンスしてあります(つまり,著者もそういうことを言われるだろうという認識はある)。
 
 
とはいえ,あえてトピックを変えなくとも学校の問題点と解決策というトピックに固定して,意思決定型は合意を求め,意見交換型はおのおのが思う問題点と解決策をペアでシェアするという構成でもよかったように思います。というか,そちらのほうが「意見交換型」としては個人的には問題なく受け入れられます。ただし,debateという相手への反論が要求されるようなものでなければ,今回観察された以上に意思決定型との差が大きくなってしまうかもしれないとも思います。debateという形式を取ることで,相手の言ったことに対してただ単に「へー」で終わらせることができなくなっているという点はあるでしょう。そうした点で,合意を求めずともインタラクションが活発になるように仕組むための工夫がdebateを持ち込むという結果になったのかもしれません。
もう一つ個人的なことを言えば,ディベートという形式を取らない私が考えているような意見交換型タスクであれば,多様な意見がかわされればかわされるほど盛り上がることが見込まれるので,2人よりは3人,3人よりは4人というグループ構成で行ったほうが議論が盛り上がるのではないかと思います。1人で様々な角度から物事を分析的に考えて意見を提示できるような学習者同士のやりとりであれば2人でも議論は大いに盛り上がるでしょうけれど,大学生1年生や2年生でもそうしたことが2人で成立することがそこまで一般的に当然として考えられるとは言えないと思うからです。
 
 

この論文のポジティブな点

とまあいろいろ言いましたが,この論文の著者の狙いとは違うかもしれませんが,この論文を自分がポジティブに受け止めている点もあります。それは,タスクに関わる変数ではなく,タスクのタイプを主題として取り上げていることです。もちろん,上のTable 1のようにタスクをある観点(変数)で見たときに違いがあるということではあるのですが,実際にはdivergent-convergentという2つの異なるタイプのタスクを比較しています。これまでのタスク研究は,良くも悪くもタスクを操作する際の要因に着目して細かく検証することが多かったように思います。それも意味のあることで,準備時間の有る無しであったり,タスクの難易度を操作してみたり,というのは教育的示唆という観点でも有益でしょう。これらの要因は教師が操作することができるわけですから。一方で,現実的にタスク・ベースのコースを作ろうとシラバスを考え始めたとき,そのベースになるのはタスクを調整する変数ではなく,どのようなタイプのタスクにどのような順番で取り組ませるべきなのかということになるのではないかと思います。直感的に,意思決定タスクと情報伝達タスクを比較したら前者のほうが難しいから情報伝達が先にくるべきだろうのようなことは考えられます。ただし,タスクタイプの観点から見て,タスクの難しさやその要因を整理するということについていえば知見の蓄積がまだまだ乏しいように思います。

私が今関わって作っている教材もタスクタイプごとに整理していますが,タスクタイプという切り口は直感的に捉えやすく,異なるタスクの比較が見えやすくなります。そういうタスクのタイプという要因を正面から取り扱っているという点で,この後に続く研究が楽しみになってくるかなと思っています。ただし,従属変数のengagementについてはもう少し何か他の変数がないのかなということを思ったりしています。

おわりに

タスク系に正面からタックルした研究というのをなかなかできていないので,こういう論文を参考に何かできないかなと考えたりしています。

なにをゆう たむらゆう。

おしまい。

 

参考文献
 
Pica, T., R. Kanagy and J. Falodun. 1993. Choosing and using communication tasks for second language instruction and research. In G. Crookes and S. M. Gass (eds.), Tasks and language learning: Integrating theory and practice, 9–34. Clevedon: Multilingual Matters.

 

Qiu, X. (2019). Functions of oral monologic tasks: Effects of topic familiarity on L2 speaking performance. Language Teaching Research. Advance Online Publication. doi:10.1177/1362168819829021

 

「意思決定タスク」の難しさ

ライティングの話が多かったので,今回はスピーキングの話。

タスクのタイプには情報伝達・ナレーション・情報合成・問題解決・意思決定などがありますよね。といってもわかりにくいかもしれませんが,一言でタスクと言ってもそれが求めることによっていくつかのタイプに分類できるのではないかなという話です。タスク・タイプの詳しい解説については,下記の論文をご参照ください。

松村昌紀(2017)「タスク・タイプの理論的基盤と学習者の言語使用」『中部地区英語教育学会紀要』46, 55–62. doi:10.20713/celes.46.0_55

意思決定タスクとして有名なのは「無人島タスク」で,「無人島に持っていくものをみんなで相談して決める」というもの。これが大筋で、どういう経緯で無人島に行くことになったのか,何個まで無人島に持っていくことができるか,その無人島は一体どんな場所なのか,などのコンテクストをうまく設定することで,リアリティを持たせるとともに議論に一定の方向性を持たせたり,持ち物を決める際のリーズニングのベースとして機能させたりします。

意思決定タスクのゴールは「合意」で,話し合いの中で意見を1つに集約することが求められます。無人島タスクなら,「1つだけ持っていける」という制限だとしたらその持ち物を1つに決めることができればタスクが達成できたと判断することになります。

私も授業でよく意思決定タスクをやることがあります。授業で使っているテキストに関連させた内容にすることが多いのですが,実際にタスクをやらせると,「合意する」というのは結構ハードルが高いのだなということを思い知らされます。だからこそ,タスクを配列することになった時には意思決定タスクは後ろの方にすることになるんですけどね(余談ですが,実際にゼロからタスクを構想したとき,1番作りやすいのは意思決定タスクだと個人的には思っています)。

例えば,「4人の教員採用候補者の中から1人選ぶ」というタスクをやるとします(R.Ellis, 2003に例が載っています)。この時,目の付け所って色んなところにあるんですよね。というかそうしないとそもそもタスクとして盛り上がらないわけです。みんながみんな「絶対この人でしょ」みたいになってしまえば,議論した上で合意形成するというプロセスが必要ないわけですから。ところが,そうやって意見が割れるように仕組むところまではうまくいっても,それをすり合わせるのはなかなか難しい。教員側としては、たくさん議論してほしいわけですから,簡単に誰かの意見に同意して議論を終わらせるみたいなことだけはどうしても避けたいと考えます。そうすると,「誰かの意見に簡単に同意できないからとにかく自分の意見を貫き通す」ことになってしまいます。しかし時間内にどこかで合意しないとタスク達成にならないので,どこかで誰かが折れて1つの意見を最終的に採用することになります。この「折れる」とき,採用される意見に納得していて,その意見を出した人がみんなを(または2人で取り組んでいるのなら会話相手を)説得したというのならそれでいいなと思います。ただし,やり取りを聞いていると,その議論がかみ合わずに平行線になって止まってしまい、埒があかないからどちらかが折れて合意するという流れが圧倒的に多いように感じています。

もちろんタスクの設定の仕方の問題もあるでしょうし,学生の言語的なレベルの問題もあるでしょうし,言語に関わらず議論するスキルの問題もあるかもしれません。原因が1つに絞られるとは思っていませんが,とにかくこの意思決定タスクというのは難しいということが,この1年間スピーキングの授業をやっていて思ったことです。合議によって意思を決定するというゴールに到達するためには,どのようなサブゴール(cf. タスクにおける”sub-goal”という概念)があるのかなというのも考えなくてはいけないかもしれません。それが明らかになれば,ある程度誘導が可能だからです。ただ,それを事前に教えるというのはタスクっぽくなくなってしまうので,それもやりながら徐々に浸透させていくような工夫が必要になるかなと思います。

授業で「意思決定タスク」をやるときに,気をつけているポイントはありますか?ということをみなさんにぜひ聞いてみたいです。

なにをゆう たむらゆう

おしまい。

Comprehensibilityってなんなのさ

ずっと下書き状態で放置していたのですが,「田村さんがJ-SLARFのあとにcomprehensibilityについてブログを書くとおっしゃっていたので楽しみにしていたのですが…」という問い合わせをいただいてしまったので頑張って加筆して公開することにしたいと思います。


最近の(私より)若い人たちの間では,comprehensibilityといわれる尺度(注1)と相関する変数をあげたら優勝大会というのがどうも人気のようです。しかしながら,このcomprehensibilityというのがまた得体の知れない曲者で,そういう大会に参加されている方々でも「よくわかっていない」もののようです。

とりあげられる変数は,音声発話から算出される言語的特徴量であることが多いようで,言語的特徴量から近似的に予測できる人間の主観的な心理尺度の1つということなのかなと思いますが,私にもよくわかりません。「comprehensibilityは心理的に実在するものか」という質問をさせていただいて,この質問があまり良くなかったことを反省しています。comprehensibilityが,人間の主観であるとすれば,それは人間の主観を離れて存在することが不可能ですから,実在はしないものであるといえるのかもしれません。私がお尋ねしたかったことは,comprehensibilityが構成概念だとしたとき(注2),そのモデルはどういったものになっているのだろうかということでした。言語的特徴量の数値それ自体には良い悪いという主観的な判断は存在しないはずで(注3),その個々の数値についてのなんらかの価値判断の総体となったものがcomprehensibilityというものだと考えてよいのか,とも言えるかもしれません。あるいは,個々の数値というよりもその数値が正確さ,流暢さといった概念を形成し,そうした概念についての主観的な判断の総体なのかもしれません。あるいは,可能性としては低そうですが言語的特徴量のようなものについてはなんの価値判断もなく,comprehensibility評価装置のような機構に言語的特徴量の値を入力した時,そこから初めてcomprehensibilityについての主観が生まれるのかもしれません。

このとき,正確さや流暢さといったものとしていくつかの変数をまとめる(あるいはまとめずに解釈する)ことに対する問題点はCAF警察の後輩にまかせるとして,人がある言語産出の理解(発話の理解や作文の理解など)に取り組んだとき,「この人の発話(作文)は文法的に正確だ」とか思うその主観的な判断は,その人の「文法的に正確な言語を産出する能力」と同じものなのかということも考えてみるとおもしろそうです。主観から離れた能力が存在するのかという意味で。

そして,このcomprehensibilityというのはいわゆる「スピーキング能力」と何が違うのかや,スピーキング能力とcomprehensibilityはどういう関係性なのだろうかというのも気になるところです。発話にあらわれる言語的特徴量は人の持つ「スピーキング能力」が反映されたものだと考えると(注4),言語的特徴量はスピーキング能力を反映したものだともいえます。そして,その同じ言語的特徴量を用いてcomprehensibilityというものをこちらは形成モデル的に測定しようとしているようにみえます。スピーキング能力がテキストに反映されていると考えれば,反映モデルでスピーキング能力を測定しようとすれば良いはずです。それを形成モデルでcomprehensibilityという新しい指標値を立てることによる利点はなんなのでしょうか(私の不勉強かもしれませんので,この論文を読めば書いてあるということでしたらご教示ください)。また,三者(comprehensibility, 言語的特徴量,スピーキング能力)の関係はどのようになっているのでしょうか。comprehensibilityに詳しい方にぜひ教えていただきたいです。

蛇足ですが,「よくわからない」ものを応答変数にして回帰する前に,comprehensibilityというヤツの正体を少しずつでもいいから明らかにする研究はやったらどうだろうとも思います。例えば,聞き取りにかかるmental effortが聞き取りやすさということなら,聞き取りづらい発話を聞くことにmental effortが割かれているのかどうか,逆に聞き取りやすい発話を聞くときにはmental effortがそれほど必要ないのかどうか,ということを確かめる実験をやってみるというのはどうでしょうか。これは,心理実験的にそこまで難しいことでもないと思います。

では,このへんで。

なにをゆう たむらゆう。

おしまい。

注1. 妥当化されてないので尺度というのもあれですが。スコア?ですかね。

注2. comprehensibilityは構成概念ではないという見方もありえます。つまり,comprehensibilityは単純に能力の影響を受けたテキストの値を変換したものであって,comprehensibilityという固有の値をもつわけではないと考えるということです。

注3. 言語的特徴量自体に対して主観的な判断を尋ねる場合もあるようですが。

注4. 能力は全部形成モデルだ,という考えもありますが,テスティング系の研究者はおそらく能力がパフォーマンスやテストにあらわれると考えていると理解しています。

p.s. 新年一発目の挨拶もせず,このようなブログを更新してしまいました。年末年始は例年よりも長く1週間も実家に滞在したのが災いしたのか,名古屋のアパートに帰ってきてからキーケースを東京の実家の玄関に置き忘れるという大失態を犯し,寒空の中途方に暮れるという波乱の幕開けとなった2018年。何か悪いことが起こるという前兆かもしれませんので,いつも以上に気を引き締めて生活していきたいと思います。

 

英語教育実践セミナー@CELES2017長野大会

2017年6月24-25日に長野県の信州大学で開催される第47回中部地区英語教育学会長野大会の,英語教育実践セミナーでお話させていただく機会をいただきました。この企画は,中部地区英語教育学会長野支部の特別企画だそうで,なんと私の出るセミナーのタイトルは,「スピーキングの指導と評価」です。

ファッ!?いやいやスピーキングの研究とかメインでやってないし評価の研究もメインでやってないよ!?なぜこの話が僕のところに!?

というのがこのお話をいただいた際に思ったことですが,「はい」か「YES」しか選択肢がないのでお引き受けしました。原稿はとっくにあがってるのになかなか校正に入っていない「タスク本」(出版社がとてもお忙しいようです)に書いた内容とも関連させて,タスクを用いたスピーキングの指導と評価についてをお話しようかなと考えているところです。

時間は大会初日24日の10時からということで,ここ数年の中部地区英語教育学会では「恒例」というほどになってきた「英語教育研究法セミナー」の「裏番組」です。参加者として毎年英語教育研究法セミナーに出るのを楽しみにしていたので,そちらに出られないのは残念ですし,昨年度はかなりオーディエンスも多かったセミナーと同じ時間帯ということで,参加いただける方がどれだけいるのかとか不安はあります。そこは実践セミナーの司会を務められる浦野研先生(北海学園大学)にお力添えをいただこうと思います。

私がお話する内容は,「これがいい!」とか「この方法でやればスピーキング力が伸びる!」とかそういったことではなく,「こんな感じでスピーキングの評価を考えてみるってどうですかね?」というような「提案」になると思います(「提案者」としてお話するので)。フロアの皆さんとのやりとりを通して,スピーキングの指導と評価について考えを深められればと思いますので,ぜひ,CELES長野大会にお越しいただければと思います。

なにをゆう たむらゆう。

おしまい。