Online Version: June 27, 2000 (minor revision: Aug. 14, 2000)


プロソディーセンス強化訓練の効果に関するアクションリサーチ
〜「シャドーイング+音読」と「ディクテーション」練習の効果〜

 

『通訳理論研究』*
第7巻2号 1998 (pp. 4-21)

染 谷 泰 正
1998年2月18日
  

ABSTRACT

This paper summarizes the results of action research conducted by the author between October 1997 and January 1998. The main purpose of the research was to verify the hypothesis that the so-called "prosody training" consisting of shadowing, prosody reading (reading aloud with particular attention to prosodic features of a given text), and dictation exercises are effective in improving students' listening comprehension. During the four-month research period, the subjects were divided into two groups: Group A and Group B, and the former was given a series of extra training in shadowing and prosody reading, and the latter in dictation. It was found that the students in both groups showed significant improvements in their listening comprehension in the posttest given at the end of the research period, regardless of the training methods assigned to them. The author considers this as providing strong evidence in general support of the hypothesis, although a further study is required to determine comparative effectiveness of each method.

*(註)通訳理論研究会は2000年に創立された日本通訳学会の母体となった研究会で、日本通訳学会はその後、2008年に通訳翻訳学会と改称して現在に至っています。


1. はじめに
2. 調査の目的
3. 調査対象と調査期間
4. 調査の概要
4.1 事前テスト (PreTest)
4.2 事後テスト (PostTest)
5. 調査結果の分析と考察
5.1 事前テストの結果について
5.1.1 PreTest各項目間の相関(表2)
5.2 事後テストの結果について
5.2.1 PreTestとPostTest の得点比較−全体比較(表4)
5.2.2 PreTestとPostTest の得点比較−グループ別比較(表5)
5.2.3 PostTest各項目間の相関(表6)
6. テスト問題の難易度および各項目の弁別度について
7. まとめ

表1 PreTest得点集計(グループ別)
表2 PreTest各項目間の相関 (r)
表3 L-1, L-2, L-3 の相関
表4 PreTest と PostTest の得点比較(全体)
表5 PreTest と PostTest の得点比較(グループ別)
表6 PostTest各項目間の相関 (r)
表6-2  L1, L2, L3 の相関
表7 項目弁別度検定
図1 PreTest と PostTest の得点の伸び(全体比較 N=13)
図2 PreTest と PostTest の得点の伸び(グループ別比較)
資料1 音読テストの評価について
 


1. はじめに
筆者は、現在、いくつかの語学専門学校において通訳者養成コースを担当している。通例、通訳コースへの入学基準は、初級クラスで英検準1級から1級程度、TOEIC で 800点前後ということになっており、一般に生徒の英語力はかなり高いと考えてよい。ただし、初級クラスの生徒の多くはリスニング力にかなり問題があり、いわゆる「通訳」そのものの訓練に入る前に、あるいはこれと並行して、リスニング力強化のための訓練に相当の時間を費やさざるを得ないのが実状である(染谷 1996a)。そもそも、通訳という仕事は相手の言うことをきちんと聞き取れないことにはどうにもならない。したがって、授業における当面の課題は、いかにして生徒のリスニング力を実質的な「通訳訓練」が可能になるレベルにまで引き上げるかという点と、そのためにはどのような指導・学習方法が適切かという点に集約される。

従来、通訳者養成の現場においては、通訳スキルの習得にせよ、その基礎となる言語運用能力の強化にせよ、何らかの明確な理論的枠組みや体系的な方法論に基づいた指導を行っているというケースはごく少なく、多くは、個々の指導者(そのほとんどは現役の通訳者、または通訳経験者である)が、それぞれの体験と直感に基づいた授業を行っている。リスニング力の強化という点に関しては、これまで、いわば「只管傾聴」や「シャワーのように英語を浴びる」といった言葉で代表されるように、ただひたすら聞き続けることが唯一の学習法であるということが暗黙の了解となっていた感がある。しかし、一方で、たとえば同時通訳の導入訓練として採用されてきた「シャドーイング」という訓練方法や、発声や発音の矯正を含むデリバリーの訓練の一環として行われてきた「音読」訓練、あるいは通訳訓練の場においては主に正確な聞き取りのための "consciousness raising" の手法として採用されてきた「ディクテーション」などの一連の訓練手法が、英語特有のプロソディー感覚の養成に顕著な効果があり、その結果としてリスニング力が向上することが、いわば現場の常識として広く認識されており、現在では、筆者を含めて多くの指導者が、こうした訓練を、むしろ「リスニング力向上のためのプロソディーセンス強化訓練」と明確に位置付け、さまざまな工夫を凝らしながら行っている(染谷 1994; 1996b)。ただし、こうした実践やその成果の評価は、現在のところ体験的知見や感想の範囲を出ず、その効果のほどを具体的なデータで示すまでにいたっていない。

本調査は、このような背景と問題意識から、生徒のリスニング力を強化するための効果的な指導法を模索する教育実践の一環として、筆者が現在採用している指導法の効果をより客観的な方法で検証し、今後の指導の参考とするために行なったものである。また、「リスニング力の欠如」は英語によるコミュニケーション能力の養成を目標とする現在の英語教育において、最も重要な課題のひとつであり、本調査は一般の英語教育の現場にも何らかの示唆を与えうるものと考える。

2. 調査の目的
本調査は、「リスニング力強化のためにはプロソディーセンス [1] の強化訓練が効果的であり、プロソディーセンスの強化は、シャドーイング、音読、およびディクテーションからなる一連の訓練手法を通じて効果的に行うことができる」という体験的知見を、教育現場の実態に即しながら、アクションリサーチという形でより実証的かつ実践的に検証することを目的とする。

3. 調査対象と調査期間
東京都内A校で開催している「ビジネス通訳コース」の1クラス(A グループ=8名)を実験群とし、同B校で開催している「通訳中級コース」の1クラス(Bグループ=14名)を統制群として調査を実施した [2]。調査期間は 1997年10月初旬から 1998年1月末までの4カ月間とし、A・B 両グループともそれぞれ初回の授業で事前テストを行い、10回の授業(1回2時間)が終了した時点で事後テストを行った [3]

4. 調査の概要
両グループとも原則として同一テキスト同一内容の授業を行い、その上で、A グループに対しては既定の授業内容のほかに毎週 30分の補習授業を行った。B グループに対しては、この補習授業に相当する内容・時間数の自習課題を与え、かつ、各人の学習状況をモニターするために学習レポートを毎週提出させた。A グループに対して行った補習授業の内容は「シャドーイング [4]」と「音読」である。なお「音読」はその一環として「プロソディー分析 [5]」の作業を含む。これらの具体的な学習方法についてはあらかじめ授業の中で指導しておき、あとは原則として補習時間内に各自自由に学習を進めさせた。ただし、講師はその様子をモニターしながら、必要に応じて適宜アドバイスを与えた。B グループに与えた自習課題の内容はおもに「ディクテーション」である。ただし、それ以外の自習活動についてはとくに制限を設けなかった。なお、ディクテーションの具体的な学習方法についてはあらかじめ授業の中で指導しておいた。

したがって、本実験では、A グループに対しては「シャドーイング」と「音読」の学習効果を、B グループに対しては「ディクテーション」の学習効果をそれぞれ測定し、両者に有意な差があるかどうかを見ることになる。事前テストと事後テストの内容はおよそ以下のとおりである。

4.1 事前テスト (PreTest)
学期の開始時に、実験群および統制群に対して以下の 4 つの事前テストを行った。なお、このうちBとCは本実験にかかわらず毎回行っている標準テストであり、本実験とは直接の関係はない(したがって、BとCについては事後テストは実施していない)。

@リスニング
「ディクテーション」と「要旨把握」の 2 種類のテストを実施した。ディクテーションには Bill Clinton 米国大統領のスピーチの抜粋を素材として使用し、1)  まず全体を通して聞き、2) 次に、ほぼセンテンスごとにテープを止め、答案上に空欄で示されている指定個所(英語特有の音声変化が顕著に観察される個所を中心に、およそ 3 語から最大 10 語程度の範囲で空欄とした)を書き取るという方法で行った。各ユニットごとの書き取りの時間は一律20秒とした。[[6]

要旨理解テストではテクストタイプによる理解度の差異を見るために 3 種類の素材 (L-1, L-2, L-3) を使ってテストを行った。L-1 は事実描写を中心とした短いニュース素材 (154 words)、L-2 は一定のトピックについてのスピーチ (145 words)、L-3 は同じく一定のトピックについて論じたインタビューからの抜粋 (350 words) である。これは、L-1 で descriptiveでfactualな素材の理解力を、L-2 と L-3 では論理的な議論を含む素材に対する理解力を見ようとしたものである。なお、L-2 は無駄のない議論が展開されているフォーマルな素材であり、L-3 は繰り返しや言いよどみなどの言語的・情報的余剰の多いインフォーマルな素材である。いずれも聞き取りは一度のみとし、内容の理解を確認するための設問(True/Falseテストが4題、和文による要旨記述が1題)を用意した。

A音読
およそ200語からなるニュース原稿を生徒に渡し、これを初見で音読しテープに録音して提出させた(英文の難易度はFlesch Reading Ease Score で 62、Gunning Fog Index で 13)。なお A グループは教室で一斉に録音したが、B グループについては原稿を自宅に持ち帰り、翌週、音読テープを提出させた(したがって、初見で音読したかどうかは保証されていない)。このテープを、添付資料 1 に示した基準に基づいて評価し、生徒の「プロソディーセンス」(=プロソディー要素の分析・再現力)を測定した。評価は A+ から C−までの9段階評価で行い、統計処理に当たっては A+ (=100) からC−(=20) までそれぞれ 10点ごとのインターバルで数値換算した。
 
Bリーディングテスト
Newsweek 誌の平均的な記事を使って読みの速度 [=文字情報処理能力]および内容の理解度を測定。読みの速度は 1 分当たりの語数 (wpm = words per minute) で表わし、内容の理解度は四択問題の正答率で示した。過去のデータでは、筆者の担当する通訳初級〜中級クラスの生徒のリーディングスピードの平均値はおよそ 100 wpm (Mean = 99.01; S.D. = 20.61; Disp.= 0.98) で、理解率70%である。

C語彙力テスト
Newsweek 誌の平均的な記事を対象に未知語率を算出し、認識語彙レベルを測定。過去のデータでは、筆者の担当する通訳初級〜中級クラスの生徒の平均値は 2.9 %  (S.D. = 1.27, Disp.= 0.95) であり、これは認識語彙数にしておよそ 6,000 語 (±2,000) に相当する。ちなみに、未知語率 2.5 % の場合の推定認識語彙はおよそ 8,000語 (±2,000) で、未知語率 5.0 % の場合の推定認識語彙はおよそ 5000語 (±1,000) である。通例、効果的な通訳訓練のために必要とされる最低認識語彙数は1万語であるが、これに相当する未知語率はおよそ 1.0 % である(染谷 1994)。なお、統計処理に当たっては、未知語率をA+ から C−までの 9 段階に分割し、A+ (=100) からC−(=20) まで 10 点ごとのインターバルで数値換算した。

4.2 事後テスト (PostTest)
学期の終了時(正確には実験期間とした 10 回分の授業の終了時)に、事前テストと同じ方法で「リスニングテスト」と「音読テスト」を実施した。問題の作成に当たっては、事前・事後でテストの難易度に極端な差が出ないよう十分に配慮した。たとえば、事後テストの「ディクテーション」では、事前テストで使ったBill Clinton のスピーチの後半部からの抜粋を使い、「要旨把握」テストでも事前テストで使った素材と、内容、語数、発話速度、語彙・構文上の難易度などの点でほぼ同レベルのものを使用した。

「音読」テストでは、事前テストと同じく、およそ 200 語程度のニュース原稿を使い、これを初見で音読しテープに録音して提出させた。ただし、事前テストと同じく、B グループについては原稿を自宅に持ち帰り、翌週、音読テープを提出させた。英文の難易度は Flesch Reading Ease Score で 56、Gunning Fog Index で 14 と、数字の上では事前テストよりやや難しいものになっている。ただし、本実験の目的からすれば、特に問題になるほどの差ではない。評価方法は事前テストと同じである。

5. 調査結果の分析と考察
以下、調査結果について、まず事前テストの結果の分析と考察を行い、次に事前テストと事後テストの結果を比較しながら議論を進めていく。

5.1 事前テストの結果について
事前テストの結果は表1のとおりである。本実験に直接関係があるのは、このうち「リスニング」と「音読」の 2 つの項目である。なお、リスニングテストのうち、「ディクテーション」と「要旨把握」の得点配分は前者が82点、後者が 12 点であるが、この表ではすべてパーセンテージ得点に換算した(もともとの配点基準に即した得点は「素点」の欄に示した)。

なお、事前テストの評価に先立って、A・B 両グループのリスニングと音読の得点を、ノンパラメトリック検定のひとつであるMann-Whitney の U 検定の手法を用いて比較した。帰無仮説は「A グループと B グループの 2 つのサンプルは同一母集団から抽出されたものであり、統計的に有意な差はない」というものである。検定の結果、この帰無仮説は両側検定 5 % 水準で支持された [7]。したがって、この 2 つのグループは同一母集団に属す、ほぼ均質な集団であると考えられる。  

5.1.1 PreTest各項目間の相関(表2)
次に、事前テストの各項目間の相関係数を算出した。U 検定によってA・B 両グループの間に質的な差がないことが確認されているため、相関係数の算出は両グループのテスト結果を一括して行った。

a) 「ディクテーション」と「要旨理解」の相関
この両項目の間にはごく弱い相関しか認められない(相関係数 0.342)。通例、ディクテーションでは発話の意味内容よりも、その言語的な表層構造に注意が集中し、一方、要旨理解テストでは言葉(音声)そのものではなく、その意味内容に注意が集中する。したがって、これはごく当然の結果であると考えられる。なお、全般的な傾向として、ディクテーションの成績のよい生徒は要旨理解力も高い。ただし、ディクテーションの成績が悪くても要旨理解問題では高い得点を挙げている生徒も少なくない。これは、要旨理解力が、基本的に言語的能力を含めたさまざまな知的能力の総合力であること、および音声面での認知能力や分析力の欠如は、ある程度他の能力で補うことが可能であることを示している。実際問題として、細かな聞き取りはできなくても全体の要旨は理解(または推測)できるということは、われわれが日常的に経験していることである。

ただし、音声的な認知能力や分析力は全般的な聴解力の重要な構成要素のひとつであることから、ディクテーションの力が付けば結果的に要旨理解力も向上することは十分に推定できる。したがって、リスニング力強化のための訓練方法としてはディクテーションは一定の効果を持つものと思われる。前述のとおり、本実験では B グループに対してディクテーションを自習課題として与えているが、その結果が実験終了後の事後テストにどのように反映されるか、興味のあるところである。

b) 「ディクテーション」と「音読」の相関
中度の相関が認められる(相関係数 0.582)。ディクテーションと音読は、いずれも被験者のプロソディー要素に対する総合的処理能力を測定したものであり(前者は被験者の受動的なプロソディー能力を反映し、後者は被験者の能動的なプロソディー能力を反映する)、その意味で双方の相関の高さは十分に納得のいくものである。

c) 「リーディングスピード (WMP)」と他の項目との相関
WPM値は被験者の文字情報処理能力(読解の速度)を測定したものであるが、その能力は音声情報の処理能力とも一定の相関を持つであろうことが推定される。したがって、今回の調査でもWPM値とディクテーション、および WPM 値と要旨把握との間に、それぞれ中度の相関(相関係数 0.506 および  0.590)が認められるているのは予想通りの結果であると言ってよい。ただし、前述のとおり、過去のデータでは本実験の対象となったグループと同等の生徒のリーディングスピードの平均値はおよそ 100 WPMであるのに対し、今回の平均値はおよそ130 WPMとなっている(A グループ=134 WPM、 B グループ=127 WPM)。この数字は過去の累積データの平均値から統計的に許容できる範囲の誤差(約±20 WPM)を超えるものであり、おそらくは何らかの理由で正確な測定ができていなかったものと推測される。したがって、リーディングスピードと他の能力との関連については、今回はこれ以上論じない。

d) 「語彙」と他の項目との相関
語彙はどの項目とも有意な相関関係が見られない。常識的には語彙力の有無はディクテーションや要旨把握力とも強い相関を示すのではないかと考えられるが、本実験の被験者のように、一定レベル以上の語彙力がすでに獲得されている場合、いわゆるリスニング能力は、ボキャブラリー以外の要因により大きく依存していることを示している。

なお、WPM 値と語彙の間にも有意な相関が認められなかったのは意外であった(相関係数 0.206)。過去のデータではこの両者には中度以上の相関が認められていることから、これも、おそらくは測定が的確に行われていなかったことを示すものと推察される。ちなみに、過去のデータでは本実験の対象となったグループと同等の生徒の平均未知率は 2.9% であるが、今回の調査では全体平均でおよそ 1.53 % となっている。上述の WPM 値と同じく、これも統計的に見て信頼性に疑問を持たざるを得ない数字である。したがって、これについても今回は詳しい議論は行わない。

e) L-1, L-2, L-3の間の相関(表3)
前述のとおり、要旨把握テストに使った 3 つの素材のうち、L-1 は事実描写を中心としたニュース素材であり、ある出来事の具体的な事実関係を把握する力が問われる課題である。これに対して、L-2 では具体的な事実関係よりも議論の論理的な流れを正しく把握できるかどうかが問われ、L-3 では、繰り返しや言いよどみをふんだんに含むインフォーマルな素材(インタビュー)を聞きながら、主要な情報と副次的な情報とを聞き分ける能力が問われるという課題である。したがって、L-2 と L-3 の間に中度の相関が認められ(相関係数 0.426)、一方、L-1 と他の 2 項目の間には顕著な相関が認められない(相関係数 0.231 および 0.135)のは、ほぼ予想通りの結果であるといってよい。

各項目に対する A グループと B グループの平均理解率を個別に見てみると、L-1 が 87.5% と84.51% (Mean = 85.6%; SD = 15.77)、L-2 が 77.07% と 59.54% (Mean = 65.91%; SD = 23.29)、L-3 が 72.92%  と 70.23% (Mean = 71.21%; SD = 22.01) となっている。このことから、全般的な傾向として、事実描写を中心としたニュース素材 (L-1) に対する理解力が高く、一方、論理的な議論を中心としたスピーチ (L-2) 素材とインタビュー素材 (L=3) に対してはやや弱い面があると言うことができる。ただし、弱いと言っても平均して 65% から 71% の正解率を示しており、基本的には特に大きな問題はないものと考えられる。なお、事後テストにおいてこの傾向に何らかの変化が見られるかどうかも興味のあるところである。

5.2 事後テストの結果について
事後テストの結果は、表4/図1(全体比較)および表 5/図 2(グループ別比較)に示すとおりである。なお、この集計は事後テストを受けたもののみを対象にした。したがって、被験者の数は A グループが N=5、B グループが N=8 となっている。まず、表4 から解説する。

5.2.1 PreTestとPostTest の得点比較−全体比較(表4)
表4 では、事前テスト (PreTest) と事後テスト (PostTest) の結果を各項目毎に並列して一覧表示した。表の下部には、それぞれの平均 (Mean)、標準偏差(S.D.)、拡散度 (Disp.) を示し、さらに、PreTest に対する PostTest の得点の伸び率、Wilcoxon のサインランク検定の結果、およびt検定の結果を示した。

これによれば、リスニングテストの部では、ディクテーションが 24.1%、要旨把握が平均 17.8% の伸びを示し、音読では PreTest の平均点 45.38点から PostTest の平均点 64.62点まで、実に 42.4% の伸びを示している。ノンパラメトリック検定のひとつである Wilcoxon のサインランク検定 (Wilcoxon Matched-pairs Signed-ranks Test) を行って PreTest と PostTest の得点の差を検定したところ、L-1 を除くすべての項目について両側 5%、片側 1%水準で有意な差が認められた。これは、本実験で A・B 両グループに与えた学習課題が、それぞれ被験者のプロソディーセンスの強化(したがって、リスニング力の向上)に著しく有効であったことを示す。[8]

図1は、各テスト項目ごとの平均点の伸びを視覚的に表示したものである。L-1 を除いて、各項目ともほぼまんべんなく伸びていることが一目瞭然である。なお、L-1 はもともと PreTest において高得点 (85.89) を示していたものであり、この項目の伸び率が低いのは特に問題視するに当たらない。

5.2.2 PreTestとPostTest の得点比較−グループ別比較(表5)
表5 は PreTest と PostTest の結果を A・B グループ別に集計したものである。図2 ではこれをグラフ化して示した。得点の伸び率は、A グループの L-1 を除いて、いずれも高い数字を示しているが、全般に B グループのほうが伸び率が高くなっていることがわかる。特にディクテーション (+29.76%) と音読 (+55.88%) の伸び率が突出している。

これは、本実験で Bグループに与えた学習課題(=ディクテーション)のほうが、A グループに与えた学習課題(=シャドーイングと音読)よりも、被験者のプロソディーセンスおよびリスニング力の向上に効果的であったことを示すものと解釈することができる。ただし、この結果を額面どおりに受け取ることはできないものと思われる。なぜなら、B グループの生徒は、ディクテーション課題以外に、あるいはこれに加えて、シャドーイングと音読練習を自習課題として積極的に取り入れていたからである [9]。したがって、ここでは、どちらが効果的であったかということについて何らかの結論を出すのは早計であると言わざるを得ない。本実験の結果から確実に言えることは、A ・B グループに与えた学習課題は、いずれも一定の効果を挙げているという点である。なお、PostTest では A グループのサンプル数が N=5 とごく少なかったため、グループ別の統計的な検定は行わなかった。全体比較(表4)で行ったWilcoxon 検定でも必要とされるNの最小値は6 である。

5.2.3 PostTest各項目間の相関(表6)
表6 は PostTest 各項目間の相関を示したものである。以下、第 5.1.1 項の記述に対応させながら、各項目間の相関とその解釈についてごく簡単にまとめておく。

a) 「ディクテーション」と「要旨理解」の相関
これによれば、「ディクテーション」と「要旨理解」の間には中度の相関 (0.487) が認められる。PreTest ではこの両者の相関係数は 0.342 であったことから、わずかなからではあるが、実験終了後はこの両者の相関が強くなったことを示している。

すでに述べたとおり、ディクテーション能力と要旨理解力は、後者が前者をその一部として含み、前者は後者とは別のほぼ独立した言語能力であるという関係にある。したがって、要旨理解力の向上は必ずしもディクテーション力の向上に結びつかないが、その逆は十分に成立するものと考えられる。B グループのディクテーションテストの結果を見ると、PreTest が 44.09点、PostTest が 57.21点と、およそ 29.76% の伸びを示している(表5)。一方、要旨理解力についても、平均し て15.48% の伸びを示している。これは、ディクテーションの力が付いたことが結果的に要旨理解力の向上につながったことを示している。

b) 「ディクテーション」と「音読」の相関
PreTest ではこの両者は中度の相関 (0.582) を示しており、ディクテーション能力の高い生徒は、音読力(=プロソディー要素の分析・再現力)も高いという傾向を見ることができた。これに対して、PostTest では「ディクテーション」と「音読」はごく弱い相関 (0.323) となっている。これは、ディクテーションの得点の伸び率 (24.1%) に対して、音読の得点の伸び率(42.4%)が極端に高くなっていることの反映であって、両者の本質的な相関が、今回の実験の結果として低くなったということではない。

音読の得点の伸び率が、ディクテーションの伸び率に対して突出して高くなっているということは、英文を正確なプロソディーで読む力は、英文のプロソディー要素を正しく聞き分ける力とは別個に訓練し、強化することができるということを示している。つまり、音読は、センスグループごとの間の取り方やイントネーション、および、音の連結や同化などのさまざまな音声現象について一定のルールとコツを覚えることで、かなり上達することが可能であり、今回の実験でこれが具体的に裏付けられたものと考えてよい。

c) L-1, L-2, L-3の間の相関(表6-2)
PreTest では L-2 と L-3 の間に中度の相関が認められ、一方、L-1 と他の 2項目の間には顕著な相関が認められないという結果であった。この傾向は基本的に PostTest においても同様である。ただし、PostTestでは全体の相関がやや強くなっていることが伺われる。特に L-2 と L-3 は 0.797 とかなり強い相関を示している。これは、PostTest における L-2 と L-3 の得点が、それぞれ +21.8% および +22.9% と、ほぼ同じような伸び率になっていることを反映している。

なお、L-2 と L-3 の得点の伸びは今回の実験とは別の要因によるものと考えられる。被験者が参加したクラスは「通訳コース」であり、授業では、毎回さまざまな録音素材を使って、特に英文の典型的な論理展開のパターンを習得することに力を入れている。今回の実験で使ったテスト問題はその典型的なものであり、PostTest において L-2 と L-3 に対する得点が向上しているのは、この意味で十分に納得のいくものである。

6. テスト問題の難易度および各項目の弁別度について
以上、PreTest と PostTest の結果について論じてきたが、最後に、それぞれのテスト問題の妥当性について簡単にレビューしておく。テスト問題の難易度という点については、一般に、テスト全体の平均点が 50〜60% になるのが望ましいとされている(松畑 1971)。今回の PreTest の成績は、リスニングの部の平均点が60.37であり、ほぼこの基準に合致している。音読の平均点は 45.38 とやや低くなっているが、これも上記の基準点からさほど大きく逸脱しているわけではない。したがって、PreTest についてはほぼ適切な難易度であったと考えられる。一方、PostTest ではリスニングの部が平均 71.15点、音読が平均 64.62点となっている。ただし、これは実験の効果を測定するためにテストの難易度を意識的に PreTest と同一のレベルに維持した結果であり、正答率の高さは生徒の学習成果に帰すべき問題である。

各テスト項目の弁別度については表7にまとめた。項目弁別度 (item discrimination) とは、テストの各項目が、その評価目標に従って、どの程度妥当に個人差を弁別できるかという問題である。表7に示すとおり、検定の結果はほぼすべてのテスト項目について Z が 3 以上であり、最も少ないものでも Z=2.09 となっている。したがって、PreTest および PostTest のいずれのテスト項目も、弁別力という点では特に問題がないものと認められる。

7. まとめ
本実験は、シャドーイング、音読、およびディクテーションからなる一連の訓練手法はプロソディーセンスの強化に顕著な効果があり、結果的にリスニング力の向上につながるものである、という仮説を実験的に検証するために行った。実験の結果はこの仮説を十分に支持するものであった。

ただし、「シャドーイング+音読」と「ディクテーション」のいずれがより効果的であるかについては、明確な答えが見出せなかった。もっとも、この点については、学習方法自体よりも、それぞれの学習に費やした時間やそのやり方、あるいは学習者の学習意欲などの要因のほうがより大きな影響をもたらすのではないかと思われる。いずれにせよ、今回の実験で、リスニングの基礎となるプロソディーセンスは、シャドーイング、音読、およびディクテーションのいずれの学習方法によっても強化することが可能であることが確認できた。したがって、実際の指導に当たっては、これらの手法を、生徒の進度や適正に応じて適宜組み合わせながら行っていけばよいということになる。なお、PostTest を受けた生徒は毎週の課題をほぼきちんとこなしながら、最後まで授業についてきた生徒である [10]。したがって、PostTest に反映されているのは学習意欲の高い優秀な生徒の成績であって、必ずしも実験の結果を広く一般化することはできないということを最後に付記しておきたい。
 


 
表1 PreTest得点集計(グループ別)

Aグループ (N= 8)    Date Tested: Oct. 11, 1997 (Rev.2)


生徒番号 リスニング 音読

 

 

 

リーディング ボキャブラリ
ディクテーション 要旨把握 (%) 得点

(%)

素点

 

wpm  理解
度(%)
未語率
(%) 
語彙
レベル
L-1 L-2 L-3 L-Ave
A01 81.7 66.7 100 100 88.8 85.25 83 40 151 100 0.30 100
A02 73.0 100 100 66.7 88.9 80.9  76 70 134 100 2.30 70
A03 51.2 66.7  100 100 94.4 72.8  59 20 167 80 0.24 90
A04 54.8 100 50 50 66.6 60.7  57 50 109 80 0.97 90
A05 37.8 100 100 66.7 88.8 63.3  47 30 157 80 0.72  80
A06 39.0 100 50 66.7 72.2 55.6  45 70 120 100 1.96 80
A07 37.8 83.3 33.3 33.3 66.6 52.2  43 40 106 70 1.47 80
A08 30.4 83.3 83.3 100 94.4 62.4  42 30 128 80 1.70 80
Mean 50.71 87.50 77.07 72.92 82.59 66.65 56.50 43.75 134 86.25 1.21 83.75
S.D. 17.17 13.81 26.28 23.48 11.27 11.08 14.59 17.28 21.06 11.11 0.72 8.57

Bグループ (N=14)    Date Tetsed: Oct. 15, 1997 (Rev.2)


生徒番号 リスニング 音読

 

 

 

リーディング ボキャブラリ
ディクテーション 要旨把握 (%) 得点

(%)

素点

 

wpm  理解
度(%)
未語率
(%) 
語彙
レベル
L-1 L-2 L-3 L-Ave
B01 80.5 83.3 83.3 100 88.9 84.7 81 90 187 100 0.31 100
B02 67.1 100 50 66.7 72.2 69.6 68 60 155 80 3.44 50
B03 63.4 100 50 50 66.7 65.05 64 60 124 90 3.52 50
B04 61.0 100 66.7 83.3 83.3 72.2 65 30 122 60 1.04 80
B05 58.5 83.3 50 33.3 55.6 57.1 58 70 132 80 2.02 70
B06 56.1 100 50 66.7 72.2 64.15 58 20 106 --  0.22 90
B07 41.5 50 100 83.3 77.8 59.7 48 60 130 70 2.12 60
B08 38.0 100 50 66.7 72.2 55.1 43 50 139 100 0.99 80
B09 34.1 100 66.7 83.3 83.3 58.7 43 30 158 70 1.02 80
B10 32.9 83.3 66.7 83.3 77.8 55.35 40 30 123 80 0.38 80
B11 30.5 83.3 50 100 77.8 54.2 39 20 99 80 0.73 80
B12 26.8 83.3 66.7 50 66.7 46.75 34 30 96 50 2.30 70
B13 26.8 66.7 16.7 83.3 55.6 41.2 32 --  85 --  5.21 50
B14 22.0 50 66.7 33.3 50.0 36 27 20 124 70 0.73 80
Mean. 45.66 84.51 59.54 70.23 71.44 58.56 50 43.85 127 77.50 1.72 72.86
S.D.  17.67 17.21 18.59 21.06 11.07 12.13 15.27 21.68 26.09 14.22 1.43 14.85

表2 PreTest各項目間の相関 (r)


  ディクテーション 要旨把握 音読 WPM 語彙
ディクテーション 1.000        
要旨把握 0.342  1.000      
音読 0.582 * 0.001 1.000    
WPM 0.506 * 0.590 * 0.363  1.000  
語彙 0.095 0.324  0.088 0.206 1.000
 

要旨把握=L-1, L-2, L-3の3種類のリスニングテストの総合得点(それぞれの相関は表3参照)
音読=音読によるプロソディー評価(ABCの相対評価を得点に換算して評価)
WPM=Newsweek 誌を読んだときの1分当たりの読みの速度
語彙=Newsweek 誌を読んだ時の平均未知後率(ABCの相対評価を得点に換算して評価)
 

表3 L-1, L-2, L-3 の相関


  L-1 L-2 L-3
L-1 1.000    
L-2 0.231  1.000  
L-3 0.135 0.426 * 1.000

【相関係数 (r) の解釈】

 0 ≦ r ≦ ± .20 相関が認められない
± .20 ≦ r ≦± .40 弱い相関が認められる
± .40 ≦ r ≦± .70 中度の相関が認められる *
± .70 ≦ r ≦± 1.00 強い相関が認められる **
 

表4 PreTest と PostTest の得点比較(全体)

A グループ (N=5) PreTest = 1997年10月11日 PostTest = 1998年1月17日 
Bグループ (N=8) PreTest = 1997年10月15日 PostTest = 1998年1月14日


生徒番号 ディクテーション 要旨把握 (%) 総合得点
(% score)
(素点) 音読
L-1 L-2 L-3 L-Ave.
Pre
Post
Pre
Post
Pre
Post
Pre
Post
Pre
Post
Pre
Post
Pre
Post
Pre
Post
A02  73  92.7 100  100 100  83 66.7 100 88.9  94.4 80.9 93.6 76  93  70 70
A03  51.2 65.9 66.7  100 100 100 100 100 94.4 100 72.8 82.9 59 72  20 40
A06  39.0 47.6 100 100 50 83 66.7 100 72.2 94.4 55.6 71 45 56  70 70
A07 37.8 46.3 83.3 50 33.3 66.7 33.3 100 66.6 72.2 52.2 59.3 43 51  40 50
A04  54.8 45.1 100 66.7 50 83 50 66.7 66.6 72.2 60.7 58.7 57 50  50 80
B02 67.1 72 100 100 50 83 66.7 83 72.2 94.4 69.6 83.2  68 76  60 100
B04 61 67.1 100 83 66.7 100 83.3 100 83.3 94.4 72.2 80.8 65 72 30 80
B07  41.5 57.3 50 100 100 100 83.3 100 77.8 100 59.7 78.7 48 65  60 70
B05 58.5 76.8 83.3 100 50 66.7 33.3 66.7 55.6 77.8 57.1 77.3 58 77  70 90
B09  34.1 58.5 100 100 66.7 66.7 83.3 66.7 83.3 77.8 58.7 68.2 43 62  30 70
B08  38 44 100 100 50 83 66.7 100 72.2 94.4 55.1 69.2 43 53  50 70
B11  30.5 54 83.3 66.7 50 66.7 100 50 77.8 61 54.2 57.5 39 55  20 30
B14 22 28 50 83 66.7 33.3 33.3 33.3 50 61 36 44.5 27 34  20 20
Mean 46.81 58.10 85.89 88.42 64.11 78.08 66.66 82.03 73.92 84.15 60.37 71.15 51.62 62.77 45.38 64.62
S.D. 14.70 16.23 18.31 16.53 21.53 17.73 22.65 22.13 12.01 13.77 10.97 12.95 13.04 14.67 19.06 22.40
Disp. 0.91 0.92 0.94 0.95 0.90 0.93 0.90 0.92 0.95 0.95 0.95 0.95 0.93 0.93 0.88 0.90
伸び率1) +24.1 
+2.9 
+21.8 
+22.9 
+17.8 +17.9 +21.6    +42.4
Wilcoxon検定 T=1**
T=14 (N.S.)
T=3**
T=3**
T=3** T=1**
T=1**
T=52**
t 検定2) 1.85*
0.36 (N.S.)
1.80*
1.75*
2.01* 2.29*
2.04*
2.35*
 
** p < 0.01 (両側) p < 0.005 (片側)  N.S. =有意差無し
*   p < 0.05 (片側) df=24 F=1.39 (ディクテーション) , 1.21 (L-Ave.), 1.31 (総合得点), 1.26 (素点), 1.38(音読)

注1)「伸び率」はPreTestとPostTestの得点の差を、PreTestの得点に対するパーセンテージで示した。
注2)本実験ではサンプル数が少ないために本来 t検定は適用できないが、ここではあくまでも参考までに t値を算出したものである。

 

表5  PreTest と PostTest の得点比較(グループ別)

Aグループ (N= 5) PreTest = 1997年10月11日 PostTest = 1998年1月17日


生徒番号 ディクテーション 要 旨 把 握  (%) 総合得点
(% Score)
(素点)   音読
L-1 L-2 L-3 L-Ave.
Pre Post Pre Post Pre Post Pre Post Pre Post Pre Post Pre Post Pre Post
A02  73  92.7 100  100 100  83 66.7 100 88.9  94.4 80.9 93.6 76  93  70 70
A03  51.2 65.9 66.7  100 100 100 100 100 94.4 100 72.8 82.9 59 72  20 40
A06  39.0 47.6 100 100 50 83 66.7 100 72.2 94.4 55.6 71 45 56  70 70
A07  37.8 46.3 83.3 50 33.3 66.7 33.3 100 66.6 72.2 52.2 59.3 43 51  40 50
A04  54.8 45.1 100 66.7 50 83 50 66.7 66.6 72.2 60.7 58.7 57 50  50 80
Mean 51.16 59.52 90.00 83.34 66.66 83.14 63.34 93.34 77.74 86.64 64.44 73.10 56.00 64.40 50 62
S.D. 12.78 18.26 13.33 21.08 27.90 10.53 22.12 13.32 11.67 11.97 10.80 13.55 11.83 16.33 18.95 14.70
Disp. 0.88 0.85 0.93 0.87 0.79 0.94 0.83 0.93 0.92 0.93 0.92 0.91 0.89 0.87 0.81 0.88
伸び率 +16.3
-7.4 
+24.7
+46.4
+11.45 +14.44 +15 +24

 

Bグループ (N=8) PreTest = 1997年10月15日 PostTest = 1998年1月14日


生徒番号 ディクテー
ション
要 旨 把 握 (%) 総合得点
(% Score)
(素点)  音読
L-1 L-2 L-3 L-Ave.
Pre Post Pre Post Pre Post Pre Post Pre Post Pre Post Pre Post Pre Post
B02 67.1 72 100 100 50 83 66.7 83 72.2 94.4 69.6 83.2  68 76  60 100
B04  61 67.1 100 83 66.7 100 83.3 100 83.3 94.4 72.2 80.8 65 72  30 80
B07  41.5 57.3 50 100 100 100 83.3 100 77.8 100 59.7 78.7 48 65  60 70
B05  58.5 76.8 83.3 100 50 66.7 33.3 66.7 55.6 77.8 57.1 77.3 58 77  70 90
B09  34.1 58.5 100 100 66.7 66.7 83.3 66.7 83.3 77.8 58.7 68.2 43 62  30 70
B08  38 44 100 100 50 83 66.7 100 72.2 94.4 55.1 69.2 43 53  50 70
B11  30.5 54 83.3 66.7 50 66.7 100 50 77.8 61 54.2 57.5 39 55  20 30
B14  22 28 50 83 66.7 33.3 33.3 33.3 50 61 36 44.5 27 34  20 20
Mean 44.09 57.21 83.32 91.59 62.51 74.92 68.74 74.96 71.53 82.60 57.83 69.92 48.88 61.75 42.50 66.25
S.D. 15.16 14.75 20.41 11.84 16.14 20.38 22.73 23.56 11.59 14.58 10.29 12.40 13.01 13.43 18.54 25.95
Disp. 0.87 0.90 0.91 0.95 0.90 0.90 0.88 0.88 0.94 0.93 0.93 0.93 0.90 0.92 0.84 0.85
伸び率 +29.76
+9.93
+19.85
+9.05
+15.48 +20.91 +26.33 +55.88

 


表6 PostTest各項目間の相関 (r)
 
  ディクテーション 要旨把握 音読
ディクテーション 1.000    
要旨把握 0.487 * 1.000  
音読 0.323  0.378 1.000

表 6-2  L1, L2, L3 の相関
 
  L-1 L-2 L-3
L-1 1.000    
L-2 0.308  1.000  
L-3 0.253  0.797 ** 1.000

* 中度の相関 (0.4≦0.7)   ** 強い相関 (0.7≦1.0)
 

表7  項目弁別度検定
 
  ディクテーション L-1  L-2 L-3
Pre Test Z = 4.69** Z = 4.7** Z = 4.4** Z = 4.53**
Post Test Z = 2.09* Z = 3.09** Z = 3.53** Z = 3.51**

** p < 0.01   * p < 0.05
 

項目弁別度は次の公式によって算出し、Zが 3以上であれば1%の危険率で弁別力があり、2以上であれば 5% の危険率で弁別力があると判断される。Zが 2 に満たない場合は弁別力がないものとみなす(松畑, 1971: 404)。

 

Pg=上位群の正答率   Pp=下位群の正答率
Ng=上位群の人数   Np=下位群の人数

  

 



 

【注】

1) ここでは「プロソディー (prosody)」を、アクセント、イントネーション、リズム、ポーズなど、話し言葉に含まれる各種の音声要素の総称と定義する。話し言葉によるメッセージの伝達は表象記号としての言語そのものとこれらの音声信号の持つ韻律的意味との組み合わせによって行われる。自然な談話においては、こうした音声要素が相互に密接にかかわりあって話し言葉の文法的な区切りと連続を明示し、あるいは言外の意味を伝えるなど、円滑なコミュニケーションのための中核的役割を担っている。プロソディーセンスとは、ある言語の音声的特徴と意味を理解し、かつ、これを必要に応じて自ら適切に口頭再現できる能力のことを指す。なお、米国の AT&T 研究所でプロソディーと談話の論理構造に関する研究を行っているJulia Hirschebergは、プロソディーを次のように定義している。"Speakers' choice of pitch contour, prominence assignment, pitch range and timing variation, and segmentation of words into phrases to convey differences in meaning." (at the 3rd Discourse Tagging Workshop, Chiba University. 18 May 1998.)。[back

2) 本実験ではA・B 両グループにそれぞれ異なった刺激(=学習課題)を与え、その効果の差を測定した。したがって、厳密には双方とも「実験群」と考えてよいが、今回はとくに A グループに対する補習授業の効果の測定に焦点を当てていることから、A グループを実験群と位置づけた(これは、A グループに与えた課題の方がより学習効果が高いのではないかという仮説に基づいている)。 [back]

3) なお、A グループは本実験期間中に行った10回の授業で1コースが完結するカリキュラムになっているが、B グループは 1 コース 17 回の授業となっている。したがって、両グループは本来それぞれ異なったペースで授業を進めていくが、今回は第  1回から第 10 回までの授業がほぼ同一内容になるように調整した。 [back]

4) 「シャドーイング」の定義とその具体的な練習方法については染谷 (1994, 1996b) 参照。なお、本実験では、朝日放送制作の Click on Japan というニュース番組(1998年3月末で放送終了)の録音テープをシャドーイングおよびディクテーション用の素材として使用した。一般にニュース放送は初級者にとってはスピードが速すぎてシャドーイング用の素材としては不適当であるが、本実験では比較的スピードの緩やかなものを選んで練習を行うように指示した。また、テープのスピードについていけない生徒には、まずトランスクリプトを見ながら練習し、慣れてきたら音声のみを使って練習するよう指示した。いずれにせよ、無理な練習はかえって逆効果である。 [back]

5) プロソディー分析とは、音読に先立ってテキスト中のプロソディー要素を分析し、必要に応じてテキスト中に記号を加えておくなどの作業を指す(使用する記号類は London-Lund Corpus および Lancaster/IBM Spoken English Corpusで使用されている韻律情報記号を参考に独自に定義)。とくに、センスグループごとの区切、センテンス・ストレスの位置、イントネーション、および、音の連結 (liaison)、同化 (assimilation)、脱落 (elision)、弱化 (reduction) などの音声変化現象が、どこでどのように起こるかを発見しながら作業を進めていく。この「プロソディー分析」がきちんとできるようにするためには音声文法についての基礎的な知識を持っている必要がある。この知識がないと、基本的な原則を無視した自己流になってしまい、練習すればするほど自分の欠点や弱点が固定化するという結果になりかねない。このため、生徒には、あらかじめプロソディー分析の基本的なやり方について指導した。ただし、限られた時間内では十分な指導ができないため、いくつかの参考書を紹介し、各自必要に応じて自習するように薦めた。 [back]

6) なお、ディクテーションでは聴解力のほかに短期記憶力(とりわけ、表層的な音声情報の維持・再現力)が大きく関わってくる。本実験では書き取りのユニットを 3〜5 語程度のものと 10 語前後のやや長めのユニットの 2 つに分け、ユニットの長さが情報の再現性にどのような影響を与えるかについても調査した。ただし、この点については本稿では議論しない。 [back]

7) 検定の詳細はスペースの都合で省略した。U検定を行うに当たっては、清川 (1990: 110-111) を参考にした。 [back]

8) 表4には t 検定の結果も示した。本実験のようにサンプル数が少ない場合は t 検定のようなパラメトリック手法は不適当であるが、ここではあくまでも参考までに t 値を算出したものである。 [back]

9) 本来は、A グループは原則としてシャドーイングと音読のみを行い、B グループはディクテーションのみを行うというように、実験に関与する要因をできるだけ厳密にコントロールすべきであるが、これは実際には不可能であると言わざるを得ない、また、調査・研究のためという名目で生徒の自主的な学習活動を制限することは倫理的にも許容されることではない。 [back]

10) ちなみに、今回の授業では最終的にAグループが当初の 8 名から 5 名に、B グループが 14 名から 8 名に減少した(ただし、前者のうち 1名は当初からオブザーバーとして途中までの参加となっており、後者のうち 3名は家庭の事情や仕事の都合などによるやむを得ない理由によることが確認されている)。通常のドロップアウト率は平均 15% 程度であるが、これと比較して今回のドロップアウト率はやや高めになっている。これが、実験の影響かどうかは定かではないが、毎週の課題が生徒にとって重荷であったということも十分に考えられる。いずれにせよ、今後はこのような点にも十分に配慮しながら授業を運営して行く必要があると思われる。 [back]
 

【参考文献】

Brown, H. D. (1995), Readings on Second Language Acquisition. Prentice Hall Regents.
Nusan, D (1993), "Action Research in Language Education, " in Teachers Develop Teachers Research.
     (Edge, J. and Richards, K.) : Heinemann.
Richards, J. C. & Rodgers, T. S. (1986), Approaches and Methods in Language Teaching. Cambridge U. Press.
レベッカ・オックスフォード(宍戸通庸・伴紀子訳)『言語学習ストラテジー』(凡人社)
清川英男 (1990),『英語教育法入門』(大修館)
清川英男 (1997),「データ分析の方法と留意点」『英語教育研究』1997年2月号(大修館書店)
佐野正之 (1997),「Action Research のすすめ」『英語教育研究』1997年2月号(大修館書店)
染谷泰正 (1996a),「日本における通訳者訓練の問題点と通訳訓練に必要な語学力の基準」『通訳理論研究』
     第6巻1号収録(通訳理論研究会)
染谷泰正 (1996b),「通訳訓練手法とその一般語学学習への応用について」『通訳理論研究』第6巻2号収録
      (通訳理論研究会)
染谷泰正 (1994),「英語通訳訓練法入門セミナー」『通訳事典94』収録(アルク)
松畑熙一 (1971),「外国語学力評価概説」ロバート・ラドー『言語テスト』収録(大修館)。
 


Back to Someya's Homepage  |  Back to Publications List