關於此文:這篇文章介紹了由國立中央大學學習與教學研究所劉佩艷副教授所主持的科技部104年度性別與科技研究計畫「以TIMSS 2011台灣學生科學成就資料檢視試題類型、內容領域與認知階層中的性別差異」之研究成果。本文由計畫參與人員王呈隆研究助理撰稿。
 
作者/王呈隆(國立中央大學學習與教學研究所碩士)
 
 
「男理工,女人文」是適性發展,還是測驗方式造成的缺失?
 
「男理工,女人文」既是刻板印象,也是既存事實。不論是科學、科技、工程與數學(STEM)工作領域的男女人數比,抑或是高中自然組與文組的男女人數差異,皆可讓人明顯感受到男女在職涯志向選擇上確實有所不同。然而,對於科學教育工作者而言,我們該思考的是:這個現象究竟是「適性」的展現,還是「不公平」的評量測驗制度使然的人為結果?
 
是「誰」告訴你,你不適合走科學這條路?
 
在科學教育的既有研究中,有學者指出,「自我概念(science academic self-concept)」對於個人在選擇科學相關職涯時,是個重要的決定因素(Jansen, Scherer, & Schroeder, 2015)。而更重要的是,一個人的科學自我概念很容易受到「科學成績」的影響(Guay, Marsh, & Boivin, 2003),特別是跟同儕相比時(Jansen et al., 2015)。尤其在以升學為導向的台灣教育環境,學生有大大小小的考試;每次的考試成績都影響著個人科學自我概念的形塑,並告訴個人究竟適不適合走科學這條路。也就是說,是成績左右了學生的職涯抉擇;而影響這一切的,即是由人所設定的「評量制度」。
 
不同試題類型,男女表現大不同!
 
在教育測驗裡,題型設計如何左右學生的學業成績表現是個重要的議題。但人們是否曾懷疑過考試試卷內容?為什麼選擇題總是佔大多數?選擇題佔多數會對考生帶來甚麼影響呢?過去即有研究指出,男、女在科學測驗中,不同的試題類型會影響男生和女生的科學成績表現。而筆者所參與的由國立中央大學學習與教學研究所劉佩艷副教授所主持的「以TIMSS 2011台灣學生科學成就資料檢視試題類型、內容領域與認知階層中的性別差異」研究計畫(以下簡稱本計畫)團隊,即透過分析國際大型教育評比調查TIMSS 2011年的次級資料發現,在我國的中、小學裡,男生在回答選擇題(multiple choice items)的科學成績表現比女生來得好(如圖一藍線所示);而女生則是在建構反應題(constructed response items)(註一)的表現優於男生(如圖一橘線所示)。這結果與過去的研究(DeMars, 1998)發現相似。
 
此外,我們的研究報告更指出,此現象在我國國小四年級即存在,到了八年級更加明顯。如圖二所示,不管是藍線(男生和女生在選擇題成績上的差異),或是橘線(男生和女生在建構式反應試題成績上的差異),都比圖一的差異來得大。
 
為何我們的研究團隊要探討男女在不同「試題類型」的科學表現差異?這是因為在過往的評量模式中,選擇題的題數或成績佔比往往大於建構反應題型。這也意味著男生在這樣的評量模式下,比起女生更易於拿到好的科學總成績。先姑且不論選擇題與建構反應題型各自在測量科學能力上的作用,光是成績對於個人的科學自我概念影響,便很有可能左右了一個人的科學志向。
 
 104 劉佩艷1
圖一、台灣四年級生在試題類型上的性別差異(資料來源:本研究計畫)
 
 104 劉佩艷2
圖二、台灣八年級生在試題類型上的性別差異(資料來源:本研究計畫)
 
性別差異也發生在衡量不同「認知能力」的題型
 
除了題型外,不同題目背後所評量的認知能力也不同。科學能力的衡量不像一個人的身高與體重,有一個既明確又客觀的測量方式;相反的,它牽涉到複雜的認知能力。而在教育場域以認知為教育目標的理論中,最經典的即是Bloom, Engelhart, Furst, Hill and Krathwohl(1956)提出的六層次認知領域,包含知識(Knowledge)、理解(Comprehension)、應用(Application)、分析(Analysis)、綜合(Synthesis)與評鑑(Evaluation)。這六層次由簡單到複雜,也由具體到抽象。而能夠擁有更高層次認知能力的學生,常被認為比只會單純表面死記硬背的學生,更具備解決複雜問題的能力。
 
TIMSS的題型設計在認知能力方面,則將題型區分為知識型(Knowing)、應用型(Applying)與推理型(Reasoning)。而我們的研究團隊發現,在我國的中小學生裡,男生在知識型題目的科學表現優於女生(可見圖三與圖四中的藍線:男生和女生在知識型成績上的差異);而女生在推理型題目的科學表現優於男生(可見圖三與圖四中的灰線:男生和女生在推理型成績上的差異);應用型題目則無統計上的顯著差異(可見圖三與圖四中的橘線)。這或許說明女生在STEM領域其實具有競爭力;但礙於現行的科學評量制度與題型佔比未能均衡地反映這三種不同認知能力,因此無法有效彰顯女生在學習科學上的優勢。
 
104 劉佩艷3
圖三、台灣四年級生在認知能力上的性別差異(資料來源:本研究計畫)
 
104 劉佩艷4
圖四、台灣八年級生在認知能力上的性別差異(資料來源:本研究計畫)
 
從科學評量反思STEM教育的公平性
 
我們的研究團隊試圖從評量的角度談科學成績的性別差異,引領讀者了解考試背後的評量脈絡。尤其當我們過度把考試成績化作標籤、輕易地貼在孩子或自己身上時,請停下來想想,這份考試的成績是由誰決定的?考試的形式又是什麼?
 
本研究團隊發現,在不同「試題類型」與「認知能力」題型的作答情況中,確實存在性別差異。而我們想告訴讀者的是,平常大大小小的科學考試成績未必皆能有效反映受試者的科學能力。任何評量都有其侷限,尤其在以升學為導向的體制下,考卷試題本身也未必充分反映未來在STEM領域中所需的科學能力。我們期許學生未來在決定職涯方向時能明白:能做出最終決定的不是成績,而是自己。我們也期許教育工作者能朝向建立更健全且多元的評量制度邁進,讓孩子能從更客觀的評量中發現自己。
 
註一:所謂的建構反應題包含像是閉鎖式簡答題與開放式問答題。前者是已有既定答案的,學生須進行簡答或以較長語句來解釋和論述;而後者則是學生必須寫一段話來支撐自己的論點,並無標準答案。
 
 
按此下載看完整的「以TIMSS 2011台灣學生科學成就資料檢視試題類型、內容領域與認知階層中的性別差異」成果報告!
 
參考資料:
  1. Bloom, B. S., Englehart, M. B., Furst, E. J., Hill, W. H., & Krathwohl, D. R. (1956). Taxonomy of educational objectives. The classification of educational goals. Handbook I: Cognitive domain. New York: Longmans Green.
  2. DeMars, C. E. (1998). Gender differences in mathematics and science on a high school proficiency exam: The role of response format. Applied Measurement in Education, 11(3), 279-299.
  3. Guay, F., Marsh, H. W., & Boivin, M. (2003). Academic self-concept and academic achievement: Developmental perspectives on their causal ordering. Journal of Educational Psychology, 95(1).
  4. Jansen, M., Scherer, R., & Schroeder, U. (2015). Students’ self-concept and self-efficacy in the sciences: Differential relations to antecedents and educational outcomes. Contemporary Educational Psychology, 41, 13-24