-
日本語能力檢定的計分說明 2015.10.11 02:42622
-
以下資料,出自於凡人社.公式問題集,
在日本Amazon的書籍資訊如右 這裡七 關於尺度計分
(1)「單純計分」與「尺度計分」
日本語能力檢定的分數,以「尺度計分」的方式算出。
一般考試在計分時,有一種方法是「單純計分」。所謂的「單純計分」,便是依答對幾題來進行計分。比如說,有一大題是1題2分,答對10題就得20分。但是,每次考試的題目都不同,要將試題的難度每次都保持在一定的水準是很困難的,如此一來,考題困難時的「答對10題得20分」與考題簡單時的「答對10題得20分」,表示的將是不同程度的日語能力。反過來說,即便是日語能力一模一樣的受試者,在考題困難與考題簡單時,得到的分數將不相同。
為此,日本語能力檢定為了確保受試者的日語能力與考試結果的公平,採用了一種不一樣的計分方式,讓不同時期實施的考試,也都能測出相同的尺度,這種方法便稱為「尺度計分」。
正樹版簡單說明:
學生間常說:「這次考得比較難!」「七月分的考試,向來比十二月分的簡單」,這是成立的。每次考試的難度確實會不同。
但是達到一定程度以上的學生,會因為考試難就考不過,考試簡單就幸運考過嗎?不會。你有足夠的實力時,每次考都考得過;實力不足時,每次考都考不過。這就是「尺度計分」。
(2)「尺度計分」的好處
尺度計分在測量受試者的能力時,有一個很棒的特點,就是「能夠不受考試難易度的影響來評價受試者的日語能力,同時以一個統一的尺度將受試者的日語能力加以數量化。」基於此特點,受試者的日語能力如果相同,不論何時參加考試,都將得到相同的分數。此外,如果是相同考試等級的得分,不同次考試所得到的「尺度得分的差異」,可以視為「日語能力的差異。
正樹簡單說:
就是現在這樣考試的測分比較準,不會出現某次考題較簡單,分數就考比較高的情況。所以尺度計分所得出的分數差異,就是實力的差異。
換言之,會出現有人每次去考,結果都差三、五分沒過的情形。這表示,你的實力其實沒有進步,而不是運氣一直很不好。(3)尺度得分的計算過程
尺度得分的具體計算方式,根據的是一個叫「項目回應理論(Item Response Theory; IRT)」的統計試驗理論,它的算分方式和單純計分截然不同。
這個計分方法,要先去計算每一名受試者如何去做答,但重點只放在他那一題是答對還是答錯。透過這個方式,我們可以得到每一名受試者的「答對模式」,接著再將這些答對模式分配到尺度位置上的不同位置(各個等級的考試會擁有不同的尺度),便可得出尺度分數。
舉例來說,大家可以參考下圖,在考題總共只有10題的考試中,以該題正確或不正確來看,10題的考題最多會有1024種答對模式,也就是2的十次方。前面在日本語能力檢定「(5)得分尺度」已經說明過了,一科的得分尺度為0~60分(N4與N5的「語言知識(文字.字彙.文法).閱測」則是0~120分),考試便會以這個0~60分,來收納這些答對模式。也就是說,當題目共有10題,最多會有1024種的答對模式時,我們會把這1024種答對模式,分類成61個群組(也就是0~60分)。
由於實際考試的題目數量更多,屆時將會有更多的答對模式。因此,就算兩名受試者答對的題目數或是答對模式不同,有時也會得到相同的尺度分數。反過來說,就算答對一樣多題,但答對模式不同,也有可能得到不同的尺度分數。
正樹簡單說(這邊一點都不簡單了)
日檢他們之所以敢說,他們考試絕對公平,大家得到的分數不會因為考題難易而有所差異,是因為他們採用的是統計學的計算方式。統計學有一個特性,就是資料筆數越多,它的準確度會越高,而每年參加日檢的人數眾多,可以確保他們考試的公平性。
計分方式的部分,他們是算出所有可能的答對模式,比方說,「第一題對,其他全部都錯」,這是一種答對模式,而「最後一題對,其他全部都錯」,這就是另一種答對模式。數學夠好的人就知道,如果「文字.文法」共有45題,答對模式就會有2的45次方,是一個天文數字般的數量。但這天文數字般的答對模式,會再分成61個大組,也就是0分+1~60分。
不過他們的說明,並沒有說為什麼第1000種答題模式,會和第1500種答題模式被分類在同一個得分大組之中。所以這邊給的只是一個概念,就是基於他們的計算方式,不是題目對得多的人,分數就會比較高,這還要看你對得是哪幾題。
*上面的0表示答錯,1表示答對。
*這邊的分組方式,只是個示意,並無任何邏輯上的理由。
- 回上一頁