中學數(shù)學學業(yè)質(zhì)量評價探討

時間:2022-02-10 16:56:40

導語:中學數(shù)學學業(yè)質(zhì)量評價探討一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

中學數(shù)學學業(yè)質(zhì)量評價探討

摘要:中學數(shù)學學業(yè)質(zhì)量評價對教與學有著重要的導向作用。對照發(fā)展的人才培養(yǎng)目標發(fā)現(xiàn),中學數(shù)學學業(yè)質(zhì)量評價仍存在一些問題,主要包括:忽視評價內(nèi)容的整合性,科學性不足;忽視評價工具的有效性,可靠性不高;缺少評價證據(jù)的多樣性,全面性不夠;缺少數(shù)據(jù)分析技術(shù)的先進性,深度性不夠。為提高中學數(shù)學學業(yè)質(zhì)量評價的科學性與專業(yè)性,提出以下實踐路徑:制定評價實施方案,確保數(shù)學學業(yè)評價工作的制度化、規(guī)范化;組建各級評價團隊,提高數(shù)學學業(yè)評價方法的專業(yè)性、科學性;開發(fā)學業(yè)測評系統(tǒng),實現(xiàn)數(shù)學學業(yè)評價過程的動態(tài)化、全程化;發(fā)展教師評價能力,提升數(shù)學學業(yè)評價結(jié)果的公平性、準確性。

關(guān)鍵詞:中學數(shù)學;學業(yè)質(zhì)量評價;學科核心素養(yǎng)

現(xiàn)代信息技術(shù)、大數(shù)據(jù)技術(shù)及人工智能技術(shù)的高速發(fā)展,使教與學產(chǎn)生了根本性變革。用紙筆考試的學業(yè)成績衡量學生全部學業(yè)質(zhì)量的缺陷和不足日漸顯露,人工智能時代背景下的學業(yè)質(zhì)量評價引起了世界各國關(guān)注。為提升人才核心競爭力,我國于2016年發(fā)布了《中國學生發(fā)展核心素養(yǎng)》,對“培養(yǎng)什么樣的人”提出了新的要求與目標。新的人才培養(yǎng)目標及要求意味著各學科需要調(diào)整課程內(nèi)容、轉(zhuǎn)變教學方式、改變教學理念以及變革教學評價[1]。就數(shù)學學科而言,《普通高中數(shù)學課程標準(2017年版)》(以下簡稱《2017年修訂版課標》)研制了數(shù)學學業(yè)質(zhì)量標準,對高中數(shù)學學業(yè)質(zhì)量提出了更高的要求,無疑給數(shù)學學業(yè)質(zhì)量評價帶來新的挑戰(zhàn)。如何提高數(shù)學學業(yè)質(zhì)量評價的科學性與專業(yè)性,促進學生全面發(fā)展及數(shù)學核心素養(yǎng)目標的達成,成為目前基礎(chǔ)教育數(shù)學課程改革亟須解決的關(guān)鍵問題,也是深化教育評價改革的內(nèi)在要求。本文試圖從數(shù)學學業(yè)質(zhì)量評價的內(nèi)涵出發(fā),通過厘清當前數(shù)學學業(yè)質(zhì)量評價面臨的現(xiàn)實問題與挑戰(zhàn),探索核心素養(yǎng)視域下的中學數(shù)學學業(yè)質(zhì)量評價實踐路徑,力爭為我國中學數(shù)學學業(yè)質(zhì)量評價工作的開展及改革提供一點啟示與參考。

一、數(shù)學學業(yè)質(zhì)量評價的內(nèi)涵

關(guān)于學業(yè)質(zhì)量評價的定義,不同的學者有不同的理解。雖然在表述上存在差異,但本質(zhì)上都是對學生知識、能力等方面的變化程度和發(fā)展狀態(tài)進行的價值判斷。結(jié)合已有學者關(guān)于學業(yè)質(zhì)量評價的定義,可以獲得數(shù)學學業(yè)質(zhì)量評價(簡稱數(shù)學學業(yè)評價)的定義,即評價者依據(jù)國家教育目標,使用科學有效的方法,系統(tǒng)地收集信息和證據(jù)來確定學生在完成數(shù)學課程學習活動后在認知、情感、技能等方面所表現(xiàn)出來的變化程度和發(fā)展狀態(tài),并根據(jù)收集的信息和證據(jù)對學生的認知、情感、技能等方面進行價值判斷的過程[2-3]。定義從評價目標、評價方法、評價內(nèi)容等方面做了相關(guān)的界定及要求。由于國家教育目標是隨著時代的發(fā)展動態(tài)變化的,而數(shù)學學業(yè)質(zhì)量評價又是圍繞國家教育目標開展的。因此,數(shù)學學業(yè)質(zhì)量評價可以說是隨著國家教育目標不斷發(fā)展的動態(tài)系統(tǒng)。《2017年修訂版課標》指出:“數(shù)學學科核心素養(yǎng)是具有數(shù)學基本特征的思維品質(zhì)、關(guān)鍵能力(數(shù)學抽象、邏輯推理、數(shù)學建模、直觀想象、數(shù)學運算、數(shù)據(jù)分析)及情感、態(tài)度與價值觀的綜合體現(xiàn)?!盵4]這是對“三維目標”的發(fā)展與升級,意味著評價方向從知識的“診斷與檢查”走向了關(guān)鍵能力和必備品格的“促進與發(fā)展”[5],從偏重數(shù)學知識的掌握與技能的形成轉(zhuǎn)向為知識、學科能力、必備品格和價值觀的整合發(fā)展,即轉(zhuǎn)向為注重促進學生數(shù)學學科核心素養(yǎng)的發(fā)展[6]。

二、數(shù)學學業(yè)質(zhì)量評價的現(xiàn)實問題

近年來,數(shù)學教育研究者及一線教師對數(shù)學學業(yè)質(zhì)量評價進行了積極的探索,取得了一些不錯的成果,但是對照核心素養(yǎng)視域下的人才培養(yǎng)目標,現(xiàn)有的數(shù)學學業(yè)質(zhì)量評價仍然存在著一些問題亟須解決與完善。1.忽視評價內(nèi)容的整合性,科學性不足長期以來,我國數(shù)學學業(yè)質(zhì)量評價以測查數(shù)學的基本知識和基本技能為主,聚焦于知識數(shù)量的積累和解題技能的高低[7],而對數(shù)學思維品格、學習態(tài)度、價值觀等非認知因素方面的關(guān)注較少。多數(shù)研究沒有包含知識、學科能力、情感態(tài)度與價值觀的全部要素。例如:渠東劍將六個關(guān)鍵能力加權(quán)后的結(jié)果作為學業(yè)質(zhì)量結(jié)果[8]。這種將關(guān)鍵能力近似等于全部數(shù)學學業(yè)質(zhì)量的方法,雖然為學業(yè)質(zhì)量的評價提供了一種操作可行的方法,但是忽略了數(shù)學思維品格、數(shù)學價值觀念、學習態(tài)度等元素,評價結(jié)果的科學性、可信度值得進一步思考。更重要的是,只關(guān)注關(guān)鍵能力,不聚焦于知識、學科能力、數(shù)學思維品格、學習態(tài)度及價值觀等方面的整合發(fā)展,忽略了核心素養(yǎng)的復雜性、高階性,無法客觀、全面地檢驗學生數(shù)學核心素養(yǎng)目標的達成情況。2.忽視評價工具的有效性,可靠性不高測驗作為評價的重要工具,其是否有效,直接影響學業(yè)質(zhì)量評價的科學性、公正性及可靠性[9]。目前,我國數(shù)學學業(yè)質(zhì)量評價仍然以“試題—反應(yīng)”的測評方式為主,且設(shè)計思維局限于“試題”與“答案”的傳統(tǒng)評價模式[10]。這種基于“問題—反應(yīng)”的考試形式不僅難以全面誘發(fā)數(shù)學知識層面的反應(yīng),更難以全面激發(fā)數(shù)學能力層面、態(tài)度與價值觀層面的反應(yīng)[11]。尤其是傳統(tǒng)的紙筆考試,難以全面記錄知識、學科能力、情感態(tài)度與價值觀等的外在表現(xiàn),以及難以揭示學生在學習數(shù)學課程過程中情感、態(tài)度等內(nèi)在心理品質(zhì)的真實變化過程[12]。更為重要的是,絕大多數(shù)一線教師利用平時收集的題目,通過簡單組合或者改動原有試題部分數(shù)字、情境等方法設(shè)計測試試卷,也不考慮測試卷的信度、效度等問題。評價結(jié)果必然無法有效、科學地反映學生的全部學業(yè)質(zhì)量水平。3.缺少評價證據(jù)的多樣性,全面性不夠從評價主體來看,證據(jù)來源比較單一,主要以教師為主,很少考慮其他評價主體(如:學生本人、同學、家長等)。即使有部分學校、教師在評價過程中考慮了除教師之外的評價主體,也不納入到最終的學業(yè)質(zhì)量評價體系中,形同虛設(shè)[13]。從評價形式來看,仍然以終結(jié)性考試成績(分數(shù))為唯一依據(jù)。毋容置疑,數(shù)學考試成績在一定程度上反應(yīng)了學生數(shù)學學業(yè)質(zhì)量的高低與優(yōu)劣,但是這種將考試成績當成學生的全部數(shù)學學業(yè)質(zhì)量,拔高了考試的功能和作用[14]。從本質(zhì)上講,滿足最高技術(shù)需求的評價在某種程度上仍然是不精確的,任何評價從某種意義上說都只能是一種“基于證據(jù)推理”的過程[15]。數(shù)學學業(yè)質(zhì)量評價是眾多評價中的一種,自然也是一種“基于證據(jù)推理”的過程。證據(jù)是實現(xiàn)學業(yè)質(zhì)量評價活動科學性和有效性的前提條件[16]。全面可靠的證據(jù)能充分反映學生的學業(yè)發(fā)展水平,增加數(shù)學學業(yè)質(zhì)量評價的有效性和科學性;反之,單一的證據(jù)影響學生數(shù)學學業(yè)質(zhì)量的有效性和科學性。4.缺少數(shù)據(jù)分析技術(shù)的先進性,深刻性不夠從證據(jù)、數(shù)據(jù)的處理與分析來看,采用的技術(shù)先進性不高。絕大多數(shù)一線教師只能處理和分析一些簡單的結(jié)構(gòu)化數(shù)據(jù),例如:對考試成績利用Excel進行均值、方差等方面的分析。對于視頻、音頻等非結(jié)構(gòu)化的證據(jù),多數(shù)一線教師往往憑主觀經(jīng)驗,對其進行簡單化處理和分析。另外,絕大多數(shù)評價者遇到收集的數(shù)據(jù)存在缺失時,基本沒有利用統(tǒng)計學及人工智能的先進技術(shù)進行處理,而是將存在缺失數(shù)據(jù)的個體信息直接刪除,或者采用均值填補等比較簡單的方式對數(shù)據(jù)進行處理。這些數(shù)據(jù)處理方式方法雖然對某些簡單問題有效,但是很多情況下是無效的。直接刪除個體信息不僅造成成本的浪費,更重要的是刪除個體信息可能失去重要的信息,影響學業(yè)質(zhì)量評價的有效性和準確性,也沒有發(fā)揮數(shù)據(jù)的最大利用價值。此外,現(xiàn)有的Excel、SPSS等常用數(shù)據(jù)分析軟件,雖然能較好地處理和分析一些結(jié)構(gòu)化數(shù)據(jù)和解決一些簡單的評價問題,且操作簡單易實現(xiàn)。但是由于教育評價的復雜性,有可能收集到數(shù)量很大、結(jié)構(gòu)很復雜的數(shù)據(jù),Excel、SPSS等不能很方便或很好地對數(shù)據(jù)進行深度分析,而需要評價者針對特定問題設(shè)計相關(guān)算法利用更強大、更方便的軟件編程實現(xiàn)。特別是對包含視頻、文本、音頻等復雜數(shù)據(jù)集的處理,需要有效融合統(tǒng)計學、機器學習、人工智能等方面的先進技術(shù),利用R軟件、Python等進行深度分析,才能充分挖掘?qū)W生數(shù)學學習和教師教學隱藏的信息和潛在的規(guī)律,進而為學生和教師提供全面、精準、深層次的評價結(jié)果。

三、數(shù)學學業(yè)質(zhì)量評價落地的實施路徑

1.制定評價實施方案,確保數(shù)學學業(yè)評價工作的常態(tài)化、規(guī)范化數(shù)學學業(yè)質(zhì)量是數(shù)學教育質(zhì)量的重要組成部分,數(shù)學學業(yè)質(zhì)量評價能否真正落地,能否真正發(fā)揮其診斷與檢查、促進與發(fā)展的功能,前提在于制定科學、可行的實施方案。以“立德樹人”為指導思想,以促進和發(fā)展學生核心素養(yǎng)水平為目標,從國家、省、地方、學校各層面做好學業(yè)質(zhì)量評價的頂層設(shè)計,成立各級學業(yè)質(zhì)量評價管理部門,做到“問責與教學反饋兩者兼得”[17]。對國家及省級管理部門而言,不僅要做好數(shù)學學業(yè)質(zhì)量評價改革與實施的頂層規(guī)劃與設(shè)計,也要建立相應(yīng)的管理與監(jiān)督機制,同時須定期檢查和指導地方管理部門開展工作。對地方及學校管理部門而言,須結(jié)合國家、各省的要求及各地、各校的實際情況,制定實施方案,同時建立健全公示、申訴復議、責任追究等方面的制度,確保數(shù)學學業(yè)質(zhì)量評價常態(tài)化、規(guī)范化[18]。2.組建各級評價團隊,提高數(shù)學學業(yè)評價方法的專業(yè)性、科學性數(shù)學學業(yè)質(zhì)量評價是一項復雜的系統(tǒng)工程,也是一項專業(yè)技術(shù)要求很高的活動。簡單的評價方式無法全面地反映學業(yè)質(zhì)量水平,科學性不夠;科學的學業(yè)評價又難以操作與實施[19]。因此,必須整合多方力量組建專業(yè)的評價團隊。評價團隊的評價理念、評價理論與方法、評價技術(shù)等直接決定評價的科學性、專業(yè)性與客觀性。評價團隊應(yīng)該由懂或者精通中學數(shù)學課程內(nèi)容與標準、教育評價理論與方法、教育與心理測量的理論與方法、統(tǒng)計學、信息技術(shù)、大數(shù)據(jù)技術(shù)、人工智能等方面的專業(yè)人才組成[20]。眾所周知,學業(yè)質(zhì)量受學校地域的影響,表現(xiàn)出差異性,為避免評價過程中出現(xiàn)“一刀切”而忽視評價對象的特殊性問題[21],有必要組建國家級、省級、區(qū)縣三級評價團隊。國家級評價團隊依據(jù)國家教育目標,聚焦知識、學科能力、情感態(tài)度與價值觀的整合發(fā)展,構(gòu)建評價內(nèi)容框架、表現(xiàn)性水平描述框架、指標體系和評價標準,提高評價內(nèi)容的整合性、科學性,避免評價指標體系及評價標準的主觀性、隨意性。同時,開發(fā)數(shù)學學科核心素養(yǎng)導向下的學業(yè)質(zhì)量評價測試題庫,負責每年的學業(yè)水平考試評價。此外,國家級評價團隊對各省級和各區(qū)縣評價團隊進行定期的理論指導和培訓,確保各級評價組織的專業(yè)水平滿足時代發(fā)展的需要。省級評價團隊依據(jù)國家教育目標,基于“證據(jù)中心設(shè)計”理論[22],確定證據(jù)內(nèi)容、證據(jù)類型以及證據(jù)標準,確保過程性評價有據(jù)可依。由于各省經(jīng)濟、教育、文化等方面的不同,學業(yè)質(zhì)量水平及表現(xiàn)形式等方面可能存在比較明顯的差異。各省可以結(jié)合各省的實際情況,確定數(shù)據(jù)、證據(jù)的時間范圍、標準、類型。雖然信息技術(shù)、大數(shù)據(jù)技術(shù)等的發(fā)展能夠“全時空”“全方位”收集學生學習數(shù)學過程產(chǎn)生的全部數(shù)據(jù)、證據(jù),但是從全方位、全時空收集的海量復雜數(shù)據(jù)中提取有效的學業(yè)質(zhì)量證據(jù)顯然是非常困難的事情,而且基于大量結(jié)構(gòu)復雜的數(shù)據(jù)建立科學的綜合模型全面評價學生學業(yè)發(fā)展、情感與態(tài)度、身心健康發(fā)展的狀態(tài),仍然是目前評價的瓶頸問題[23]。因此,數(shù)學學業(yè)評價不可能囊括所有細枝末節(jié)的數(shù)據(jù)和證據(jù),必須選取有效的、相關(guān)的、可靠的代表性數(shù)據(jù)和證據(jù)。同時須確保數(shù)據(jù)、證據(jù)收集的規(guī)范性、有效性、統(tǒng)一性,以及確保不同區(qū)縣、不同學校的數(shù)據(jù)與證據(jù)具有可比性,進而實現(xiàn)各省內(nèi)學業(yè)質(zhì)量評價的公平性。區(qū)縣評價團隊依據(jù)證據(jù)內(nèi)容、證據(jù)類型、證據(jù)標準探究證據(jù)獲取途徑、方法以及提取技術(shù),并指導各學校教師、學生等評價主體上傳證據(jù)。由于區(qū)縣的差異性,可能獲取各學校學生學業(yè)質(zhì)量的證據(jù)途徑、方法不一樣。區(qū)縣評價團隊要結(jié)合區(qū)縣實際情況,充分利用信息技術(shù)、大數(shù)據(jù)技術(shù)落實好數(shù)據(jù)與證據(jù)收集工作,以及對數(shù)據(jù)和證據(jù)篩選、鑒別、區(qū)分真假的工作。此外,指導和幫助區(qū)縣學校及學科教師完成課堂評價和階段性評價(期中考試、期末考試評價等),不斷完善過程性評價和發(fā)展性評價,實現(xiàn)數(shù)學學業(yè)質(zhì)量評價常態(tài)化。同時將評價結(jié)果及時反饋給學校、教師及學生,幫助教師提高教學水平,促進學生全面發(fā)展。3.開發(fā)學業(yè)測評系統(tǒng),實現(xiàn)數(shù)學學業(yè)評價過程的動態(tài)化、全程化大數(shù)據(jù)、人工智能等技術(shù)為數(shù)學學業(yè)評價系統(tǒng)實現(xiàn)評價和管理的信息化提供了技術(shù)支撐,信息化管理是時代發(fā)展的必然需要,也是實現(xiàn)數(shù)學學業(yè)質(zhì)量評價過程動態(tài)化、全程化的重要舉措。因此,整合國家級、省級、區(qū)縣三級評價團隊以及其他力量開發(fā)功能較全的自動化數(shù)學學業(yè)測評系統(tǒng)非常重要。學業(yè)測評系統(tǒng)不僅能高效、精準地分析結(jié)果性評價方面的數(shù)據(jù),而且具有專門的測試題庫,能更好地實現(xiàn)學業(yè)評價過程的動態(tài)化、全程化。通過學業(yè)測評系統(tǒng)能精準分析不同時空、不同狀態(tài)、不同環(huán)節(jié)的動態(tài)數(shù)據(jù),深度挖掘?qū)W生學習數(shù)學過程中知識、能力、態(tài)度等方面的發(fā)展變化及存在問題,實現(xiàn)對學生學習過程的診斷性評價、動態(tài)性評價和增值性評價[24]。此外,學業(yè)測評系統(tǒng)具有可視化、智能化與個性化功能,可以個性化與精準化推送相關(guān)評價結(jié)果及反饋信息,為學生的深度學習和教師的深度教學提供全面性診斷和全域指導[25];同時,為學校、教育管理部門檢驗課程改革效果、分析相關(guān)教育政策的成效、制定未來相關(guān)計劃和政策、提升教育管理能力和教育治理水平提供可靠的、科學的依據(jù),使教育管理模式由事后干預(yù)向事前調(diào)控轉(zhuǎn)變,進而促進教育治理模式由靜態(tài)化向動態(tài)化管理轉(zhuǎn)型[26][27]。4.發(fā)展教師評價能力,提升數(shù)學學業(yè)評價結(jié)果的公平性、準確性發(fā)展教師評價能力是教育評價改革和教師專業(yè)發(fā)展的內(nèi)在要求,也是適應(yīng)時代發(fā)展的體現(xiàn)。學科教師作為學業(yè)質(zhì)量評價的重要參與者,承擔著證據(jù)篩選、證據(jù)真?zhèn)伪鎰e以及證據(jù)和數(shù)據(jù)上傳學業(yè)測評系統(tǒng)等工作。提升教師評價素養(yǎng)和評價能力,在很大程度上能確保數(shù)學學業(yè)質(zhì)量評價數(shù)據(jù)和證據(jù)的代表性、真實性、準確性、全面性,進而確保學業(yè)質(zhì)量評價的科學性、公平性。此外,學科教師評價能力是過程性評價質(zhì)量的重要影響因素。學科教師評價能力水平高,一方面能準確評價學生知識掌握、學科能力發(fā)展、思維品質(zhì)及情感態(tài)度的變化情況,并能幫助學生制定個性化的學習策略,進而促進學生具體標準的達成和能力的發(fā)展。另一方面,教師能準確診斷出自己的教學情況,針對教學中存在的問題,能及時調(diào)整教學進度并進行教學干預(yù),做到教學改進、干預(yù)有據(jù)可依,避免主觀性和隨意性。因此,發(fā)展教師評價能力,有利于提升數(shù)學學業(yè)評價結(jié)果的公平性、準確性。

作者:夏林麗 顏寶平 單位:銅仁學院大數(shù)據(jù)學院