全國

熱門(mén)城市 | 全國 北京 上海 廣東

華北地區 | 北京 天津 河北 山西 內蒙古

東北地區 | 遼寧 吉林 黑龍江

華東地區 | 上海 江蘇 浙江 安徽 福建 江西 山東

華中地區 | 河南 湖北 湖南

西南地區 | 重慶 四川 貴州 云南 西藏

西北地區 | 陜西 甘肅 青海 寧夏 新疆

華南地區 | 廣東 廣西 海南

  • 微 信
    高考

    關(guān)注高考網(wǎng)公眾號

    (www_gaokao_com)
    了解更多高考資訊

首頁(yè) > 高考報考 > 院校大全 > 高考新聞 > 機器批高考作文:有效禁止背作文和套作文

機器批高考作文:有效禁止背作文和套作文

2017-11-30 13:10:51澎湃新聞

  在高考評分中,作文往往是最耗費工作量,也最具爭議的一項。近年來(lái),由于高考作文評價(jià)體系屢遭質(zhì)疑,相關(guān)領(lǐng)域的專(zhuān)家學(xué)者開(kāi)始思考運用機器評分,來(lái)取代準確度不高且耗時(shí)耗力的人工批改。11月26日,華東師范大學(xué))中文系副教授徐默凡,在華東師范大學(xué)一場(chǎng)有關(guān)“應試作文寫(xiě)作質(zhì)量的計量和計算”的研討會(huì )上,就機器在作文評分中的實(shí)現可能性進(jìn)行了探討,并對當下的應試作文評分進(jìn)行了反思。

  通過(guò)數據統計可找出背題套題的作文

  據徐默凡介紹,目前有望運用于機器評分的自然語(yǔ)言處理模型有三類(lèi),分別是基于規則識別、數據統計和神經(jīng)網(wǎng)絡(luò )的自然語(yǔ)言處理。

  所謂基于規則識別的自然語(yǔ)言處理,是基于一定的規則對作文進(jìn)行句法分析和語(yǔ)義分析,從而掌握對語(yǔ)言的理解和表達。徐默凡認為,這條路對于作文機器評分是走不通的。因為首先,人類(lèi)自身并未建構起準確的作文評分標準;其次,作文評價(jià)標準涉及到的因素比句子理解更多,思想、邏輯、結構、語(yǔ)言等要素難以規則化。

  第二種模型則是基于神經(jīng)網(wǎng)絡(luò )的自然語(yǔ)言處理。它的原理在于運用腦科學(xué)和仿生學(xué),模仿人腦對信息的處理方式。然而在徐默凡看來(lái),這種模型也不適合用于機器評分。除了訓練復雜度高,費時(shí)費力之外,無(wú)法對它的信息處理過(guò)程進(jìn)行探測和評估,因而結果的可解釋性差。

  更重要的是,這種模型牽涉到了關(guān)鍵的智能倫理問(wèn)題。AlphaGo的橫空出世令人驚詫?zhuān)啾葒,作文更是人?lèi)智能的體現。如果將作文評分交給人工智能,很容易引起倫理上的反感甚至恐慌。高考這一事關(guān)很多人前途的重大考試,若完全交由人工智能去判斷評分,很有可能會(huì )造成“機器將會(huì )主宰人類(lèi)社會(huì )”的聯(lián)想。

  于是相比之下,基于數據統計的自然語(yǔ)言處理才是更適合機器評分的模型。這種數據統計的基本原理是,一個(gè)句子是否合理,不必了解它的句法語(yǔ)義,只需要考察它在人類(lèi)說(shuō)過(guò)的話(huà)中出現的可能性大小如何:出現的可能性越大,即越合理;可能性越小,則越不合理。理論上,進(jìn)行這種自然語(yǔ)言處理時(shí),需要把人類(lèi)講過(guò)的所有話(huà)都統計一遍;然而在現實(shí)中,進(jìn)行詞頻統計就已綽綽有余。“詞頻統計現在已經(jīng)是比較成熟的研究成果了,”徐默凡說(shuō),“在實(shí)際中,也可以考慮到前后文的關(guān)聯(lián)和影響。只是考慮的詞越多,意味著(zhù)計算也會(huì )越復雜。”

  徐默凡指出,數據統計可以有效禁止背作文和套作文的行為。如今中高考已成為了背作文和套作文的重災區,同一個(gè)教師教出的學(xué)生背誦了一樣的范文,因而考試時(shí)寫(xiě)出相似的作文,這一普遍現象若依靠人工力量是很難被察覺(jué)的。這里就是機器大顯身手的地方了。它可以通過(guò)統計給出重復率百分比,并自動(dòng)摘要出不同考生所寫(xiě)的相同事例,再由人工鑒定是否是作弊。

  此外,作文的語(yǔ)言規范度也可以使用統計測量。通過(guò)計算每篇作文的概率值,概率值越高說(shuō)明語(yǔ)言用法越常規,以此就可以識別不規范的語(yǔ)言用法。“當然,概率低也有一種可能,那就是作文在語(yǔ)言上進(jìn)行了創(chuàng )新,使用了一些新穎的表達。在此使用統計法,至少可以挑出概率低的表達,進(jìn)而進(jìn)行人工篩查,重點(diǎn)關(guān)注,再根據不同類(lèi)型的作文要求賦分。”徐默凡說(shuō)。

  作文能否代表語(yǔ)文水平

  在對現有的技術(shù)成果在實(shí)現機器評分的可行性上進(jìn)行分析討論后,徐默凡又引入了一個(gè)話(huà)題:作文真的可以測量考生的語(yǔ)文水平嗎?

  高中語(yǔ)文老師主要將精力用在了總結應對高考作文的技巧上,只教學(xué)生應付考試的方法,而疏忽了真實(shí)語(yǔ)文能力的培養。因為學(xué)生只要掌握了應試技巧,就能夠在高考作文中拿到高分,然而這并不足以證明其語(yǔ)文能力的優(yōu)秀。從另一方面看,這也證明了現今的高考作文命題與評分機制在衡量考生語(yǔ)文水平的高低上存在一定的困難。因而作文能否體現語(yǔ)文水平,又是怎樣測量語(yǔ)文水平的,成為了一個(gè)值得深思的話(huà)題。

  徐默凡表示,很多人認為作文水平只能整體感知,因此機器無(wú)法勝任,人類(lèi)也無(wú)法公正。但這一問(wèn)題并非無(wú)解。他犀利地指出,既然目前的作文評價(jià)量表可以將考生的作文水平分解為語(yǔ)言表現、思想內涵等等,為何不為每一項能力的評估專(zhuān)門(mén)設計一套試題?讓作文從繁瑣而模糊的評分體系中解脫開(kāi)來(lái),換以更清晰也更有針對性的試題,豈不更好?

  對于這一頗具革命性的提議,現場(chǎng)專(zhuān)家學(xué)者不盡贊同。“能寫(xiě)出一篇篇幅較長(cháng)的文章,就是對考生能力的最大肯定。并且中國有漫長(cháng)的寫(xiě)文章的傳統,不可輕易中斷。”在場(chǎng)的一位學(xué)者說(shuō)?磥(lái),有關(guān)應試作文的命題評分體系的改革,還有很長(cháng)的路要走。

[標簽:高考新聞 教育新聞]

分享:

高考院校庫(挑大學(xué)·選專(zhuān)業(yè),一步到位。

高考院校庫(挑大學(xué)·選專(zhuān)業(yè),一步到位。

高校分數線(xiàn)

專(zhuān)業(yè)分數線(xiàn)

日期查詢(xún)
  • 歡迎掃描二維碼
    關(guān)注高考網(wǎng)微信
    ID:gaokao_com

  • 👇掃描免費領(lǐng)
    近十年高考真題匯總
    備考、選科和專(zhuān)業(yè)解讀
    關(guān)注高考網(wǎng)官方服務(wù)號


日本一道免费7788www_国产香蕉尹人综合在线观看_天天看视频专区一区二区素人_日本Aⅴ大伊香蕉精品视频