请问托福口语考试打分是人工还是机器打分？打分标准是怎么制定的？

栏目：机器学习作者： 531科技网时间： 2024-11-01 20:20

一、请问托福口语考试打分是人工还是机器打分？打分标准是怎么制定的？

19年托福改革后，我们可以非常肯定地告诉大家，托福口语一定是机器批改，至少机器批改参与了每一位同学的评分过程。

ETS官方公布的数据，最新版本的托福口语机器评分系统Speech Rater与人工评分的相关性系数是0.81。

说实话，官方单纯的拿这么一个统计学系数摆在我们的面前，对于考生或者是托福资深教师而言是没有感觉的，这个系数到底是偏高还是偏低，究竟什么数值范围值得我们进行参考，根本就无从比较。

因此，我们与ETS几位资深的语言测评老师进行了访谈，为大家整理了这篇ETS口语机评的干货。

此段来自于ETS的官方报告：

随着越来越多的年轻学生在世界范围内学习英语作为第二语言（English as a Foreign Language），为青少年语言学生（Young Language Students）设计的标准化语言考试 (比如托福考试)。变得越来越受欢迎。

鉴于这一快速增长的趋势，需要更好地理解年轻学生的语言发展模式和语言表现的语言特征成为语言学教师的需求。根据2014年，两位口语测评学者Bailey＆Heritage的研究，语言发展模式和语言表现对于语言学评估的创建提供指导和指导至关重要。

ETS于是系统地进行实证研究：在青少年语言学生中检查其英语语言能力（English Language Proficiency）的进展以便验证青少年语言学生评估任务和评分标准，并为基于测试结果的提供有效性证据（Kane，2013）。

在了解托福口语的机批原理之前，我们先了解一下什么是口语流利度。

何为流利度Fluency？

Lennon (2000) stated that fluency “can be measured both impressionistically and instrumentally by speech rate, and by such dysfluency markers as filled and unfilled pauses, false starts, hesitations, lengthened syllables, retraces, and repetitions” (p. 25)

简而言之的流利度有几个衡量的维度：

速度(Rapidness)
流畅性(Smooth)
准确性(Accuracy)
易懂性(Lucidity)
思维的高效转换（Efficient translation of thought)以交流为目的 (Communicative intention)

流利度同时也能细分成三个方面去进行深入分析：

停顿性流利度（breakdown fluency) : 在连续话语中的暂停特征(the pausing features of continuous speech)；

速度性流利度（speed fluency) : 话语演讲过程中的速度( the rate of speech delivery (Ginther et al., 2010 );

修复性流利度 (repair fluency)：在话语中的自我更正、重复以及重述的频率( the number of selfcorrections and repetitions or reformulations present in speech (Iwashita, Brown, McNamara, & O’Hagan, 2008)）

在目前ETS采用的机改Speech Rater的系统中，对于托福口语测评是何以科学、公正以及客观地对考生们进行评价的呢？

根据ETS最新的一项研究, 自1996年就有语言学学者(Ginther et al., 2010; Towell, Hawkins, & Bazergui, 1996) 使用平均话语长度(mean length of run) 这项指标来对考生们的流利度进行测评，通俗易懂的说法，就是在托福考试中你的所有"huh", "uh", "erm", "um", and “well" (filled pause)都会被计数，当频率高到一定程度，就会被认为是弱流利度，另一种就是沉默(silent pauses), 在整个口语回答的过程中如果出现长间断，那么系统会自动把你的口语归为弱流利度。

而托福口语考试的不同任务(task)其对考生们的语言能力和认知能力都有所不同，因此在进行口语独立任务(independent speaking task)设计和口语综合任务(integreated speaking task)设计的过程中，在这项研究中，青少年(YLS)与成人考生(Adult learner)的流利度水平在两个任务的机评效果中都出现了较为稳定的表现。

因此我们可以得出客观结论，在口语流利度方面，考生们在口语独立任务和口语综合任务之间较少会出现流利度偏差。

何为语法Grammar ？

自1999年，在第二语言习得(Second Language Acquisition)的理论中（Norris & Ortega, 2009; Skehan & Foster, 1999; Wigglesworth & Elder, 2010），与语言测试相关的语法方面研究主要关注于两个方面：

语法准确性(Grammar Accuracy)

语法复杂性(Grannar Complexity)

针对语法准确性，最新的研究报告给出了两个标准维度：

整体准确性(Global Accuracy)，在习者的语言中有任何的语法错误(Grammatical Errors)都会纳入考量范围；

特定种类错误(Specific Types of Error)，2015年的语言学研究者Brown已经将该种类进行了详细描述：动词时态(Verb tense)

主谓一致(Subject-verb agreement)
冠词使用(Article use)
介词使用(Prepositions)

针对语法复杂性，最新的研报的结果(McNamara, & Elder, 2001), 表现为

句式(Syntactic patterns)的呈现性(Elaboration)
句式(Syntactic patterns)的多样性(Variation)

在托福口语测试中，机器会针对各位同学的语法呈现，比如:

时态的丰富性(一般过去式，现在完成时，现在进行时等多个时态的呈现)；
同时较多中国考生在语法呈现的过程中会出现主谓不一致的现象 (例如：information加s, they doesn’t 这样的常见主谓不一致的问题)；
针对介词的使用: 较多同学在口语回答中会出现简单句的堆砌，缺乏定语从句、状语从句、宾语从句或是表语从句的使用;

无论是曾经的人批还是现如今的机器批改，托福口语考试的评分标准都是不变的，大家都要针对性地训练自己的口语能力。

福利：托福口语2019上半年的口语合集以及相应的高分参考答案

你离托福口语满分之间, 只差这么一份参考答案合集！

二、机器学习包括？

机器学习

机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。

三、机器学习是从哪里学习？

机器学习是从数据中学习的。它利用算法和统计模型来分析数据，发现数据中的模式和规律，从而生成预测模型和决策模型。

机器学习有监督学习、无监督学习和强化学习等不同的学习方式，可以应用于各种不同的领域，如自然语言处理、计算机视觉、音频信号处理和金融等。

机器学习的数据来源可以是结构化数据和非结构化数据，如图像、文本、音频和视频等。

四、什么是学习和机器学习？

机器学习(Machine Learning)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能，它是人工智能的核心，是使计算机具有智能的根本途径。

学习，是指通过阅读、听讲、思考、研究、实践等途径获得知识和技能的过程。学习分为狭义与广义两种：狭义：通过阅读、听讲、研究、观察、理解、探索、实验、实践等手段获得知识或技能的过程，是一种使个体可以得到持续变化（知识和技能，方法与过程，情感与价值的改善和升华）的行为方式。例如:通过学校教育获得知识的过程。广义：是人在生活过程中，通过获得经验而产生的行为或行为潜能的相对持久的方式。次广义学习指人类的学习。

五、机器自我学习原理？

机器学习是人工智能的一个子集。这项技术的主要任务是指导计算机从数据中学习，然后利用经验来改善自身的性能，不需要进行明确的编程。

在机器学习中，算法会不断进行训练，从大型数据集中发现模式和相关性，然后根据数据分析结果做出最佳决策和预测。

机器学习应用具有自我演进能力，它们获得的数据越多，准确性会越高。

六、机器学习作者？

《机器学习》是清华大学出版社出版发行的书籍，作者是周志华。

七、机器学习就业待遇？

机器学习是一个热门领域，就业待遇相对较好。根据不同地区和公司的情况，机器学习岗位的平均薪资可能在每年5万-20万美元之间。大公司如谷歌、亚马逊、微软等，在机器学习领域有较高的薪资水平。

此外，机器学习专业人员往往具有广泛的职业发展机会，可以在各种领域应用机器学习技术，如金融、医疗、制造等。因此，机器学习就业待遇相对较好，但具体情况还取决于个人的技能、经验和地区。

八、机器学习的分类？

机器学习是一个比较大的范畴，机器学习包括很多东西，如决策树分析，主成分分析，回归分析，支持向量机，神经网络，深度学习等。你说的流量分类应该是说采用机器学习里面的一些分类算法，如朴素贝叶斯算法，K-means算法（也叫K均值算法），EM算法(也叫期望值最大化算法)等聚类算法。

九、什么是机器学习？

机器学习指的是计算机系统无需遵照显示的程序指令，而只是依靠暴露在数据中来提升自身性能的能力。机器学习关注的是“如何构建能够根据经验自动改进的计算机程序”。比如，给予机器学习系统一个关于交易时间、商家、地点、价格及交易是否正当等信用卡交易信息数据库，系统就会学习到可用来预测的信用卡欺诈的模式。机器学习本质上是跨学科的，他采用了计算机科学、统计学和人工智能等领域的技术。

中公教育和中科院的老师合作推出了一个机器人课程，可以关注一下

十、机器学习高校排名？

清华大学，北京大学，中国人民大学，复旦大学