评估术语表


对齐 -课程与预期结果之间的逻辑联系.
分析得分 -将学生作业分成基本部分、逻辑部分或基本原则的评分. 评分者从多个维度来评估学生的表现,而不是从整体印象(整体评分)。. 在分析评分中, individual scores for each dimension are determined and reported; however, 质量的总体印象可能包括在内. (P.A. Gantt; CRESST 术语表)
锚(s) -一份学生作业的样本,说明一个特定的表现水平. 评分员使用锚点来评分学生的作业,通常将学生的表现与锚点进行比较.
评估 -专注于衡量业绩, 工作产品, 或技能,以便提供反馈,以记录优势和增长,并为改进未来的表现提供指导. 评估是非判断性的,其目的和目的是为了帮助产生改进.
问责评估 -某些单元的评估(可能是一个程序), 部门, 或整个机构),以满足外部利益相关者. 结果是总结性的,经常跨单位比较. (Leskes., 2002)
改进评估 -直接反馈到课程修改的评估, 程序, 或机构,以提高学生的学习成果. (Leskes., 2002)
评估计划 -概述项目任务/目标的文件, 期望的学生学习成果(或目标), 学习过程(e).g., 课程, 活动, 有助于提高学生能力的作业达到项目的成果(这可以以课程地图的形式显示)。, 远程时间表, 以及任务/目标和学生学习成果的位置(例如.g.、网站、小册子、谘询会). (改编自北伊利诺伊大学评估指南
评估计划(具体) -特定评估活动/项目的计划应包括特定评估活动的目的或目标, 结果将如何使用,谁将使用它们, 简要说明数据收集方法和分析方法, 每种方法所处理的结果/目标的指示, 收集和审查证据的时间间隔, 负责收集/审查证据和传播评估结果的个人. (改编自北伊利诺伊大学评估词汇表)
真实的评价 -通过评估学生以该领域专业人士的方式执行“现实世界”任务的能力,确定学生在某一特定领域的知识/技能水平. 真实的评估要求对学习想要产生的行为进行示范.
基准 – A point of reference for measurement; a standard of achievement against which to evaluate or judge performance.
顶点课程/经验 -一门高级课程,旨在帮助学生通过某种产品或体验来展示专业的全面学习. 除了强调与专业相关的工作, 顶点经验可以要求学生证明他们如何很好地掌握了机构一般研究项目的重要学习目标. (Palomba & 班塔,1999)
能力 -展示完成特定任务或达到特定标准的能力. (詹姆斯·麦迪逊大学学生成绩评估词典)
课程评估 -进行评估,以确定某一特定课程的学习成果达到何种程度.
成功的标准 -程序宣布自己成功的最低要求. 标准参照 -将学生表现与预先设定的表现标准进行比较的评估(而不是与其他学生的表现进行比较). (CRESST术语表)
课程地图 -显示每个课程中每个项目学习成果的覆盖率的矩阵.
直接的措施-直接评估措施要求个人或实体证明其知识, 技能, 和/或反映既定目标实现的行为.
嵌入的评估 -通过提取课程作业收集项目学习成果的数据/证据. 它是一种收集学生学习信息的方法,是教学过程中自然形成的一部分. The instructor evaluates the assignment for individual student grading purposes; the 程序 evaluates the assignment for 程序 assessment. 用于程序评估时, 一般来说,除了课程讲师之外,其他人会使用一个评分标准来评估作业. (Leskes., 2002)
嵌入式考试和测验 -通过提取课程考试或测验来收集课程学习成果的数据/证据. 通常, the instructor evaluates the exam/quiz for individual student grading purposes; the 程序 evaluates the exam/quiz for 程序 assessment. 通常只有考试或测验的一部分被分析并用于项目评估目的. 参见:嵌入式评估.
评价 —专注于对表演的质量做出判断或决定, 针对一组标准的工作产品或技能使用. 评价的目的和目的是记录已达到的成就水平.
焦点小组 -依赖于促进讨论的定性数据收集方法, 3-10名参与者被问及一系列关于他们态度的精心设计的开放式问题, 信仰, 和经验. 焦点小组通常被认为是一种间接的数据收集方法.
形成性评价 -在学习过程中进行的持续评估. 它的目的是提高个别学生的表现, 程序性能, 或者整体的制度效率. 形成性评估在内部使用, 主要是那些负责教授课程或开发和运行程序的人. (美国中部各州高等教育委员会,2007
目标 -对学生的总体期望. 有效的目标是广泛陈述的、有意义的、可实现的和可评估的.
分级 -评价学生的过程, 他们的排名, 并将每个学生的价值按比例分配. 通常,评分是在课程水平上完成的.
高风险评估 -其结果对学生、教师、项目等有重要影响的任何评估. 例如, 使用评估结果来确定学生是否应该获得认证, 研究生, 或者进入下一个阶段. 大多数情况下,仪器是外部开发的, 基于既定标准, 在安全的测试环境下进行, 并在同一时间点进行管理. (Leskes., 2002)
整体得分 -强调整体重要性和部分相互依存的评分. 评分者根据对学生整体产品或表现的综合评估给出单一分数. 用于学习的演示被认为超过其各部分的总和,因此完整的最终产品或表现被作为一个整体来评估的情况. (P. A. 甘特)
间接的措施 -间接评估措施依靠个人的看法来确定目标/目的是否已经实现.
学习成果 -识别知识的陈述, 技能, 或者是学生能够表现出来的态度, 代表, 或者是某一特定教育经历的结果. 学习成果有三个层次:课程、项目和机构.
目标-明确简洁的陈述,描述学生如何展示他们对项目目标的掌握. (艾伦,米.注:在Mānoa评估网站上,“目标”和“结果”是可以互换使用的.
结果 ——明确简洁的陈述,描述学生如何展示他们对项目目标的掌握. (艾伦,米.注:在Mānoa评估网站上,“目标”和“结果”是可以互换使用的.
性能评估 -使用学生活动或产品的过程, 而不是测试或调查, 评估学生的知识, 技能, 和发展. 作为这个过程的一部分, 学生的表现通常由教师或其他合格的观察员打分,他们也向学生提供反馈. 如果绩效评估是基于对真实或真实的学生作业实例的考察,并密切反映了该领域的专业人士是如何完成任务的,那么它就被描述为“真实的”. (Palomba & 班塔,1999)
投资组合 -一种绩效评估,系统地收集和仔细审查学生的作业,作为学习的证据. 除了他们工作的例子, 大多数作品集包括学生准备的反思性陈述. 根据既定的学生学习成果和标准,评估学生成绩的证据. (Palomba & 班塔,1999)
项目评估 -一个持续的过程,旨在监督和提高学生的学习. 教师:a)明确说明学生应该学什么.e., student learning outcomes); b) verify that the 程序 is designed to foster this learning (alignment); c) collect data/evidence that indicate student attainment (assessment results); d) use these data to improve student learning (close the loop). (艾伦,米., 2008)
可靠性 从广义上讲,可靠性指的是数据收集和分析的质量. 它可以指观察者/裁判分配分数或对观察结果进行分类的一致性水平. 在心理测量学和测试方面, 这是一致性的数学计算, 稳定, 以及一系列测量的可靠性.
标题-一种形状像矩阵的工具, 标准在一边,成就水平在顶部,用于对产品或性能进行评分. 标准描述了不同表现水平的特征, 常从模范到不可接受的. 理想的标准是明确的, 客观的, 并且符合学生表现的期望. 评分标准可由个人或多个评分员使用,以评判学生的作业. 当由多个评分员使用时,在评分开始之前进行规范. 在学生的作业被评判之前与他们分享这些标准是有意义和有用的,这样他们就能更好地理解对他们表现的期望. 当与基准学生作业或锚相结合以说明如何应用规则时,规则是最有效的.
学生学习成果 -学生将能够思考的陈述, 知道, do, 或者因为一个特定的教育经历而感觉.
总结性评估 -在课程结束时收集信息, 程序, 或本科/研究生的职业生涯,以提高学习或满足责任要求. 目的是确定总体目标是否已经实现,并为个别学生的表现提供信息,或为内部或外部问责目的提供有关课程或项目的统计数据. 成绩是总结性评估最常见的形式. (中部州高等教育委员会,2007年)
有效性 -指评估结果的解释和预期用途是否合乎逻辑,并有理论和证据支持. 除了, 它是指是否已考虑到评估结果的解释和预期使用的预期和非预期后果. (1999年《网投比较靠谱的大平台》)
增值评价 -确定参加高等教育对学生学习计划的影响或学习的增加. 重点可以是单个学生或一群学生. (Leskes., 2002). 设计一个增值评估计划是为了至少揭示“价值”, 学生需要在课程/项目/学位的开始和结束时进行评估.