心理技术与应用 ›› 2017, Vol. 5 ›› Issue (6): 334-340.doi: 10.16842/j.cnki.issn2095-5588.2017.06.003

• • 上一篇    下一篇

计分方式和题组效应对题组测验等值的影响:模型比较的视角

李雨秦   

  1. (浙江师范大学教师教育学院,金华321004)
  • 出版日期:2017-06-01 发布日期:2017-06-01

Impact of the Format of Scoring and Degree of Testlet Effect on Test Equating for TestletBased Tests: the Perspective of Model Comparison

LI Yuqin   

  1. (College of Teacher Education, Zhejiang Normal University, Jinhua 321004, China)
  • Online:2017-06-01 Published:2017-06-01

摘要: 采用模拟研究的思路,用项目反应理论(IRT)同时校准的方法对题组测验的项目参数进行等值;同时基于模型比较的视角,考查题组效应大小以及项目计分方式对等值结果的影响。研究结果表明:(1)不同模型在题组测验等值上的效果因计分方式和题组效应的不同而不同;(2)当题组效应较低时(05以下),等级反应模型(GRM)在区分度参数和难度参数上的等值效果均好于等级反应题组模型(GRTM),且不受计分方式的影响;(3)当题组效应较高时(05以上),模型的等值效果因计分方式而异,等级反应模型(GRM)在0/1计分项目的等值误差最小,等级反应题组模型(GRTM)则在多级计分项目的等值误差最小。

关键词: 等值;IRT题组模型;项目参数等值;混合计分

Abstract: A simulation study was conducted to investigate the impact of format of scoring and degree of testlet effect on test equating under polytomous IRT models. Both graded response model(GRM) and graded response testlet model(GRTM) were used to fit the equating results, meanwhile concurrent calibrate method was adopted to place item parameters that came from different tests on the same scale. Results showed that: (1) The equating results under different IRT models were influenced by different formats of scoring and degree of testlet effect. (2) When testlet effect was small than 05, GRM produced better equating results than GRTM both on discrimination and difficulty parameters regardless of formats of scoring. (3) When testlet effect was larger than 05, the equating results under different IRT models depended upon the ways of scoring, GRM produced small equating errors than GRTM for dichotomous items, while GRTM yielded small equating errors than GRM for polytomous items.

Key words: test equating; testlet model; item parameter equating; mixed items

中图分类号: 

  • B841.7
[1] 吴旭瑶, 黄 旭, 李 静. 数字囤积行为量表的编制及信效度检验[J]. 心理技术与应用, 2021, 9(2): 116-125.
[2] 吴 娜, 解智宇, 傅安国. 脱贫内生动力量表的编制[J]. 心理技术与应用, 2021, 9(1): 20-21.
[3] 任玉洁, 石津憲一郎. 中文版过剩适应量表在大学生群体中的效度和信度[J]. 心理技术与应用, 2021, 9(1): 30-40.
[4] 张潮, 张文焱, 刘文兰, 张皓. 大学生敬畏情绪问卷的编制[J]. 心理技术与应用, 2020, 8(4): 243-251.
[5] 佘 爱, 韦光彬, 曾练平. 工作家庭平衡问卷在不同性别中的测量等值性[J]. 心理技术与应用, 2020, 8(1): 60-64.
[6] 王晓玲, 贾 宁. 焦虑障碍的元认知问卷的编制、变式与应用[J]. 心理技术与应用, 2019, 7(12): 746-755.
[7] 张军成, 黄颖洁, 张淑莹, 刘得格, 屈曙光. 大学生职业决断力的测量问卷与个体差异[J]. 心理技术与应用, 2019, 7(10): 629-640.
[8] 颜志强, 刘 月, 裴 萌, 苏彦捷. 儿童共情问卷的修订及信效度检验[J]. 心理技术与应用, 2019, 7(9): 514-522.
[9] 王协顺, 苏彦捷. 中国青少年版认知和情感共情量表的修订[J]. 心理技术与应用, 2019, 7(9): 536-547.
[10] 杨晓峰, 李 玮, 郑 雪. 大学生特质宽恕问卷的编制[J]. 心理技术与应用, 2019, 7(8): 472-484.
[11] 赵显文, 史滋福, 郑凯文, 林道榕, 李珍贵, 王诗宇, 田 慧. 中文版智能手机成瘾问卷在大学生群体中的信度和效度[J]. 心理技术与应用, 2019, 7(7): 416-423.
[12] 辛妙菲. 高校教师组织承诺问卷的编制及信效度检验[J]. 心理技术与应用, 2019, 7(6): 364-377.
[13] 马 林, 李巾英. 强迫性网络使用量表在我国大学生群体中的信效度检验[J]. 心理技术与应用, 2019, 7(6): 358-363.
[14] 李 婕, 何亭亭, 马 皑. 大学生村官胜任特征模型建构及问卷编制[J]. 心理技术与应用, 2019, 7(4): 237-248.
[15] 卜 彤, 刘惠军. 家庭复原力问卷的编制[J]. 心理技术与应用, 2019, 7(3): 173-182.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 张红川, 苏 凇, 吕杰妤, 张 梅, 辛自强. 基于理性决策的财经能力:概念、结构与测量[J]. 心理技术与应用, 2018, 6(8): 465 -471 .
[2] 黄梓航, 王 可, 蔡华俭, . 利用开放数据进行心理学研究[J]. 心理技术与应用, 2018, 6(9): 549 -569 .
[3] 张红川. 从转化研究的角度理解心理学在社会服务中的功用[J]. 心理技术与应用, 2018, 6(10): 580 -581 .
[4] 谢天. 社会心理服务中的三类人[J]. 心理技术与应用, 2018, 6(10): 590 -592 .
[5] 辛志勇. 加强社会心理服务重在专业人才建设[J]. 心理技术与应用, 2018, 6(10): 591 -592 .
[6] 毕重增. 社会心理服务中的对象化和主题化及其整合[J]. 心理技术与应用, 2018, 6(10): 593 .
[7] 赵玉芳. 根据群体心理需求设计社会心理服务内容[J]. 心理技术与应用, 2018, 6(10): 594 .
[8] 王 沛, 陶爱华. 和谐医患关系的社会治理及其促进路径: 过程监控与预防[J]. 心理技术与应用, 2018, 6(10): 596 -598 .
[9] 潘超超, 周爱保, 刘锦涛, 谢 珮. 情绪诱发情景下情绪面孔的注意偏向研究[J]. 心理技术与应用, 2018, 6(10): 600 -605 .
[10] 姜永志, . 青少年问题性移动社交媒体使用评估问卷编制#br#[J]. 心理技术与应用, 2018, 6(10): 613 -621 .