• 谷歌学者
  • 意见:1754

  • PDF下载:389

Rasch测量模型在可持续建设标准分析测量仪器校准中的应用

穆罕默德也Rashidi1*, Rawshan Ara Begum2,Mazlin Bin Mokhtar1和Joy Jaceline Pereira1

1马来西亚国立大学环境与发展研究所(LESTARI),马来西亚雪兰莪州卡江班吉43600。

2Malaysia国立大学气候变化研究所(IKP),邦尼,Kajang,43600雪兰莪D. E.马来西亚。

DOI:http://dx.doi.org/10.12944/CWE.9.3.14

本研究旨在校正用于可持续建设标准分析的测量仪器。为了实现这一目标,本文应用Rasch测量模型通过拟合和单维分析来识别失配数据,确定测量项目的信度和效度,识别并审核失配数据,使分析更加准确和有意义。通过对测量模型进行拟合和单维分析,可以实现校准测量仪器的目标,从而提高仪器在测量构造时的质量。因此,作为分析过程的一部分,识别和去除misfit数据是本研究强有力的统计理由,提高了项目的可靠性,并间接服务于仪器校准的目的,以确保更准确的测量。

错入数据;Rasch测量模型;可持续施工标准

复制以下内容以引用本文:

Rashidi M. N, Begum R. A, Mokhtar M. B, Pereira J. J. Rashidi M. N, Begum R. A, Mokhtar M. B。Curr World Environ 2014;9 (3) DOI:http://dx.doi.org/10.12944/CWE.9.3.14

复制以下内容以引用此URL:

Rashidi M. N, Begum R. A, Mokhtar M. B, Pereira J. J. Rashidi M. N, Begum R. A, Mokhtar M. B。Curr World Environ 2014;9(3)。可以从://www.a-i-l-s-a.com?p=573/


下载一篇文章(pdf)
引文管理
发布历史


文章出版历史

收到: 2014-11-11
公认: 2014-11-25

介绍

感知是一种非常困难的现象,衡量它是否是定性或定量研究(WAN NUR'ASHIQIN,2013)。因此,对测量仪器的验证对于所涉及的任何研究非常重要。RASCH测量模型包括一组指示,以满足科学测量的需求和要求,该测量应适用于社会科学研究(债券,2003年)。随着该测量模型的应用,可以将序数观察转换为线性类型的测量,也称为Logits(Mok&Wright,2004; Rasch,1980),这又允许使用测量间隔(赖特&linacre,1989)。该模型还允许研究人员尤其是社会科学来运行校准测量,这涉及将错误的原始数据分开以确保统计上更准确的分析结果。随着拟合和单向分析的一部分作为测量模型过程的一部分,目的是校准将提高测量仪器质量测量的测量仪器测量仪器的测量仪器。因此,本文旨在高光线,涉及的测量和分析方法,利用WinSteps®Rasch测量3.68.2软件。随着该模型的应用,评估测量中每个涉及的项目的技术方面,可以间接地提供校准仪器以确保更准确的测量来产生有意义和准确的分析。

Rasch测量模型

Rasch测量模型是分析涉及各个领域数据的重要工具(Shea等人,2012年),其中包括管理领域(Mcnamara&Knoch,2012年)。它有助于研究人员,特别是来自社会科学背景的研究人员进行校准测量,正如Azrilah等人(2008年)之前实施的那样。在分析过程中,对测量中的项目和受访者进行了调整或校准,这代表了Rasch测量模型与任何其他测量模型相比的独特特征和优势。

拟合统计

Rasch测量模型的关键原则之一是其检测不匹配或错配数据的能力。在应用此模型时,评估所涉及的测量项目的技术质量至关重要(Smith,1992)。因此,拟合分析用于评估研究参与者和测量项目可以在相同的规则和构建中收集的程度。参考Fit统计的需求,研究参与者应始终如一地排列在同一结构中测量的相关项目,其中应考虑删除或修订的错误物品(WAN Nur'Ashiqin,2013)。

在Rasch测量模型拟合统计的背景下,需要观察几个方面,包括;合身、装备、均方(MNSQ)和标准化平均值(ZSTD)。在观察过程中,数据与模型期望的一致性可以清楚地显示出来。根据Linacre (2002), MNSQ值在0.5和1.5之间被认为是有效的测量目的。他还强调,Z STD值在-1.9和1.9之间是一个指标,表明原始数据具有合理的可预测性。此外,MNSQ值的范围从1.5到2.0仍然是可接受的,即使它不是生产性的测量目的。

物品联合国人数

根据麦克马纳拉(1996),需要测量物品的单维性,以确保测量仪器中的项目一起运行,以在测量数据矩阵中形成单一基本模式。大约,可以确定能够测量质量潜变量的测量仪器(Sign,2010)。在项目单向性的测量过程中,将考虑残余数据的相关值。对于任何两个项目的值等于或大于0.70清楚地表明,这些两个项目可能在局部性中没有自由,或者换句话说,两个测量的项目被认为是相同的并且在视角下携带相同的含义研究参与者。

实施方法

通过应用Rasch测量模型(Rasch,1960;Rasch,1980),使用Rasch测量Win steps®版本3.68.2(Linacre 2009)。根据该模型的数学公式,研究参与者与本研究中先前确定的可持续建设标准(Rashidi,2014)中的测量项目之间建立了关系。建立关系的目的是在度量中度量属性。通过使用该测量模型,还考虑了研究参与者的能力和项目的难度(Rasch,1980)。

根据Linacre(2009),需要考虑的第一个重要步骤是观察任何点测量相关性(PMEA),具有负值。然而,应该获得的相关性是正值(Abu Bakar,2012)。除此之外,由于Linacre(2009)推荐,在分析期间遵循三个观察步骤;
  1. 适合以前的衣服观察
  2. 在Z标准(Z STD)之前的平均方形(MNSQ)的观察
  3. 观察高值之前的低值或负值
对三次测量步骤给予注意事项,以确定研究参与者的拟合统计结果,并确定可持续建设标准作为测量项目。对于单尺寸分析,尤其是对于任何两个测量项目等于或超过0.70的剩余数据的相关值。

结果与讨论

总体而言,使用Win steps®3.68.2版本软件,按照Rasch测量模型对原始数据进行分析。为了便于讨论,将可持续建设的标准描述为项目,研究参与者作为本部分解释部分的人员。

概要统计信息

图1中的概要统计清楚地显示了人的可靠性在0.84的值下,根据费舍尔(2007)可以采用进一步分析。同时,物品的可靠性在0.77时测量,这是一个良好的水平,物品的分离指数值为1.85,被认为是适度的(Fisher,2007)。

通过使用[4 *分离1)/ 3]的公式,产生两个项目的层。用于人员的分离指数已在2.30中进行评估,根据Fisher(2007),分类为良好,并且通过使用相同的公式[4 *分离1)/ 3]为研究参与者获得三个地层。

图1:人员和项目的摘要统计来源输出自Winsteps®软件版本3.68.2
点击此处查看数字


无法将研究参与者分开到更高数量的地层可能是由于债券和福克斯(2007)所指出的低质量或少量测量项目。然而,收购良好物品的可靠性0.80清楚地表明,测量仪器一直在运行进一步分析。参考图1,测量仪器的标准误差是±0.09的均值的标准误差。在Fit MNSQ中,物品为1.00日志,这清楚地表明观察与期望兼容。至于是正常曲线的偏差值的ZSTD,它已经在-0.1日志中测量。该值表明,样品分为单独的轮廓的样品的概率是0.99的几率,这是一种高概率。

项目匹配

对不匹配项的观察如图2所示,其中每个项的PMEA均为正值。据观察,除第1项(e_SustPro)、第37项(e_EPW成本)和第28项(S_遗产)价值高于1.5外,大多数项目的装备和合身MNSQ均在生产测量范围内。然而,出于测量目的,它仍然是可以接受的,尽管它基本上不是生产性的(Linacre,2002)。但是,三个项目的ZSTD值均超出了-1.9至1.9的允许范围。通过测量ZSTD还发现,第9项的值等于2.0也降低了测量仪器的合理可预测性。所涉及项目的MNSQ和ZSTD汇总如表1所示。

图形2:Misfit项目的观察来源
输出
Winsteps®软件版本3.68.2
点击此处查看数字

桌子1:误用物品摘要
点击这里查看表格


为了校准测量仪器;第1,37,28和9项应排除在下一次测量。但是,进一步的审查被认为是必要的,因为这四项的错误的原因可能是由于研究参与者(误入者)之间的不匹配。此外,这些项目是在早期阶段确定的可持续结构标准的项目仍然需要考虑进一步测量。

人适合

参考图3,仅在列表的顶部执行观察,而应在稍后的分析阶段保持低或负值的底部位置的列表(Linacre,2009)。基于MPSQ和Z STD的PMEA的价值,适合和装备;确定了八个误操作人员,在本研究中涉及不匹配的研究参与者。确定的八个人被认为被排除在下一次测量之外。

从观察,PMEA对于有条入口号为41,39,28和40的人是负的。同时,对于入场号25和33的人来说,MNSQ不是对测量目的的生产率,其中装备值超过2.0的最大允许。对于ZSTD的测量,有两个异常值被观察到,条目编号21和38的人。从分析结果中,应考虑发现与该模型不相容的八个研究参与者进行消除。

图3:失误人的观察来源
输出
赢取步骤®软件版本3.68.2
点击此处查看数字


图4显示了删除已被确定的八个误入歧的人之后的错误物品列表。然后将8个错配数的分析结果与删除前的原始结果进行比较。表2中示出了先前识别的四个错误物品的ZSTD的比较。从观察中,ZSTD值对于项目1,28和9的ZSTD值有所改善。但是,项目37仍然在范围内据林克雷(2002年)称,在统计上难以预测。

图形4:不匹配项的观察
删除误操作人员(P-DELETS)
来源
输出
Winsteps®软件版本3.68.2
点击此处查看数字

桌子2:后项目比较
删除误操作人员(P-DELETS)

点击这里查看表格


参考图4,还可以注意到,除了项目37,还有其他三个项目在相同的范围内,例如项目3 (E_WsteMinz),项目22 (E_ISO 14000)和项目18 (E_QualProf)。根据Linacre(2002),这些项目很难预测,或者研究参与者对这三个项目有不同的看法。然而,由于这些项目是之前确定的可持续建设的标准,因此,为了进一步分析研究的目的,应该保留这些项目。

清理数据后统计数据

拟合统计的人和项目在清洁数据后的结果如图5所示。然后将清理数据与如表3所示的原始数据(初步数据)的结果进行比较。

图5:Person和的汇总统计信息
项目(数据清洁后)
来源输出
Winsteps®软件版本3.68.2
点击此处查看数字

桌子三:比较总结
删除错误数据后的统计数据

点击这里查看表格


参考表3,数据表示人类类别的可靠性和分离指标的损害,从来没有较少的分离层保持不变。但是,可以在项目类别中观察到值的升高。与0.77(在早期阶段)相比,物品的可靠性在0.82中注册,被认为是一个良好的水平。项目分离指数在2.13(1.85)中测量的(增量)也被视为良好的水平(Fisher,2007)。与之前的两个地层相比,物品的分离层也增加到三个层。这清楚地表明,错配原料数据的清除增强了物品的可靠性,它间接用于仪器校准的目的,以确保更准确的测量。因此,消除错误数据是这项研究的强烈统计理由。

项目的单向性

如表4所示,差异以24.8%测量,远低于Rasch测量模型所需的最低点40.0%。差异如何高于24.7%的建模值较高0.1%。通过检查记录在12.2%的“第1对比度的不明敏感性”中,可能会解释低分的结果。据Fisher(2007)表示,该百分比表明,噪声干扰高,因为它接近最大值为15.0%。

桌子4:标准化的残余
方差(单位:eIgen价值)

点击这里查看表格


噪声高达12.2%是由于通过观察称为“最大标准化剩余相关性”的方面识别的相关元素(表5)。高相关值(≥两个已识别项目的数据残差为0.70),表明这两个项目在当地可能不自由。参考表5,项目(成对)的相关残差较低,其中“最大标准化残差相关性”的值仍然小于最大允许限值0.70。因此,为了进一步测量,保留了列出的所有项目。
桌子5:最大的标准化残余相关性
点击这里查看表格

结论

总体而言,从所获得的结果,发现测量仪器基于分析项目可靠性的分析具有可接受的有效性。物品可靠性的值为0.82大于0.80,这根据债券和福克斯(2007)是强烈的可接受的。这是先前值0.77的改善。对于该项目的分离指数,所获得的值为2.13,克eefe(1989)所建议的最低允许限额超过2.0。所有项目的PMEA都显示了证明所有使用的物品的正值与构造的测量相同。本研究还确保了;每个测量项目都是单向的,具有不同的难度水平,以及涉及所有研究参与者的公平。因此,通过对拟合和单维性分析进行测量仪器的校准,可以确定和审查测量项目的可靠性和有效性,并且可以对测量仪器进行改进。这非常重要,特别是提高了测量构造时仪器的质量。

确认

作者要感谢Joy Jacqueline Pereira教授、Mazlin bin Mokhtar教授和Rawshan Ara Begum副教授阅读并评论本文早期版本。作者感谢马来西亚Kebangsaan大学环境与发展研究所(LESTARI) ZAMALAH LESTARI和COE-LESTARI (XX-07-2012)为实现本研究提供的支持和ï -的资金支持。

参考文献
1.Abu Bakar, K.,《Rasch模型和Winsteps简介》,UKM Bangi。pp: 5 - 6 (2012)
2. Azrilah,A.A.,Azlinah,Azlinah,M.,Noor Habibah,A.,Hamzah,A.G.,Sohaimi,Z.,&Sidefudin,M。,Rasch模型在验证测量仪器构建中的应用。国际教育和信息技术,2:105-112(2008)
3.债券,T.,&Fox,C.应用Rasch模型:人类科学的基础测量,Mahwah,Lawrence Erlbaum Associates,NJ(2007)
4.债券,T.G。,有效性和评估:RASCH测量透露。Metodologia de las ciencias del Comportamient,
5(2):179-194(2003)5.费希尔,W.,评级量表仪器质量标准,拉希测量交易21(1):1095(2007)
6.基夫,《学习风格概况手册:适应知觉、学习和教学偏好》,第二版,全国中学校长协会,里斯顿,弗吉尼亚州(1989)
7. Linacre,J. M.,专利编号版本3.68.2。(2009)
8.英菲特和服装,均方和标准化意味着什么?,《计量学报》,16(2):878(2002)。
9.Mcnamara,T.,和Knoch,U.,拉希战争/:语言测试中拉希测量的出现,语言测试,29(4):555–576(2012)。
10.麦克纳马拉,《第二表现语言的测量》,朗文,纽约(1996)。
11.Mok,M.,和Wright,B.,Rasch模型系列概述,Rasch测量导论:理论、模型和应用,明尼苏达州贾姆出版社。第1-24页(2004年)。
12.Rasch,G.,一些智力和成就测试的概率模型(哥本哈根,丹麦教育研究所,扩展ED。用前言和后记,B.D. Wright,芝加哥大学出版社,芝加哥(1960/1980)。
13.拉希迪,M。北,贝格姆,右。A.,Mokhtar,M.,和Pereira,J.J.,通过实施环境管理计划(EMP)实现可持续建设的标准。《科学研究高级评论》,1(1):43–64(2014)。
14.。Shea, T., Cooper, B.K., De Cieri, H., & Sheehan, C., Evaluation of a Perceived Organisational Performance Scale Using Rasch Model Analysis, Australian Journal of Management, 37(3): 507–522 (2012).
15.Sick,J.,语言中的Rasch测量662 RASHIDI等人,Curr。《世界环境》,第9卷(3),653-662(2014)教育第5部分:Rasch测量的假设和要求,SHIKENhlm:23-29(2010)。
16.史密斯,R.M.,拉希测量的应用,梅萨出版社,伊利诺伊州芝加哥(1992年)。
17. WAN NUR'ASHIQIN,MEMPROFILKAN GURU BURU BAHASA INGGERIS杨柏路UNTUK MENDIDIK AMALAN PENJIMATAN AIR DI Institusi Pengajian Tinggi Awam di Negeri雪兰莪州,邦尼,大学,凯银帆大学马来西亚(2013)。
18.Wright,B.D.,和Linacre,J.M.,观察总是有序的;然而,测量必须是间隔,物理医学和康复档案,70:857-860(1989)
Creative Commons许可
这项工作是在授权下获得的知识共享署名4.0国际许可