本文是我在2013年主持的研究课题,为了介绍制订标准的研究过程中采用的多种统计方法,供后人参考,特予发表。 王路德2020.12 深圳市中小学生体质评定标准的研究 1 前言 深圳市从2000年起每年都对中、小学生进行体质测试和评定。采用的是1999年8月国家体育总局群体司与国家教育部体育卫生艺术司领导的《中国儿童青少年体质测定标准》研制组制定的标准。2004年深圳市对其中部分测试指标和标准进行了修改后一直沿用至今。 2002年国家教育部公布了《学生体质健康标准(施行方案)》,但是,该标准除身高标准体重外,其他所有指标都不是根据学生的年龄进行评定,而是从初中开始一个年级制定一个统一的评定标准,小学阶段分为:一、二年级,三、四年级,五、六年级,每两个年级用一个评定标准。由于在同一个年级里学生的年龄就会相差3岁左右(见表1),用相同的标准评定的结果,对部分年龄较大或较小的学生都是很不合理的, 2007年公布的《国家学生体质健康标准》仍然是按年级评定,因此,深圳市没有使用此标准。 表1 2012年深圳市初中各年级学生不同年龄人数统计表 年龄 | 初一男 | 初一女 | 初二男 | 初二女 | 初三男 | 初三女 | 11 | 8 | 9 | 0 | 0 | 0 | 0 | 12 | 265 | 232 | 8 | 9 | 2 | 1 | 13 | 736 | 554 | 804 | 811 | 112 | 138 | 14 | 101 | 88 | 811 | 608 | 2583 | 2597 | 15 | 17 | 6 | 139 | 88 | 3136 | 2488 | 16 | 2 | 3 | 42 | 22 | 649 | 403 | 17 | 0 | 0 | 34 | 23 | 95 | 66 | 18 | 0 | 0 | 6 | 1 | 14 | 8 |
随着人民生活水平日益提高,青少年的身体形态、机能、素质也会发生很多变化,因此有必要制定新的体质评定标准,以适应社会的发展。为此,决定采用2012年深圳市学生体质测试的大样本数据,研究制定深圳市中小学生体质评定标准。 2 研究对象与方法 2.1 研究对象 深圳市2012年国民体质测试人群中,7~18岁中小学生共37552人(其中:小学男7693,女6628,中学男12456女10775)。每人都测试:身高,体重,肺活量,台阶指数,握力,背力,坐位体前屈,50米跑,立定跳远9项指标。 2.2 研究方法 依据2002年国家制定《国民体质测定标准》时的原则与方法(详见《体育科学》2004年第3期“《国民体质测定标准》的研制”),用数理统计中的百分位数法、曲线回归分析法等方法制定标准,并用部分2013年学生测试数据进行回代检验。 3 研究步骤与结果 3.1 标准制订的原则 标准中年龄段的划分,依据国家制定《国民体质测定标准》的规定,7~18岁每1岁为一组。单项指标和体质总评的等级理论界值,均按照国家制定《国民体质测定标准》的规定。 3.1.1各单项指标等级理论界值点的确定 各单项指标均采用5级评分。按国家制定《国民体质测定标准》的规定,合格以上率理论界限65%。(5等—优秀10%,4等—良好25%,3等—合格30%)见表2。 表2 5级评分理论界位点 等 级 | 1 | 2 | 3 | 4 | 5 | 百分位数 | P3 | P10 | P35 | P65 | P90 | 理论 % | 7 | 25 | 30 | 25 | 10 |
3.1.2体质总评等级理论界值点的确定 按国家制定《国民体质测定标准》的规定,合格以上率理论界限为85%(优秀10%,良好25%,合格50%)。 3.2 标准制订的方法与过程 3.2.1 形态类指标 一个人的体型应该是匀称的,即体重应和身高成比例,太重、太轻都不好。所以,身高和体重两个指标的测试值不单独进行评定,而是用两个指标的测试值合起来评定“身高标准体重”。 “身高标准体重”的评分方法是:身高为某一值时,体重值在一定范围内即评为“正常”,而超过正常范围就评为“偏重”或“超重”。体重值不到正常范围就评为“偏轻”或“过瘦”。5个等级:过瘦,偏轻,正常,偏重,超重,分别定为1、3、5、3、1等。 “身高标准体重”的评定标准,采用2007年教育部公布的《国家学生体质健康标准》中的标准(该标准不是按班级评定,而是按各人的身高值评定),未作修改。 3.2.2 机能与素质类指标 以制定男生肺活量的方法为例(其他指标的制定方法相同)。 (1)计算出男生肺活量的各百分位数表和趋势图(表3,图1)。 表3 男生肺活量百分位数表 年龄 | P 3 | P 10 | P 35 | P 50 | P 65 | P 90 | 7 | 630 | 870 | 1155 | 1295 | 1436 | 1774 | 8 | 706 | 981 | 1300 | 1445 | 1600 | 1928 | 9 | 939 | 1156 | 1515 | 1670 | 1813 | 2204 | 10 | 1069 | 1350 | 1705 | 1844 | 1991 | 2420 | 11 | 1177 | 1522 | 1890 | 2035 | 2228 | 2743 | 12 | 1288 | 1611 | 2025 | 2219 | 2464 | 2998 | 13 | 1865 | 2219 | 2768 | 3012 | 3245 | 3874 | 14 | 2300 | 2672 | 3200 | 3403 | 3629 | 4203 | 15 | 2494 | 2859 | 3284 | 3508 | 3747 | 4307 | 16 | 2542 | 2896 | 3349 | 3582 | 3825 | 4414 | 17 | 2586 | 3022 | 3563 | 3800 | 4019 | 4672 | 18 | 2683 | 3064 | 3595 | 3850 | 4082 | 4656 |
由于7~18岁中小学学生的测试数据,是横断面调查的数据,在各年龄组间以及不同百分位数间都存在着随机抽样的误差,因而从图1可见,计算出的每条百分位数趋势线都存在上下起伏的随机波动。如果不进行平滑处理,直接用它来制定评定标准,必然会在各年龄组之间出现不合理的现象(有的年龄组标准比上一年增加得太多,有的年龄组又增加得偏少)。在同一年龄的各等级标准之间也可能出现差值大小不合理的现象。 (2)用曲线回归分析方法对P50百分位数曲线,计算出最佳拟合曲线方程。 试用二元、三元回归方程拟合后,对反映拟合优度的R2进行比较,以三元回归方程的R2 最高,且很接近1,表示用三元回归方程拟合的曲线较好,同时,拟合的趋势线也符合青少年肺活量的变化规律,即在青春发育期年增长值较大,而到了15岁以后年增长值逐渐减小。
(3)以P50百分位数拟合曲线为基准,分别调整制定标准用的P3,P10,P35,P 65,P90趋势线,使它们也都符合P50拟合曲线的趋势。 以P35趋势线为例,先计算各年龄点P35值与P50拟合曲线的差值。然后,对由于随机抽样产生的差值的误差进行平滑处理。方法是用最小二乘法,计算出趋势线及回归方程(见图3)。
再把P50拟合曲线各年龄点的值减去用回归方程计算出的各年龄点拟合差值,P35的平滑曲线就计算出来了。 用同样的方法也可以计算出新的P10、P65、P90值。 图4是各百分位数线平滑处理前、后的比较,由图可见,经过平滑处理后,消除了由于随机误差造成的波动,各年龄段的标准更符合青少年发育的趋势,因而更加合理。
3.2.3指标的权重和总评 由于深圳市在2004年对学生测试指标和标准进行部分修改时,对各指标的权重进行了充分的调查和统计研究,本次不再改变,继续沿用各指标的权重。 依据体质总评合格以上率理论界限为85%的原则,对37552名学生用制定的标准进行评定后,计算体质总分的百分位数。 计算的结果: P90=78.4分,P65=69.2分, P15=55.6分。因此,决定把新标准总分的优秀、良好、合格线分别定在78,69,55分,就能使约10%、25%、85%的人达到合格。 但是,为了不让人们感觉55分合格不符合习惯,决定在电脑评定软件中,每人评定时总分加5分,优秀、良好、合格线定在83、74、60分。 3.3标准的回代检验 制定体质评价标准后,对相应人群进行回代检验,以检验评定标准的适应性。 2013年随机抽取了两个区的中、小学生数据进行回代检验。用新标准进行评定后,总评的统计结果见表4、5。由表可见,两个区的优秀、良好、合格和未合格率都很符合总评的理论界限。经统计检验,甲区全都为差异无统计学意义(P>0.05),乙区除未合格率外也都是差异无统计学意义(P>0.05)。 可见,新标准的总评等级符合理论界限,是可以在深圳市推广实行的。
表4: 甲区4247人的总评统计
| 理论界限 | 2013标准 | 差值 | U 检验 | 优秀 | 10.0 | 10.4 | -0.4 | 0.92 | P>0.05 | 良好 | 25.0 | 23.8 | 1.2 | 1.94 | P>0.05 | 合格 | 50.0 | 50.9 | -0.9 | 1.21 | P>0.05 | 未合格 | 15.0 | 14.9 | 0.1 | 0.17 | P>0.05 | <img src="/userlist/wldgzs/data/user |