当前位置:HOME > 论文与讲稿
制订体质评定和科学选材标准的统计方法

发布时间 2010-09-02

          制订体质评定和科学选材标准的统计方法

     【说明】 本人从1979年参加全国青少年儿童体质研究起,一直从事体质评价的研究,1987年担任全国运动员选材中心组组长后,又协助国家体育总局科教司抓全国的科学选材标准研究工作。对制订评价标准的不同阶段,应该运用什么统计方法,逐渐积累了一些经验。1997年与原国家体育总局科教司领导高大安同志交谈时,觉得很有必要将十多年来与全国各地研究工作者一起积累的经验加以总结,就写出了“制订科学选材标准的统计方法”并被1997年11月在北京召开的第五届全国体育科学大会上录取专题报告。后来,又逐渐修改、增加了内容,改为现在的文章标题。并根据其中的内容在安徽、甘肃、深圳等地讲课和指导制订体质测定标准、选材标准的研究工作。

    1979-1980年我国首次在16省、市开展青少年儿童体质研究,1985年国家教委、国家体委、卫生部联合对全国29省、市大、中、小学生开展体质、健康调查。这两次大规模的体质测试为全国各省、市培养了一批能熟练地运用统计方法,进行体质评分、评价研究的统计工作者。自从1980年国家体委组织委管课题“优秀青少年运动员选材研究”以来,运动员科学选材在全国各省、市也逐渐普及,全国各省、市体育科研所都有一批科研人员积极地研究科学选材中的评分、评价方法。制订评分、评价标准是体质研究和运动员科学选材研究中十分重要的研究内容。统计方法是研究评分、评价必须的工具,同时,在研究过程中,统计方法本身也得到了丰富和发展。

一、历史的回顾

    70年代末我国体质研究和运动员科学选材研究刚起步时,制定评分、评价标准只是沿用当时体育统计教材和卫生统计中的一些常用方法。如:用离差法、百分位数法制定评分标准,对多项指标的综合评价还没有“权”。
   
1984年全国体质研究学术报告会时,“对综合评价方法的研究有了较明显的进展”(见会议小结),会上多篇论文提出了不少统计方法如:逐步回归、判别分析、聚类分析等。会后,国家体委决定进一步集中力量组织综合评价方法的研究,于1985年成立了《中国学生体质综合评价方法研究》课题协作组,课题被列入国家体委委管课题。这是一个主要运用统计方法的研究课题,中国体育科学学会体育统计专业委员会的王路德,戎家增为课题组成员,王路德主要负责指标“权”的研究。课题组请我国知名的概率统计专家张尧庭教授对“权”的研究作了专题指导。1988年国家体委成立了运动员科学选材中心组,制订各运动项目科学选材标准及综合评价方法是其主要工作任务之一。1989、1990年中心组两次召集有关省、市研究人员开会,专题讨论制订选材标准时统计方法的运用问题,为1990-1992年中心组领导的国家体委课题(九个运动项目科学选材标准研究)作了统计方法的准备。
   
在参加体质研究和运动员科学选材研究的委管课题的科研人员共同努力下,不仅完成了研究任务,而且对统计方法在评分、评价中的应用也作了许多探索。十分有必要加以总结。

二、研究制订“标准”的四个阶段

    无论是制订体质评价标准还是制订运动员选材标准,整个研究过程中都应有:筛选指标、制订单项指标的评分标准、确定各指标的权重系数和综合评价方法、标准(初稿)试用验证后的修改等四个阶段,每一研究阶段都要采用不同的统计方法。

1.筛选指标

    为了从大量可用的指标中选定最关键的指标,必须进行指标筛选。通常可用两种方法:

1.1  特尔斐法(专家调查法)

    将经过初步整理的指标印成调查问卷表发给对本项目有经验的专家,征求他们的意见。对回收的调查表作统计处理,主要可通过作频数分布表,计算平均数、众数等,从而找出专家们意见比较集中的指标,按照特尔斐法的要求,应把第一轮意见的统计结果再次印发给专家,征求他们的意见。这样经过两轮咨询,一般都能取得较一致的意见。但在研究工作中发现,第二轮意见印发后,如请专家们来开一次咨询座谈会效果更好。

1.2  数据统计法

    可以用多因素统计方法中的逐步回归、R型聚类等,通过计算筛选出其中较重要的指标。如:1987年作赛艇选材标准研究时,用R型聚类分析作出指标谱系图如图一, 由图可见,当将指标分成七类时有‘*’的为每类的典型指标。该项计算结果成为后来确定赛艇选材标准中的形态、机能类指标的主要依据。

图一:                           

    1987年全国选材协作组曾对我国大批优秀田径运动员的数据做过逐步回归计算,发给有关省市。计算时,以运动成绩为因变量Y,自变量Xi是形态、机能、素质指标。其中样本量较大的项目,计算结果对筛选指标很有参考价值。
   
但是,用逐步回归计算时,必须特别注意样本量 n 和指标数 K 的比例,如 n 太小计算的结果就不能用。因为,多元回归方程的系数bi 的解是和原始数据的组数(样本含量)n 紧密相关的,可以推导出:当 n=K+1时,即使K个自变量Xi和Y全都不相关,仍可计算出复相关系数R=1的多元回归方程。所以,n 最好达到K 的5-10倍。

    研究实践表明:单靠统计计算结果来确定选材指标有时是不行的。较好的办法是:在“特尔斐”法调查和统计计算的基础上,再组织有经验的专家座谈讨论,最后确定指标。

2. 制订单项指标的评分标准

    每一个单项指标,如:身高、体重、肺活量……等,都应该分别制订出评分标准。一个单项指标的评分标准应该分几个等级,各等级应如何划分? 这些在体育统计学里并无现成的规定,要由标准制订者研究确定。1980年“中国青少年儿童体质研究”中,形态、机能指标都是分为:上、中上、中、中下、下五等,素质指标设1-20分,1980年“优秀青少年运动员选材研究”中,田径分上、中、下三等,足球分五等…… [3]。1987年以后,各省市制订的标准有的分三等、有的分五等、也有分十等的。1985年《中国学生体质综合评价方法与标准》规定各单项指标均按公式计算标准分,公式为:

   公式中:  X  为全国同年龄、性别组该指标的平均数 
             S  为全国同年龄、性别组该指标的标准差
             Xi 为测试值  

    为了使用方便,可事先按公式计算出各指标的评分表,使用时直接根据测试值查出单项指标的得分。但是,这种方法计算出的评分表篇幅太大。按公式用手工计算则比较麻烦。

    1989年全国选材中心组扩大会讨论认为,通过评分只需表明受测者的某指标值(如:身高170.5厘米)按某运动项目的要求,可划入优、良、中、差的哪一范围,不必分得太细。而且评分等级分得过细制订出的评分表必然很繁琐,使用较不方便。所以,评分标准“宜粗不宜细”。后来,1990年制订全国统一的九个项目选材标准和1992年制订八个项目选材标准时都是分为五等。并规定用平均数加减标准差的方法划分等级如表1。

    但是,有一些指标并不是测试值越大越好或越小越好,而是中间值好,太大或太小都不好。例如:指标身高,在篮球、排球选材时是测试值越大越好,而在体操、跳水选材中的身高指标都是太大或太小都不好,而在中间范围内最好。还有如评定身体结实程度的克托莱指数等指标也是这样。所以,如果分5个等级时,就不是1、2、3、4、5,而是1、3、5、3、1了,如表2。

2.1  用定基比法制订选材标准中各年龄组的标准

    由于制订选材标准的目的是要选拔未来的优秀选手,所以,各年龄组的标准都应该以优秀运动员的“模式”数据为依据。为此,首先要通过测试或收集文献资料取得全国或世界的优秀成年运动员各指标的平均数、标准差,在此基础上定出成年时各指标的“模式”等级要求,如某项目成年男子运动员身高172厘米为及格、183厘米为优秀等等。再采用优秀运动员“模式”数据乘各年龄组定基比的方法制订各年龄组的标准,这样才能保证该指标年龄组间的增长值符合青少年的生长发育曲线规律
   
凡是能从我国青少年体质调查等统计资料中查到各年龄定基比的绝大部分形态指标和部分机能、素质指标,都可以采用定基比法制订各年龄组的标准。以身高为例,全国青少儿体质调研统计资料中身高(男)的有关数据如表3。如已确定某项目成年男子(20岁)运动员身高172厘米为及格、183厘米为优秀,则分别用172、183乘各年龄组的定基比即可制订出标准如表4。

                                         表 3 :

年龄

平均数

定基比

12

145.2

85.21 %

13

151.8

89.08 %

14

158.3

92.90 %

15

163.8

96.13 %

16

167.0

98.00 %

17

168.6

98.94 %

18

169.3

99.35 %

19

170.1

99.82 %

20

170.4

100.00 %

                                     表 4 :

年龄

及格

优秀

12

146.6

155.9

13

153.2

163.0

14

159.8

170.0

15

165.3

175.9

16

168.6

179.3

17

170.2

181.1

18

170.9

181.8

19

171.7

182.7

20

172.0

183.0

    在运用定基比法制订标准时,我们遇到一个特例。选材中一项形态派生指标:“指距-身高”在 10岁前为负值,如果仍按体育统计中定基比的计算方法,则10岁前的定基比为负值,显然不对。解决的办法是先给各年龄组的平均数X 加一个常数C,把负值变换为正值后,再计算定基比。而用定基比计算各年龄组标准时要改用下列公式:

    年龄组标准=(X+C)×定基比-C  [6]

2.2    离差法制订各年龄组标准后,必须作平滑处理

    体质评定的指标和没有定基比数据的选材指标,可采用离差法制订标准。为此需要先测试一批各年龄组该指标的 X、S。但是,即使测试的样本量较大,也必然会由于抽样误差而使测得的 X、S,存在年龄组间的起伏波动。如果直接用这些 X、S按离差法制订标准,相邻年龄组间很可能会出现许多不合理的地方。如某小年龄组的标准反而比大年龄组的高。因而,必须用曲线拟合法对测得的 X、S先作平滑处理后再按离差法制订出的标准才能使用。

    如:1991年在制订 7~17岁心功能指数标准时,虽然各年龄组测试的样本量均较大,但是计算出的 X、S各年龄组之间仍然存在着随机波动,7~17岁的 X 总的趋势是随年龄的增长而减小,但波动较大,S也存在着随机波动。因而我们先进行了平滑处理,对各年龄组的 X、S分别用直线、对数曲线、指数曲线、双曲线和抛物线进行拟合,计算结果表明抛物线的拟合优度最好,最后,就根据用抛物线方程计算出的值再按离差法制订各年龄组的标准,使用效果较好。[6] 

2.3   百分位数法制订各年龄组标准

    从1979年的“中国青少儿体质调查”到1995年的“中国学生体质与健康调研”每次都统计公布各单项指标各年龄、性别组的百分位数(P3、P5、P10、P15、P25、P30、P50、P70、P75、P85、P90、P95、P97)。各指标的百分位数可以是制订单项标准的依据。如某省制订成年人区域性评价标准时,就是用男女各年龄段第90、75、25、10百分位数来制订各指标的五个评分等级的标准。
    但
是,用百分位数来制订各年龄组的单项标准时,从理论上说,也仍然会由于抽样误差而使计算出的标准在年龄组间有起伏波动。因此,需要作动态分析。如果发现计算出的标准在各年龄组间有不合理的起伏波动,还是应该作平滑处理。

2.4   最低等级标准的两种订法

    最低的一等标准可以有两种订法。下面以分三个等级的身高标准为例(见表5),由表5可见,方法1规定了达到一等的下限,凡是达不到下限160的,就得不到分。而方法2则是凡达不到二等的都是一等,即至少可获得2分。这就要根据标准制订者对某项指标的要求来决定用那种方法了。方法1 的要求较严,达不到最低要求就没有分,而方法2 则相对松一些,常在形态指标中用此方法。

            表5:  两种不同的一等标准

方法

一等

二等

三等

标准   得分

标准   得分

标准   得分

1

≥160    2

≥165    4

≥170    7

2

<165    2

≥165    4

≥170    7

3. 确定各指标的权重系数和综合评价方法

    早期制订的体质评价标准、运动员选材评价标准,都是没有权重系数的。但是,为了使得综合评价的结论能比较准确、合理,除了首先要选好评价指标外,十分关键的问题就是要尽可能准确地订出各指标的权重系数,即对综合评价作用较大的指标应该占较大的比重,而作用相对小一点的指标权重系数就应该小一点。

    确定综合评价的权重系数,通常采用两种方法:

3.1  特尔斐法(专家调查法)

    与确定指标时的作法相同,可以请专家对每一个评价指标提出应占的百分比。但是,当指标较多时,有时专家自己也可能对填写的权重觉得不易填准确。这时用填写指标序号的方法就比较好。即专家只要按指标的重要程度排序,不必填写具体的百分比,将所有专家们反馈的意见计算后即可得到权重[10]。1999年我们在作成年人体质评价的权研究时,对16位专家咨询时,同时用了填写百分比和指标序号两种方法,分别计算出的权重十分接近。

3.2  数据统计法

    数理统计中的几种多因素分析方法都可以计算出权重系数。

(1) R型因子分析法的初始因子可以作为权重系数。

    R型因子分析是数理统计中一种研究各指标之间相互关系的多因素分析方法。首先将测试获得的一批数据在微机上计算出各指标两两间的相关系数矩阵,再通过矩阵变换算出特征值λ,根据λ的大小可由计算者选出几个主成分,微机再进而计算出初始因子矩阵。由于初始因子矩阵中的因子载荷aij 是第i个指标和第j个主成分的相关系数,因而可以根据各指标的因子载荷大小来确定各个指标的相对重要程度,从而计算出各指标的权重系数。

    1985年《中国学生体质综合评价方法研究》的体质综合评价用了6个指标,X1体重×1000/身高,X2 肺活量/体重,X3 50米跑,X4 立定跳远,X5 引体向上,X6 耐力跑。在R型因子分析计算中选2个主成分后,算出初始因子矩阵如表6。

                表6:         初始因子矩阵表

 

A1

A2

X1  体重×1000/身高

-0.167051

 0.819225

X2  肺活量/体重

-0.129203

-0.777041

X3  50米跑

 0.847815

-0.076887

X4  立定跳远

-0.847831

 0.119528

X5  引体向上

-0.635615

-0.292085

X6  耐力跑

 0.821302

 0.021098

    初始因子aij 反映了各指标与主成分的相关程度(相关程度的大小看绝对值)。把第一主成分(A1)上的6个初始因子绝对值相加得3.448817,把第二主成分(A2)上的6个初始因子绝对值相加得2.105864,X1 在第一主成分上的权重系数为0.167051/3.448817,在第二主成分上的权重系数为0.819225/2.105864。
    因而,第i个指标的权重系数Ti 可定义为:

    同理,T2=0.406,T3=0.282 T4=0.303,T5=0.323,T6=0.248。把Ti 规一化成百分数,可得,T1=21.86%,T2=20.31%,T3=14.11%,T4=15.16%,T5 16.16%,T6=12.40%。这就是6个指标的权重系数。

    只要计算时所用的数据准确、可靠,样本量不是太小,用因子分析法计算出的权重系数就会和经验相一致。这种计算权重的方法在选材研究中也用得较理想。

    但是,在计算时如何确定主成分的个数是很重要的问题。应该分别作几次计算,每次所取主成分个数不同。然后对计算结果进行比较,以按专业知识解释较为理想的一个计算结果为准。如在用因子分析法计算乒乓球选材指标的权重系数时,就分别按选4、5、6个主成分计算了三次,通过比较分析认为取6个主成分时各指标之间的内在关系才能较好地分清,就以取 6个主成分计算的结果确定权重系数。后来,又请了十几位有经验的专家来座谈,经过认真地讨论后大家认为,计算出的权重系数和专家的经验基本上是一致的。[7]

(2) 回归分析法计算出的回归系数也可以作为权重系数。

    逐步回归分析法不仅可以用于筛选指标,而且回归方程的系数就是各指标的权重系数。如四川省1992年制订的田径、游泳等项目的中级选材标准都是采用逐步回归分析法,从几十个指标中筛选出十几项指标,作为选材综合评价指标。逐步回归方程的回归系数,就是各指标的权重系数[8]。

    但是,用回归分析法计算时要注意,样本量 n 太小,计算的结果就不能用。

    另外,逐步回归分析法选出的指标数,计算时不易控制,如果某类指标选入较多,就会使该类的权重加大,因而,不宜把指标筛选和确定权重系数仅由一次逐步回归计算确定,可以先筛选指标,再用多元回归计算权重系数。

    还要注意的是,由于回归方程中各指标的测量单位不同,不宜于直接把计算出的回归系数作为权重系数,而应该用标准回归系数。

(3) 用判别分析法计算出的判别系数也可以作为权重系数。但是,判别系数计算前要求有已进行了分类的两个(或几个)样本,这是比较不易得到的,所以,在进行判别系数计算前,应先作Q型聚类[11]。

3.3  确定评分方法

    各个指标的不同等级定为几分?综合评价的满分定为几分? 并无统一的规定。1990年制订全国统一的九个项目选材标准和1992年制订八个项目选材标准时,为了使用时的方便,都是采用百分制,即全部指标都达到第五等为 100分。这样制订各等级的给分标准时就比较简便。各指标的第五等得分就是它的权重系数,其他等级的得分:一等为权重系数的50%,二等为权重系数的60%,三等为权重系数的70%,四等为权重系数的80%。如:某指标的权重系数为8%,则一至五等的得分分别为:4、4.8、5.6、6.4、8(以上各等级的%是选材标准制定者研究确定的,不同的综合评价所用的%可以由研究者自行规定)。
   
各单项指标得分之和即为综合评价的总分。再按总分划出总评的等级,如60分以下为差,60-60.9分为及格,70-70.9分为良好,80分以上为优秀。

    1998年深圳市修改成年体质综合评价标准时,在确定综合评价的等级时,先把一万多人的数据按加权后的得分计算出总分,然后,用总分的平均数和标准差按正态分布原理计算出优秀、良好、合格的分数线。这样就比单纯按理论计算划线更好。

4. 标准(初稿)的试用和修改

    制订出标准(初稿)后,还必须进行小范围试用,然后根据小范围试用数据的统计分析结果和试用单位反馈的意见,再作必要的修改后定稿。

4.1  对每个指标均按标准(初稿)评定后达到的等级做出频数分布表,再根据正态分布原理分析各等级标准是否需要作修改。表7是一例标准(初稿)试用时,某年龄组立定跳远的频数分布表。由表可见,按标准(初稿)评定后,有26人连一等都未达到,四、五等均为 0人,整个频数分布比较偏,说明标准可能偏高。后来,经分析等外的26人中有少数人确实较差,而第五等是按优秀运动员模式订的,不宜轻意更改,最后对一至四等标准作了几次修改,直至从频数分布表看认为较合理后才定稿。

               表 7:       立定跳远频数分布表     ( n=54 )  

 

等外

一等

二等

三等

四等

五等

修改前

26

12

10

6

0

0

修改后

 9

17

18

8

2

0

4.2   在小范围试用时,将测试数据按标准(初稿)综合评定后,把结果反馈给试用单位,请他们对各指标的评定等级及综合评定结果与自己平时的观察作比较,提出意见,这些意见对修改标准(初稿)中的个别不合理处会有一定的参考作用。

主要参考文献:

1. 国家体委科教司:优秀青少年运动员科学选材研究论文汇编,1983

2. 陈明达等:中国青少年儿童身体形态、机能和素质的研究,中国科技文献出版社,1982

3. 王路德:体育统计方法及程序,人民体育出版社,1990

4. 曾繁辉、王路德、邢文华等:运动员科学选材,人民体育出版社,1992

5. 钟添发、田麦久、王路德等:运动员竞技能力模型与选材标准,人民体育出版社,1994

6. 王路德:定基比和曲线回归在制订选材标准中的运用,湖北体育科技,1991年第4期

7. 王路德:用R型因子分析法计算综合评价的权重,湖北体育科技,1992年第1期

8. 叶国治等:运动员科学选材指南,成都科技大学出版社,1992

9. 王路德:体育科研中运用多元回归分析时应注意的两个问题,体育科学,1989年第1期

10.王路德:指标序号法――计算权重的一种简便方法    《湖北体育科技》1993年第4期

11. 王路德等:运用数理统计方法制定“体质综合评价表”的研究                              《全国体质研究论文选集》1984年3月

12. 王路德:成年体质综合评价指标“权”的研究。 《第六届全国体育科学大会论文汇编》2000年12月

 

相关内容
查无记录

网址:www.wldgzs.com

粤ICP备10005906号

网站管理