当前位置:HOME > 论文与讲稿
体育统计在体育科研中的应用

发布时间 2010-10-29

体育统计在体育科研中的应用

20106月在上海体科所讲稿提纲)

 

体育科研要通过处理各种各样的数据才能完成研究工作。例如:下队服务要测试各种数据来分析运动员的机能水平、素质情况,协助教练员进行科学训练。运动员选材要用测试数据来判断运动员是否有发展前途,研究制定选材标准是关键。国民体质研究是通过分析测试数据来了解国民的体质状况。所以,一定意义上说,科研人员数据处理的能力如何?就决定了研究的水平。

体育统计是处理数据的方法,应该是每个体育科研人员都应该掌握的基本工具。但是,目前体育院系的体育统计课并不能满足实际的需要(讲得比较浅、与实际结合得不够,有的学生还不重视),所以,我看到不少研究所都存在的问题是,由于体育统计水平的限制,影响了研究水平。

有的人认为现在有了SPSS软件,就可以解决问题了。但是,他们没有认真的学好体育统计方法,还是用不好软件。SPSS是一个不错的软件。但是,工具是要靠人来运用的,就像电脑是个好工具,但是,每个人对电脑懂得的程度不同,操作时熟练程度不同,电脑对每个人发挥的作用也就不同了。

我自己的体会,要学好统计,第一是要多做计算,(熟能生巧,积累经验,摸索到书本上没有的东西),第二是要把关键的部分学好。

今天着重讲三个问题1)回归分析(2)因子分析(3)追踪观察

 

一、           回归分析

回归分析是统计的十分重要的内容,学好了,对研究工作十分有用。70年代我就是通过自学“回归分析方法”一书,慢慢入门的。

研究工作中,大量的内容是要分析事物的相互关系。例如,短跑选材要研究100跑的成绩和哪些因素有关?人们凭经验就可以说出许多,身高,步幅大,下肢爆发力好,反应快等等。但是,其中哪些因素是主要的? 那个并不重要?各人说法不一。就可以通过统计一批数据,用回归分析的方法来进行研究。

各个因素(我们通常说“指标”)之间,相关不相关?相关程度如何?是用相关系数 r 来描述的。相关的指标之间存在怎样的关系?要用回归方程来表达。

为了研究两个指标XY之间的关系,首先要测一批原始数据,在 Excel中利用图表向导作出散点图,就可以清楚的看出散点的分布趋势。

具有相关关系的两个指标之间的关系可以用一条直线来表示。用哪一条直线来代表XY之间的关系呢?可以根据最小二乘法原理计算出一条线,使这条线到所有散点的距离平方和为最小,这条线就叫做 Y X 的回归直线。

          它的方程: 

Ya+bX     称为一元回归方程

任何一组数据都可以计算出,相关系数r 和回归方程。但是,究竟能不能用?有没有使用价值?需要做统计检验。剩余标准差Sy是一个重要参数。

有许多研究论文只计算相关系数和回归方程,不计算 Sy 值,就用回归方程进行推测,这是不对的。

      用一元回归方程进行推测时,还必须注意回归方程的适用范围。

    一般说,仅限于原来抽样的范围内,不能随意的外推使用。

更重要的是:要看样本的可靠性(样本量大小、回归趋势是否正确)。

 

一元回归是研究 XY两个变量之间的关系,如:

     Y100)=20.170.03 X(立定跳远)

        但是,实际问题中影响变量 Y的因素往往不是一个而是许多个,即Y 同时受到多个因素 X1X2…… 的影响,所以,在体育领域的科学研究中只用一元回归是不够的,需要广泛采用多元回归分析。因此,我认为科研人员一定要学好多元回归分析。

多元回归分析主要可用于解决下列问题:

1.      确定几个变量之间是否存在相关关系。如果存在,则找出它们之间合适的数学表达式──回归方程。

2. 根据回归方程用一个或几个自变量的值预测或控制另一个因变量的取值。

3. 多元回归的一个重要作用是可以进行因素分析。当许多个指标(因素)都对某一个指标有影响时,可以通过回归分析找出其中哪几个是重要因素,哪几个是次要因素。

计算出标准回归系数bi’或偏回归平方和Pi就可以进行因素分析。

如:已知步长、步频、30起跑、立定跳远四个指标都对100跑的成绩有影响,希望能分析出其中哪一个是主要的因素,哪一个是次要的因素。

        这时可以建立一个多元回归方程,然后,比较各指标的标准回归系数或偏回归平方和的大小来分析哪一个指标对Y 的影响更大。

多元回归方程计算时,一定要注意 k (指标数)与 n(样本量)的比例适当,一般认为 n 至少应是 k 510倍。

         还要注意:由于自变量之间可能存在相关关系(多重共线性)会造成分析指标主次关系时的差错。所以,虽然在多元回归中Pi(或bi’)最大或最小的因素就是对 Y 影响最大或最小的指标,但是,不宜于把多元回归中所有的指标按其偏回归平方和(或标准回归系数)绝对值的大小逐个排队以确定其主次关系。    

在多元回归方程中,多选几个指标 Xi,回归平方和U就会增大,  剩余平方和Q会小些,  从而可以提高方程的精度。但是,方程中指标选得太多,使用时测试、计算都不方便。尤其是如果在方程中有几个指标对Y的影响并不大,则反而会影响回归方程的稳定性。

逐步回归分析是在计算过程中按各指标偏回归平方和 Pi 的大小,从大到小逐个引入回归方程,使得最后建立的回归方程中,都是对 Y  影响较大的指标,称为“最优”回归方程。

         因此,逐步回归分析常用于做指标的筛选。也是研究工作中经常用的方法。

 

二、           因子分析

主成分分析和因子分析是把相互有着错综复杂关系的变量(指标),通过计算后,找出其中控制着所有变量的几个主要因素的一种统计方法。R 型因子分析也称主成分分析。

在进行计算时,选几个主成分的原则是:

1)把特征值λi1 的个数,  定为应选的主成分个数,

2 预先定出累计贡献率的值,  : 75, 85%等, 当选几个主成分后可以达到规定的值,  就选几个主成分。

但是,要特别注意以下几点:

1.  究竟选几个主成分?不能单纯根据上述两个原则确定。最好反复作几次计算,每次选的主成分个数不同,以计算出的每个主成分,用专业知识能较好地解释和命名时的个数为准。

2.  选取几个主成分的含意不是筛选几个指标! 如:根据特征值选了 4 个主成分,并不是因为指标 X1X2X3X4的贡献率大,所以选这 4个指标,而是说λ1,λ2,λ3,λ4 4个主成分已经能反映了原来所有指标的绝大部分信息。这是初学者最容易弄错的一个概念。分析时请特别注意。

3.  计算时,样本含量不能太小。因为在计算过程中,首先要计算各指标的相关系数矩阵,以后的计算是在相关系数

 

相关内容
  • 体育科研数据统计处理系统 2011-05-17
  • 新书:《体育统计方法与应用》介绍 2011-04-30
  • 学生身体素质下降原因调查指标的因子分析 2010-07-31
  • 体育统计在体育科研中的应用 2010-10-29
  • 回归分析方法在制定选材标准中的应用实例之二 2010-08-17
  • 回归分析方法在制定选材标准中的应用实例之一 2010-08-17
  • 体质测试数据横向调查与纵向追踪的比较研究 2010-08-17
  • 在2005年全国体育统计报告会上的专题报告 2010-05-20
  • 定基比和曲线回归在制订选材标准中的运用 2010-06-12

  • 网址:www.wldgzs.com

    粤ICP备10005906号

    网站管理