㈠ t分布曲线和正太分布,和z分布,和卡方分布,和方差分析的f分布曲线有什么区别
一、定义不同
(1)t分布
在概率论和统计学中,t-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。如果总体方差已知(例如在样本数量足够多时),则应该用正态分布来估计总体均值。
(2)正态分布
若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。
(3)z分布
全称费歇耳(Fisher)Z分布,亦称费歇耳方差比分布
(4)卡方分布
若n个相互独立的随机变量ξ₁,ξ₂,...,ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)
(5)F分布
1924年英国统计学家R.A.Fisher提出,并以其姓氏的第一个字母命名的。它是一种非对称分布,有两个自由度,且位置不可互换。
二、特征不同
(1)以0为中心,左右对称的单峰分布;t分布是一簇曲线,其形态变化与n(确切地说与自由度df)大小有关。自由度df越小,t分布曲线越低平;自由度df越大,t分布曲线越接近标准正态分布(u分布)曲线
(2)正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。
(3)分布在第一象限内,卡方值都是正值,呈正偏态(右偏态),随着参数 的增大, 分布趋近于正态分布;卡方分布密度曲线下的面积都是1。
(4)分布的均值与方差可以看出,随着自由度 的增大,χ2分布向正无穷方向延伸(因为均值 越来越大),分布曲线也越来越低阔(因为方差 越来越大)。
(5)不同的自由度决定不同的卡方分布,自由度越小,分布越偏斜。
三、用途不同
(1)学生t-分布可简称为t分布。其推导由威廉·戈塞于1908年首先发表,当时他还在都柏林的健力士酿酒厂工作。之后t检验以及相关理论经由罗纳德·费雪的工作发扬光大,而正是他将此分布称为学生分布。
(2) 分布在数理统计中具有重要意义。 分布是由阿贝(Abbe)于1863年首先提出的,后来由海尔墨特(Hermert)和现代统计学的奠基人之一的卡·皮尔逊(C K.Pearson)分别于1875年和1900年推导出来,是统计学中的一个非常有用的著名分布。
(3)正态分布概念是由德国的数学家和天文学家Moivre于1733年首次提出的,但由于德国数学家Gauss率先将其应用于天文学研究,故正态分布又叫高斯分布。
(4)高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。
(5)F分布有着广泛的应用,如在方差分析、回归方程的显著性检验中都有着重要的地位。
(1)股票分析卡方分布扩展阅读:
t分布数据:
1、首先要提一句u分布,正态分布(normal distribution)是许多统计方法的理论基础。正态分布的两个参数μ和σ决定了正态分布的位置和形态。
2、为了应用方便,常将一般的正态变量X通过u变换[(X-μ)/σ]转化成标准正态变量u,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布(standard normaldistribution),亦称u分布。
3、根据中心极限定理,通过抽样模拟试验表明,在正态分布总体中以固定 n 抽取若干个样本时,样本均数的分布仍服从正态分布,即N(μ,σ)。所以,对样本均数的分布进行u变换,也可变换为标准正态分布N (0,1)。
4、由于在实际工作中,往往σ(总体方差)是未知的,常用s(样本方差)作为σ的估计值,为了与u变换区别,称为t变换,统计量t 值的分布称为t分布。假设X服从标准正态分布N(0,1),Y服从(n)分布,那么Z=X/sqrt(Y/n)的分布称为自由度为n的t分布,记为 Z~t(n)。
㈡ 卡方分布,F分布,t分布的关系
这是三大抽样分布,其实他们都是基于正态分布建立起来的。只要你查看一般的数理统计书籍,就很容易找到的。
1。设X1服从以自由度为m的卡方分布,X2服从以自由度为n的卡方分布,X1与X2独立,则F=(X1/m)/(X2/n)的分布就是自由度为m与n的F分布
2。设随机变量X1,X2独立且X1服从标准正态分布,X2服从以自由度为n的卡方分布,则t=X1/根号(X2/n)的分布就是自由度为n的t分布
㈢ 卡方分布概率计算…x∧2(30)<34.8 这种的要怎么计算查表查不到…
!用U表示标准正态分布,临界值Zα满足P(U>Zα)=Zα,即P(U≤Zα)=1-α。当α=0.025时,就是查表中0.975对应的值,0.975在表中1.9那一行,0.06那一列,所以Z0.025=1.96。经济数学团队帮你解答,请。!
㈣ 卡方分布、t分布和f分布各有哪些重要性质
自由度为n-1的t分布 的平方等于自由度(1,n-1)F分布。
自由度为m-1的卡方/n-m-1的卡方分布为(m-1,n-m-1)F分布。
实际上t分布就是 自由度 1的卡方/自由度为n-1的卡方分布。
恩就是这样了,想象t检验的平方不就是( x平均-总体平均u)^2/标准误^2。
标准误^2服从自由度n-1卡方分布。
(x平均-总体平均u)服从自由度(2-1)=1的卡方分布,so (n-1)自由度t^2=F自由度(1,n-1)。
n足够大 t分布近似u分布,及正态分布。
2组样本下n不够大t分布为自由度(1,n-1)F分布。
卡方分布就是标准误^2分布。
多样本下分布自由度(m-1,n-1)F分布就是方差分析。
还可以得出一元线性回归的t检验 的平方为F检验,并与F的方差分析等价。
多元线性回归就是多因素方差分析等价。
n足够大是z或者u检验,或,t检验自由度n-1足够大t=u是一样的为正态分布、,n不够大就服从t检验,卡方检验是对标准误的平方检验,信息量小于t检验;
所以精确性小于t检验,这就是为什么计数资料结果是率0-1之间并且方差大,用t检验或u检验需要样本大,所以用卡方检验只看方差时就可以检验,但是卡方检验的精确性差了,加强精确性可以用logistic回归。
(4)股票分析卡方分布扩展阅读:
表中所给值直接只能查单侧概率值,可以变化一下来查双侧概率值。例如,要在自由度为7的卡方分布中,得到双侧概率为0.05所对应的上下端点可以这样来考虑:双侧概率指的是在上端和下端各划出概率相等的一部分,两概率之和为给定的概率值,这里是0.05,因此实际上上端点以上的概率为0.05/2=0.025,用概率0.025查表得上端点的值为16,记为0.05/2(7)=16。下端点以下的概率也为0.025,因此可以用0.975查得下端点为1.69,记为1-0.05/2(7)=1.69。
则先在第一列找到自由度 18,然后看这一行可以发现与 30 接近的有28.9与31.5,它们所在的列是0.05与0.025,所以要查的概率值应于介于0.05与0.025之间,当然这是单侧概率值,它们的双侧概率值界于0.1与0.05之间。如果要更精确一些可以采用插值的方法得到,这在正态分布的查表中有介绍。
㈤ 卡方分布和t分布
图
㈥ 卡方分布的介绍
若n个相互独立的随机变量ξ₁、ξ₂、……、ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。
㈦ 什么情况下用卡方分布,正态分布,F分布,T分布
卡方分布主要是主要是列联分析,F分布主要是方差分析,T分布主要是小样本分析。
㈧ 卡方分布的解释
可以看成是一个随机变量的概率分布,卡方分布是连续分布,是由服从正态分布的随机变量的平方,求和构成,随机变量ξi服从正态分布,是连续分布,因此,卡方分布也是连续分布,若n个相互独立的随机变量ξ1,ξ2,…,ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和∑ξ2i构成一新的随机变量,其分布规律称为χ2(n)分布,其中参数 n 称为自由度,自由度不同就是另一个χ2分布,正如正态分布中均值或方差不同就是另一个正态分布一样。χ2分布的密度函数比较复杂这里就不给出了,同学们也不用去记了。卡方分布是由正态分布构造而成的一个新的分布,这也正反映了前面所说的正态分布的重要性。
对于任意正整数 k, 自由度为 k 的卡方分布是一个随机变量X的机率分布
在这个式子中,Z1, ..., Zk 是相互独立的常态变量,且每一个变量的数学平均值都为0,方差为1。也就是说X是标准常态变量的平方和。这种分布一般被记做
χ2分布在一象限内,呈正偏态,随着参数 n 的增大,χ2分布趋近于正态分布。
χ2分布的均值为自由度 n,记为 Eχ2=n,这里符号“E”表示对随机变量求均值;χ2分布的方差为2倍的自由度(2n),记为 Dχ2=2n,这里符号“D”表示对随机变量求方差。从χ2分布的均值与方差可以看出,随着自由度n的增大,χ2分布向正无穷方向延伸(因为均值n越来越大),分布曲线也越来越低阔(因为方差2n越来越大)。
χ2分布具有可加性:若有K个服从χ2分布且相互独立的随机变量,则它们之和仍是χ2分布,新的χ2分布的自由度为原来K个χ2分布自由度之和。表示为:
χ2分布是连续分布,但有些离散分布也服从χ2分布,尤其在次数统计上非常广泛。
χ2分布概率表
χ2分布不象正态分布那样将所有正态分布的查表都转化为标准正态分布去查,在χ2分布中得对每个分布编制相应的概率值,这通过χ2分布表中列出不同的自由度来表示,在χ2分布表中还需要如标准正态分布表中给出不同 P 值一样,列出概率值,只不过这里的概率值是χ2值以上χ2分布曲线以下的概率。由于χ2分布概率表中要列出很多χ2分布的概率值,所以χ2分布中所给出的 P 值就不象标准正态分布中那样给出了400个不同的 P 值,而只给出了有代表性的13个值,因此χ2分布概率表的精度就更差,不过给出了常用的几个值,足够在实际中使用了。
查χ2分布概率表时,按自由度及相应的概率去找到对应的χ2值。如上图所示的单侧概率χ20.05(7)=14.1的查表方法就是,在第一列找到自由度7这一行,在第一行中找到概率0.05这一列,行列的交叉处即是14.1。
表中所给值直接只能查单侧概率值,可以变化一下来查双侧概率值。例如,要在自由度为章 7 的卡方分布中,得到双侧概率为0.05所对应的上下端点可以这样来考虑:双侧概率指的是在上端和下端各划出概率相等的一部分,两概率之和为给定的概率值,这里是0.05,因此实际上上端点以上的概率为0.05/2=0.025,用概率0.025查表得上端点的值为16,记为χ20.05/2(7)=16。下端点以下的概率也为0.025,因此可以用0.975查得下端点为1.69,记为χ21-0.05/2(7)=1.69。
当然也可以按自由度及χ2值去查对应的概率值,不过这进往往只能得到一个大概的结果,因为χ2分布概率表的精度有限,只给了 13 个不同的概率值进行查表。例如,要在自由度为 18 的χ2分布查找 χ2=30 对应的概率,则先在第一列找到自由度 18,然后看这一行可以发现与 30 接近的有28.9与31.5,它们所在的列是0.05与0.025,所以要查的概率值应于介于0.05与0.025之间,当然这是单侧概率值,它们的双侧概率值界于0.1与0.05之间。如果要更精确一些可以采用插值的方法得到,这在正态分布的查表中有介绍。
为什么从正态总体中抽取出的样本的方差服从χ2分布
在抽样分布理论一节里讲到,从正态总体进行一次抽样就相当于独立同分布的 n 个正态随机变量ξ1,ξ2,…,ξn的一次取值,将 n 个随机变量针对总体均值与方差进行标准化得(i=1,…,n),显然每个都是服从标准正态分布的,因此按照χ2分布的定义,应该服从参数为 n 的χ2分布。
如果将中的总体均值 μ 用样本平均数 ξ 代替,即得,它是否也服从χ2分布呢?理论上可以证明,它是服从χ2分布的,但是参数不是 n 而是 n-1 了,究其原因在于它是 n-1 个独立同分布于标准正态分布的随机变量的平方和
我们常常把一个式子中独立变量的个数称为这个式子的“自由度”,确定一个式子自由度的方法是:若式子包含有 n 个独立的随机变量,和由它们所构成的 k 个样本统计量,则这个表达式的自由度为 n-k。比如中包含ξ1,ξ2,…,ξn这 n 个独立的随机变量,同时还有它们的平均数 ξ 这一统计量,因此自由度为 n-1。
㈨ 卡方分布到底是什么
若n个相互独立的随机变量ξ1,ξ2,…,ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和∑ξi∧2构成一新的随机变量,其分布规律称为χ2(n)分布(chi-square distribution),其中参数 n 称为自由度,自由度不同就是另一个χ2分布,正如正态分布中均值或方差不同就是另一个正态分布一样。χ2分布的密度函数比较复杂这里就不给出了,同学们也不用去记了。卡方分布是由正态分布构造而成的一个新的分布,这也正反映了前面所说的正态分布的重要性。