当前位置:首页 » 行情解析 » 贝叶斯分析举例股票
扩展阅读
美敦力中国利好股票 2025-09-01 03:31:53

贝叶斯分析举例股票

发布时间: 2021-09-02 00:16:48

『壹』 什么是贝叶斯分析法金融方面的

贝叶斯分析方法(Bayesian Analysis)提供了一种计算假设概率的方法,这种方法是基于假设的先验概率、给定假设下观察到不同数据的概率以及观察到的数据本身而得出的。其方法为,将关于未知参数的先验信息与样本信息综合,再根据贝叶斯公式,得出后验信息,然后根据后验信息去推断未知参数的方法。

『贰』 贝叶斯分析方法的介绍

贝叶斯分析方法(Bayesian Analysis)提供了一种计算假设概率的方法,这种方法是基于假设的先验概率、给定假设下观察到不同数据的概率以及观察到的数据本身而得出的。其方法为,将关于未知参数的先验信息与样本信息综合,再根据贝叶斯公式,得出后验信息,然后根据后验信息去推断未知参数的方法。

『叁』 贝叶斯法则的举例分析

全垄断市场,只有一家企业A提供产品和服务。企业B考虑是否进入。当然,A企业不会坐视B进入而无动于衷。B企业也清楚地知道,是否能够进入,完全取决于A企业为阻止其进入而所花费的成本大小。
挑战者B不知道原垄断者A是属于高阻挠成本类型还是低阻挠成本类型,但B知道,如果A属于高阻挠成本类型,B进入市场时A进行阻挠的概率是20%(此时A为了保持垄断带来的高利润,不计成本地拼命阻挠);如果A属于低阻挠成本类型,B进入市场时A进行阻挠的概率是100%。
博弈开始时,B认为A属于高阻挠成本企业的概率为70%,因此,B估计自己在进入市场时,受到A阻挠的概率为:
0.7×0.2+0.3×1=0.44
0.44是在B给定A所属类型的先验概率下,A可能采取阻挠行为的概率。
当B进入市场时,A确实进行阻挠。使用贝叶斯法则,根据阻挠这一可以观察到的行为,B认为A属于高阻挠成本企业的概率变成A属于高成本企业的概率=0.7(A属于高成本企业的先验概率)×0.2(高成本企业对新进入市场的企业进行阻挠的概率)÷0.44=0.32
根据这一新的概率,B估计自己在进入市场时,受到A阻挠的概率为:
0.32×0.2+0.68×1=0.744
如果B再一次进入市场时,A又进行了阻挠。使用贝叶斯法则,根据再次阻挠这一可观察到的行为,B认为A属于高阻挠成本企业的概率变成
A属于高成本企业的概率=0.32(A属于高成本企业的先验概率)×0.2(高成本企业对新进入市场的企业进行阻挠的概率)÷0.744=0.086
这样,根据A一次又一次的阻挠行为,B对A所属类型的判断逐步发生变化,越来越倾向于将A判断为低阻挠成本企业了。
以上例子表明,在不完全信息动态博弈中,参与人所采取的行为具有传递信息的作用。尽管A企业有可能是高成本企业,但A企业连续进行的市场进入阻挠,给B企业以A企业是低阻挠成本企业的印象,从而使得B企业停止了进入地市场的行动。
应该指出的是,传递信息的行为是需要成本的。假如这种行为没有成本,谁都可以效仿,那么,这种行为就达不到传递信息的目的。只有在行为需要相当大的成本,因而别人不敢轻易效仿时,这种行为才能起到传递信息的作用。
传递信息所支付的成本是由信息的不完全性造成的。但不能因此就说不完全信息就一定是坏事。研究表明,在重复次数有限的囚徒困境博弈中,不完全信息可以导致博弈双方的合作。理由是:当信息不完全时,参与人为了获得合作带来的长期利益,不愿过早暴露自己的本性。这就是说,在一种长期的关系中,一个人干好事还是干坏事,常常不取决于他的本性是好是坏,而在很大程度上取决于其他人在多大程度上认为他是好人。如果其他人不知道自己的真实面目,一个坏人也会为了掩盖自己而在相当长的时期内做好事。 考虑一个医疗诊断问题,有两种可能的假设:(1)病人有癌症。(2)病人无癌症。样本数据来自某化验测试,它也有两种可能的结果:阳性和阴性。假设我们已经有先验知识:在所有人口中只有0.008的人患病。此外,化验测试对有病的患者有98%的可能返回阳性结果,对无病患者有97%的可能返回阴性结果。
上面的数据可以用以下概率式子表示:
P(cancer)=0.008,P(无cancer)=0.992
P(阳性|cancer)=0.98,P(阴性|cancer)=0.02
P(阳性|无cancer)=0.03,P(阴性|无cancer)=0.97
假设有一个新病人,化验测试返回阳性,是否将病人断定为有癌症呢?我们可以来计算极大后验假设:
P(阳性|cancer)p(cancer)=0.98*0.008 = 0.0078
P(阳性|无cancer)*p(无cancer)=0.03*0.992 = 0.0298
因此,应该判断为无癌症。

『肆』 贝叶斯预测的计算实例

根据The SAS System for Windows 9.0所编程序,对美国出口额 (单位:十亿元)变化进行了预测。选取常均值折扣模型和抛物线回归模型。

美国出口额的预测, 预测模型的初始信 息为m0=304,Co=72,V=0.Ol,δ=0.8得到的1960—2006年的预测结果。见表2中给出了预测的部分信息(1980—2006年的预测信息)。

通过The SAS System for Windows 9.0软件回归分析得到抛物线预测方程:
表示年份
见表3给出了1980-2006年的预测信息。

『伍』 贝叶斯定理是什么我知道公式是什么,能不能用例子给我讲清楚点

贝叶斯定理用于投资决策分析是在已知相关项目B的资料,而缺乏论证项目A的直接资料时,通过对B项目的有关状态及发生概率分析推导A项目的状态及发生概率.如果我们用数学语言描绘,即当已知事件Bi的概率P(Bi)和事件Bi已发生条件下事件A的概率P(A│Bi),则可运用贝叶斯定理计算出在事件A发生条件下事件Bi的概率P(Bi│A).按贝叶斯定理进行投资决策的基本步骤是:1
列出在已知项目B条件下项目A的发生概率,即将P(A│B)转换为
P(B│A);
2
绘制树型图;
3
求各状态结点的期望收益值,并将结果填入树型图;
4
根据对树型图的分析,进行投资项目决策;
搜索巨人Google和Autonomy,一家出售信息恢复工具的公司,都使用了贝叶斯定理(Bayesian
principles)为数据搜索提供近似的(但是技术上不确切)结果.研究人员还使用贝叶斯模型来判断症状和疾病之间的相互关系,创建个人机器人,开发能够根据数据和经验来决定行动的人工智能设备.

『陆』 贝叶斯的理论分析

(1)如果我们已知被分类类别概率分布的形式和已经标记类别的训练样本集合,那我们就需要从训练样本集合中来估计概率分布的参数。在现实世界中有时会出现这种情况。(如已知为正态分布了,根据标记好类别的样本来估计参数,常见的是极大似然率和贝叶斯参数估计方法)
(2)如果我们不知道任何有关被分类类别概率分布的知识,已知已经标记类别的训练样本集合和判别式函数的形式,那我们就需要从训练样本集合中来估计判别式函数的参数。在现实世界中有时会出现这种情况。(如已知判别式函数为线性或二次的,那么就要根据训练样本来估计判别式的参数,常见的是线性判别式和神经网络)
(3)如果我们既不知道任何有关被分类类别概率分布的知识,也不知道判别式函数的形式,只有已经标记类别的训练样本集合。那我们就需要从训练样本集合中来估计概率分布函数的参数。在现实世界中经常出现这种情况。(如首先要估计是什么分布,再估计参数。常见的是非参数估计)
(4)只有没有标记类别的训练样本集合。这是经常发生的情形。我们需要对训练样本集合进行聚类,从而估计它们概率分布的参数。(这是无监督的学习)
(5)如果我们已知被分类类别的概率分布,那么,我们不需要训练样本集合,利用贝叶斯决策理论就可以设计最优分类器。但是,在现实世界中从没有出现过这种情况。这里是贝叶斯决策理论常用的地方。 结论:对于任何给定问题,可以通过似然率测试决策规则得到最小的错误概率。此错误概率称为贝叶斯错误率,且是所有分类器中可以得到的最好结果。最小化错误概率的决策规则就是最大化后验概率判据。

『柒』 贝叶斯推理的案例

参加常规x光透视检查的40岁妇女中,患乳腺癌的概率是1%。如果一个妇女患了乳腺癌,她的胸透片呈阳性的概率是80%。如果一个妇女她没有患乳腺癌,她的胸透片呈阳性的概率是9.6%。现有一个该年龄段的妇女她的胸透片呈阳性,那么她实际患乳腺癌的概率有多少?如果把患乳腺癌和不患乳腺癌作为两个互斥事件H和一H,他们的概率分别为P(H)和P(一H);把胸透片呈阳性作为在H和一H中都能观察到某一共同特征D,它在两个事件中出现的概率分别为P(D/H)和P(D/-H);那么,当D出现时,根据以上概率信息就可以计算出事件H发生的概率P(H/D)。一般将P(H)和P(一H)称为基础概率(base rate),将P(D/H)称为击中率(hit rate),将P(D/-H)称为误报率(false-alarm rate),将P(H/D)称为后验概率,其计算方法为:
P(H/D)=P(H)P(D/H)/[(P(H)P(D/H)+P(D/-H)P(-H)]
这就是贝叶斯公式,利用贝叶斯公式进行推断的过程则称之为贝叶斯推理。根据公式,P(H/D)=(1%×80%)/(1%×80%+99%×9.6%)=0.078。也就是说,阳性的检查结果表明该妇女有7.8%的可能性患病。但是Eddy用该问题让内科医生判断,结果95%的答案介于70%~80%,远高于7.8%。尽管贝叶斯公式只是一些简单的乘法、加法以及除法过程的结合,一个并没有学过该公式的人也有可能在推断中不自觉的应用这种方法,但是在包括上述乳腺癌问题在内的许多研究均发现,人们常常会犯类似的推理错误,称之为基础概率忽略(base-rate neglect)现象.Kahneman等(1982)提出启发—偏差理论(heuristics and biases approach)来解释这一现象,并由此引发了关于贝叶斯推理问题的大量研究和争论国内外关于贝叶斯推理问题的研究方法主要是实验法,将不同类型贝叶斯问题呈现给被试并要求他们解答,采用一定的指标对被试的解题过程和结果进行评价,据此来考察贝叶斯推理的认知过程和影响因素。本文以贝叶斯推理的影响因素为线索回顾了以往的研究,并对其中的一些问题进行了初步的分析和探讨。 某地区居民的肝癌发病率为0.0004,现用甲胎蛋白法进行普查。医学研究表明,化验结果是存有错误的。已知患有肝癌的人其化验结果99%呈阳性(有病),而没患肝癌的人其化验结果99.9%呈阴性(无病)。试问:在化验结果呈阳性的人中可能有多少人患有肝癌?
如果我们用A表示样本的观察证据“化验结果呈阳性”,用H表示假说命题“被检查者患有肝癌”,那么由上面可知:
P(H)(即某地区居民的肝癌发病率)=0.0004
P(‘H)(即某地区居民没患肝癌的比率)=1-0.0004=0.9996
P(E/H)(即患有肝癌者其化验结果呈阳性的比率)=0.99
P(E/‘H)(即没患肝癌者其化验结果呈阳性的比率)=1-0.999=0.001
现在需要我们推断的是P(H/E),即在化验结果呈阳性的条件下,假说“被检查者患有肝癌”的比率。显然,根据重新解释过的贝叶斯定理,我们可以很容易地得出P(H/E)的值。
P(H/E)=0.0004×0.99/((0.0004×0.99)+(0.9996×0.001))=0.284
这表明,在化验结果呈阳性的人中,真患肝癌的人不到30%。这个结果可能会使人吃惊,但仔细分析一下就可以理解了。因为肝癌发病率很低,在10000个人中约有4人患肝癌,而9996个人不患肝癌。对10000个人用甲胎蛋白法进行检查,按其错检的概率可知,9996个不患肝癌者中约有9996×0.001≌9.994个呈阳性,另外4个真患肝癌者的检查报告中约有4×0.99≌3.96个呈阳性。仅从13.954(9.994+3.96)个呈阳性者中看,真患肝癌的3.96个人约占28.4%。
从上例可以看出,贝叶斯推理实际是借助于新的信息修正先验概率的推理方法。显然,这样的方法如果运用得当,可以使我们在依据概率作出决断时,不必一次收集一个长期过程的大量资料,而可以根据事物发展的情况,不断利用新的信息来修正前面的概率,作出正确决策。下面的例子很好地说明了这一点。 有甲、乙、丙三家工厂生产同一种零件,市场占有率分别为10%、25%和65%。已知甲、乙、丙三家工厂生产零件的不合格率分别是30%、20%和10%。现从市场上某批零件中随机抽取一件,经检验该零件不合格,则这个零件由甲厂、乙厂、丙厂生产的可能性各是多少?
在没有抽取零件之前,我们知道,来自甲厂的产品其可能性是10%,来自乙厂的可能性是25%,来自丙厂的可能性是65%,这些就是先验概率。相比来说,丙厂生产产品的概率最高。现在我们在市场上随机抽出的是不合格品,这是一个新的信息,可以利用这个信息修正先验概率。如果我们用E表示“抽出的零件是不合格品”,用H1、H2和H3分别表示假说命题“这个零件是由甲厂生产的”、“这个零件是由乙厂生产的”、“这个零件是由丙厂生产的”,那么由上面可知:
P(H1)=0.1 P(H2)=0.25 P(H3)=0.65
P(E/H1)=0.3 P(E/H2)=0.2 P(E/H3)=0.1
根据贝叶斯推理我们可以很容易地得出P(H /E)、P(H )和P(H/E)。其中
P(H1/E)=0.1×0.3/((0.1×0.3)+(0.25×0.2)+(0.65×0.1))=0.207
P(H2/E)=0.25×0.2/((0.1×0.3)+(0.25×0.2)+(0.65×0.1))=0.345
P(H3/E)=0.65×0.1/((0.1×0.3)+(0.25×0.2)+(0.65×0.1))=0.448
显然,根据上面的结果,我们判断该零件是丙厂生产的可能性已从65%下降到44.8%,而该零件是乙厂生产的可能性已从25%上升到34.5%,是甲厂生产的可能性也已从10%上升到20.7%。
在上面的例子中,如果随机抽取一件产品还不能提供充足的信息,可以再随机抽取一件产品以获取更多的信息。现在我们假定连续抽取两件产品都是不合格品,那么这批产品来自各厂的可能性又是多少呢?为了说明这个问题,首先要分别计算甲厂、乙厂、丙厂产品连续抽取两个都是不合格品的概率各是多少。这里假设产品是无限的,则有
P(E/H1)=0.3×0.3=0.09
P(E/H2)=0.2×0.2=0.04
P(E/H3)=0.1×0.1=0.01
然后仍然根据贝叶斯推理依次地得出P(H1/E)、P(H2/E)和P(H3/E)。其中
P(H1/E)=0.1×0.09/((0.1×0.09)+(0.25×0.04)+(0.65×0.01))=0.353
P(H2/E)=0.25×0.04/((0.1×0.09)+(0.25×0.04)+(0.65×0.01))=0.392
P(H3/E)=0.65×0.01/((0.1×0.09)+(0.25×0.04)+(0.65×0.01))=0.255
根据上面的结果,我们可看到,如果连续两次抽取的都是不合格品,则这批产品来自甲、乙、丙三厂的可能性为35.3%、39.2%和25.5%。这种情况下,这批产品来自乙厂的可能性变为最大。
我们还可以再进一步,假定从一批产品中随机抽取三件产品,抽样结果是:不合格、不合格、合格。此时甲厂、乙厂、丙厂产品抽取结果为不合格、不合格、合格的概率分别为(此时A表示“抽出的零件是不合格、不合格、合格”)
P(E/H1)=0.3×0.3×(1-0.3)=0.063
P(E/H2)=0.2×0.2×(1-0.2)=0.032
P(E/H3)=0.1×0.1×(1-0.1)=0.009
根据贝叶斯推理依次地可得出这批产品来自甲、乙、丙三厂的可能性分别为
P(H1/E)=0.1×0.063/((0.1×0.063)+(0.25×0.032)+(0.65×0.009))=0.313
P(H2/E)-0.25×0.032/((0.1×0.063)+(0.25×0.032)+(0.65×0.009))=0.397
P(H3/E)=0.65×0.009/((0.1×0.063)+(0.25×0.032)+(0.65×0.009))=0.290
显然,根据新的抽样信息,我们修正了先验概率,使来自甲、乙、丙三厂的概率分别修正为31.3% 39.7%和29.0%。
我们再来看一个用贝叶斯推理分析伊索寓言“孩子与狼”的例子。
伊索寓言“孩子与狼”讲的是一个小孩每天到山上放羊,山里有狼出没。第一天,他在山上喊:“狼来了!狼来了!”,山下的村民闻声便去打狼,可到山上发现狼没有来。第二天仍是如此。第三天狼真的来了,可无论小孩怎么喊叫,也没有人来救他,因为前二次他说了谎,人们不再相信他了。现在用贝叶斯推理来分析此寓言中村民对这个小孩的可信程度是如何下降的。
我们用E表示“小孩说谎 用H表示“小孩可信”。不妨设村民过去对这个小孩的印象为P(H)=0.8,则P('H)=0.2
我们现在用贝叶斯推理来推断P(H/E),也即这个小孩说了一次谎后,村民对他可信程度的改变。
在贝叶斯推断中我们要用到概率P(E/H)和P(E/'H),前者为可信的孩子说谎的可能性,后者为不可信的孩子说谎的可能性。在此不妨设P(E/H)=0.1,P(E/'H)=0.5
第一次村民上山打狼,发现狼没有来,即小孩说了谎。村民根据这个信息,对这个小孩的可信程度改变为P(H/E)=0.8×0.1/((0.8×0.1)+(0.2×0.5))=0.444这表明村民上了一次当后,对这个小孩的可信程度由原来的0.8下降到了0.444。
在此基础上,我们再一次用贝叶斯推理来推断P(H/E),也即这个小孩第二次说谎后,村民对他的可信程度改变为P(H/E)=0.444×0.1/((0.444×0.1)+(0.556×0.5))=0.138这表明村民们经过两次上当,对这个小孩的可信程度已经从0.8下降到了0.138,如此低的可信度,村民听到第三次呼叫时怎么再会上山打狼呢? 通过观察知道,牵牛花是在黎明4时左右开放,野蔷薇是在黎明5时左右开放, 龙葵花是在清晨6时左右开放,芍药花是在清晨7时左右开放。它们开放的时间虽然不同,但都有确定的开放时间,由此可见所有的花都有确定的开花时间。
显然,这是一个简单枚举归纳推理,相对于观察前提,结论“所有的花都有确定的开花时间”可靠吗?结论为真的可信程度有多大?是否可以用量来刻划?这些问题用贝叶斯推理的方法是可以解决的。
我们用E1、E2、E3、E4分别表示牵牛花有确定的开放时间、野蔷薇有确定的开放时间、龙葵花有确定的开放时间、芍药花有确定的开放时间,它们的合取用字母E来表示。结论“所有的花都有确定的开花时间”用H表示。这样,我们现在需要确定的就是P(H/E)。
根据贝叶斯推理的形式,我们有
(1)P(H/E)=P(H)×P(E/H)/(P(H)×P(E/H)+P('H)×P(E/'H))由于枚举归纳的前提可从结论中必然推出,即P(E/H)=1。因此,由(1)可得:
(2)P(H/E)=P(H)/(P(H)+P('H)×P(E/'H))根据逻辑否定规则,由(2)可得出:
(3)P(H/E)=P(H)/(P(H)+(1-P(H))×P(E/'H))
在(3)中,P(E/'H)表示,假定归纳结论H不真,E(即E1、E2、E3、E4等)为肯定事例的概率。
现在上面的问题可以解决了。相对于背景知识,已知归纳结论H 的先验概率P(H)=0.5,在H不真时“牵牛花有确定的开放时间”、“野蔷薇有确定的开放时间” 等肯定事例出现的先验概率P(E /‘H)=0.8。把以上数据代入(3)得:
P(H/E)=0.5/(0.5+(1-0.5)×0.8)
= 0.5/0.90
= 0.56
这说明,相对于观察证据E1、E2、E3、E4而言,归纳结论H(所有的花都有确定的开花时间)的可信程度为百分之五十六。

『捌』 贝叶斯定理是什么我知道公式是什么,能不能用例子给我讲清楚点

贝叶斯定理用于投资决策分析是在已知相关项目B的资料,而缺乏论证项目A的直接资料时,通过对B项目的有关状态及发生概率分析推导A项目的状态及发生概率。如果我们用数学语言描绘,即当已知事件Bi的概率P(Bi)和事件Bi已发生条件下事件A的概率P(A│Bi),则可运用贝叶斯定理计算出在事件A发生条件下事件Bi的概率P(Bi│A)。按贝叶斯定理进行投资决策的基本步骤是: 1 列出在已知项目B条件下项目A的发生概率,即将P(A│B)转换为 P(B│A); 2 绘制树型图; 3 求各状态结点的期望收益值,并将结果填入树型图; 4 根据对树型图的分析,进行投资项目决策; 搜索巨人Google和Autonomy,一家出售信息恢复工具的公司,都使用了贝叶斯定理(Bayesian principles)为数据搜索提供近似的(但是技术上不确切)结果。研究人员还使用贝叶斯模型来判断症状和疾病之间的相互关系,创建个人机器人,开发能够根据数据和经验来决定行动的人工智能设备。

『玖』 如何理解贝叶斯估计

贝叶斯理论
1.贝叶斯法则
机器学习的任务:在给定训练数据D时,确定假设空间H中的最佳假设。
最佳假设:一种方法是把它定义为在给定数据D以及H中不同假设的先验概率的有关知识下的最可能假设。贝叶斯理论提供了一种计算假设概率的方法,基于假设的先验概率、给定假设下观察到不同数据的概率以及观察到的数据本身。

2.先验概率和后验概率
用P(h)表示在没有训练数据前假设h拥有的初始概率。P(h)被称为h的先验概率。先验概率反映了关于h是一正确假设的机会的背景知识如果没有这一先验知识,可以简单地将每一候选假设赋予相同的先验概率。类似地,P(D)表示训练数据D的先验概率,P(D|h)表示假设h成立时D的概率。机器学习中,我们关心的是P(h|D),即给定D时h的成立的概率,称为h的后验概率。

3.贝叶斯公式
贝叶斯公式提供了从先验概率P(h)、P(D)和P(D|h)计算后验概率P(h|D)的方法
p(h|D)=P(D|H)*P(H)/P(D)
P(h|D)随着P(h)和P(D|h)的增长而增长,随着P(D)的增长而减少,即如果D独立于h时被观察到的可能性越大,那么D对h的支持度越小。

4.极大后验假设
学习器在候选假设集合H中寻找给定数据D时可能性最大的假设h,h被称为极大后验假设(MAP)
确定MAP的方法是用贝叶斯公式计算每个候选假设的后验概率,计算式如下:
h_map=argmax P(h|D)=argmax (P(D|h)*P(h))/P(D)=argmax P(D|h)*p(h) (h属于集合H)
最后一步,去掉了P(D),因为它是不依赖于h的常量。

5.极大似然假设
在某些情况下,可假定H中每个假设有相同的先验概率,这样式子可以进一步简化,只需考虑P(D|h)来寻找极大可能假设。
h_ml = argmax p(D|h) h属于集合H
P(D|h)常被称为给定h时数据D的似然度,而使P(D|h)最大的假设被称为极大似然假设。

6.举例
一个医疗诊断问题
有两个可选的假设:病人有癌症、病人无癌症
可用数据来自化验结果:正+和负-
有先验知识:在所有人口中,患病率是0.008
对确实有病的患者的化验准确率为98%,对确实无病的患者的化验准确率为97%
总结如下
P(cancer)=0.008, P(cancer)=0.992
P(+|cancer)=0.98, P(-|cancer)=0.02
P(+|cancer)=0.03, P(-|cancer)=0.97
问题:假定有一个新病人,化验结果为正,是否应将病人断定为有癌症?求后验概率P(cancer|+)和P(cancer|+)
因此极大后验假设计算如下:
P(+|cancer)P(cancer)=0.0078
P(+|cancer)P(cancer)=0.0298
hMAP=cancer
确切的后验概率可将上面的结果归一化以使它们的和为1
P(canner|+)=0.0078/(0.0078+0.0298)=0.21
P(cancer|-)=0.79
贝叶斯推理的结果很大程度上依赖于先验概率,另外不是完全接受或拒绝假设,只是在观察到较多的数据后增大或减小了假设的可能性。