rnn预测股票价格_什么是波动率指数

❶ lstm做交通预测的输入输出是什么样的

间序列预测分析就是利用过去一段时间内某事件时间的特征来预测未来一段时间内该事件的特征。这是一类相对比较复杂的预测建模问题，和回归分析模型的预测不同，时间序列模型是依赖于事件发生的先后顺序的，同样大小的值改变顺序后输入模型产生的结果是不同的。
举个栗子：根据过去两年某股票的每天的股价数据推测之后一周的股价变化；根据过去2年某店铺每周想消费人数预测下周来店消费的人数等等
RNN 和 LSTM 模型
时间序列模型最常用最强大的的工具就是递归神经网络（recurrent neural network, RNN）。相比与普通神经网络的各计算结果之间相互独立的特点，RNN的每一次隐含层的计算结果都与当前输入以及上一次的隐含层结果相关。通过这种方法，RNN的计算结果便具备了记忆之前几次结果的特点。
典型的RNN网路结构如下：

❷ 深度学习的主要分类是什么呀这些网络cnn dbn dnm rnn是怎样的关系

简单来说：

1）深度学习（Deep Learning）只是机器学习（Machine Learning）的一种类别，一个子领域。机器学习 > 深度学习

2）大数据（Big Data）不是具体的方法，甚至不算具体的研究学科，而只是对某一类问题，或需处理的数据的描述

具体来说：

1）机器学习（Machine Learning）是一个大的方向，里面包括了很多种 approach，比如 deep learning, GMM, SVM, HMM, dictionary learning, knn, Adaboosting...不同的方法会使用不同的模型，不同的假设，不同的解法。这些模型可以是线性，也可以是非线性的。他们可能是基于统计的，也可能是基于稀疏的....

不过他们的共同点是：都是 data-driven 的模型，都是学习一种更加 abstract 的方式来表达特定的数据，假设和模型都对特定数据广泛适用。好处是，这种学习出来的表达方式可以帮助我们更好的理解和分析数据，挖掘数据隐藏的结构和关系。

Machine Learning 的任务也可以不同，可以是预测（prediction），分类（classification），聚类（clustering），识别（recognition），重建（reconstruction），约束（regularization），甚至降噪（denoising），超分辨（super-resolution），除马赛克（Demosaicing）等等....

2）深度学习（Deep Learning）是机器学习的一个子类，一般特指学习高层数的网络结构。这个结构中通常会结合线性和非线性的关系。

Deep Learning 也会分各种不同的模型，比如 CNN, RNN, DBN...他们的解法也会不同。

Deep Learning 目前非常流行，因为他们在图像，视觉，语音等各种应用中表现出了很好的 empirical performance。并且利用 gpu 的并行运算，在模型相当复杂，数据特别大量的情况下，依然可以达到很理想的学习速度。

因为 Deep Learning 往往会构建多层数，多节点，多复杂度的模型，人们依然缺乏多里面学习的结构模型的理解。很多时候，Deep Learning 甚至会被认为拥有类似于人类神经网络的结构，并且这种类似性被当做 deep learning 居然更大 potential 的依据。但答主个人认为，其实这略有些牵强...听起来更像是先有了这种 network 的结构，再找一个类似性。当然，这仅仅是个人观点...（私货私货）

3）大数据（Big Data，我们也叫他逼格数据....）是对数据和问题的描述。通常被广泛接受的定义是 3 个 V 上的“大”：Volume（数据量）, Velocity（数据速度）还有 variety（数据类别）。大数据问题（Big-data problem）可以指那种在这三个 V 上因为大而带来的挑战。

Volume 很好理解。一般也可以认为是 Large-scale data（其实学术上用这个更准确，只是我们出去吹逼的时候就都叫 big data 了...）。“大”可以是数据的维度，也可以是数据的 size。一般 claim 自己是 big-data 的算法会比较 scalable，复杂度上对这两个不敏感。算法和系统上，人们喜欢选择并行（Parallel），分布（distributed）等属性的方法来增加 capability。
ITjob----采集

❸ 什么是波动率指数

1987的全球股灾后，为稳定股市与保护投资者，纽约证券交易所(NYSE)于1990年引进了断路器机制(Circuit-breakers)，当股价发生异常变动时，暂时停止交易，试图降低市场的波动性来恢复投资者的信心。但断路器机制引进不久，对于如何衡量市场波动性市场产生了许多新的认识，渐渐产生了动态显示市场波动性的需求。因此，在NYSE采用断路器来解决市场过度波动问题不久，芝加哥期权交易所从1993年开始编制市场波动率指数(Market Volatility Index，VIX)，以衡量市场的波动率。
CBOE 在1973年4月开始股票期权交易后，就一直有通过期权价格来构造波动率指数的设想，以反映市场对于的未来波动程度的预期。其间有学者陆续提出各种计算方法，Whaley(1993)[1] 提出了编制市场波动率指数作为衡量未来股票市场价格波动程度的方法。同年，CBOE开始编制VIX 指数，选择S&P100 指数期权的隐含波动率为编制基础，同时计算买权与卖权的隐含波动率，以考虑交易者使用买权或卖权的偏好。
VIX表达了期权投资者对未来股票市场波动性的预期，当指数越高时，显示投资者预期未来股价指数的波动性越剧烈；当VIX指数越低时，代表投资者认为未来的股价波动将趋于缓和。由于该指数可反应投资者对未来股价波动的预期，并且可以观察期权参与者的心理表现，也被称为“投资者情绪指标”(The investor fear gauge )。经过十多年的发展和完善，VIX指数逐渐得到市场认同，CBOE于2001年推出以NASDAQ 100指数为标的的波动性指标 (NASDAQ Volatility Index ,VXN)； CBOE2003年以S&P500指数为标的计算VIX指数，使指数更贴近市场实际。2004年推出了第一个波动性期货（Volatility Index Futures）VIX Futures， 2004年推出第二个将波动性商品化的期货，即方差期货 (Variance Futures)，标的为三个月期的S&P500指数的现实方差(Realized Variance)。2006年，VIX指数的期权开始在芝加哥期权交易所开始交易
计算波动率指数（VIX）需要的核心数据是隐含波动率，隐含波动率由期权市场上最新的交易价格算出，可以反映市场投资者对于未来行情的预期。其概念类似于债券的到期收益率(Yield To Maturity)：随着市场价格变动，利用适当的利率将债券的本金和票息贴现，当债券现值等于市场价格时的贴现率即为债券的到期收益率，也就是债券的隐含报酬率。在计算过程中利用债券评价模型，通过使用市场价格可反推出到期收益率，这一收益率即为隐含的到期收益率。

❹ 实际波动率的概念

要明确实际波动率，首先要从波动率的概念入手。波动率（Volatility）：是指关于资产未来价格不确定性的度量。它通常用资产回报率的标准差来衡量。也可以指某一证券的一年最高价减去最低价的值再除以最低价所得到的比率。业内将波动率定义为价格比率自然对数的标准差。波动率的种类有：实际波动率，隐含波动率，历史波动率等等，实际波动率便是波动率的一种。

❺ 如何运用机器学习解决复杂系统的预测问题

现实生活中预测通常难做到精准，比如股市，自然灾害，长久的天气预测。

在市场这种系统里，有两个关键要素，一个是个体和个体之间的互相作用（博弈），一个是系统与外部环境（地球资源）之间的相互作用（反馈），因此而形成复杂模式（Pattern），这种模式通常很难预测。
而这种类型的系统我们通常定义为复杂系统：由大量单元互相作用组成的系统，由于集体行为的非线性（总体不等于个体之和），而形成具备无数层级的复杂组织。或者称为涌现性。
复杂科学即研究复杂系统的一套联系不同尺度现象的数学方法。在人类试图理解那些和自身生存最相关的东西时，而经典物理学的还原论（把整体拆成部分）思维的却不适用。物理预测的核心方法是动力学方法, 即人们由实验出发抽象出引起运动改变的原因, 把这些原因量化为变量，用微分方程来描述, 从而取得对整个未来的精确解，如麦克斯韦方程组可以预测从光波的速度到磁线圈转动发电任何的电磁学现象。而你却无法通过了解市场上每个人的特性就很好的预测整个市场走势。
复杂系统难以预测的原理可以从以下几方面理解：
1，高维诅咒: 构成现实生活的系统往往被大量未知变量决定，比如生物由无数的细胞组成。基因，是由无数独立的单元组成的，市场，由无数的交易者组成，这些用物理的描述方法来预测，就是极高维度空间的运动问题。维度，首先使得再简单的方程形式都十分复杂难解。
此处补充维度的科学定义：维度是一个系统里可以独立变化的变量个数，一个有非常多变量的系统，如复杂网络，假如每个变量不是互相独立，也可以是低维系统。比如一个军营里的方阵，即使人数众多，也会因为大家都做着一模一样的动作，而只有一个独立变量，成为一维系统。
2，非线性诅咒：高维度系统的维度之间具有复杂的相互作用，导致我们不能把系统分解为单一维度然后做加法的方法研究。高维加上非线性我们将得到对初级极为敏感的混沌系统。

非线性的一个重要推论是组织的产生，因为非线性，1+1可以大于2或小于2，为组织的产生提供了理论基础。
3，反馈诅咒：复杂系统中反馈无处不在，即使是一个简单的一维系统，反馈也可以使得系统的特性很丰富，最典型的反馈是某种记忆效应，使得系统产生复杂的路径依赖，此刻你的现实与历史深刻关联，而关联方法导致复杂的模式产生。
反身性是一种由预测产生的特殊反馈，当你预测股市的价格，会引起你的交易策略变化从而影响你的预测，是为反身性。
4，随机诅咒: 复杂系统往往含有不包含确定规律的随机噪声，加上这些噪声，系统的行为更加难预测，而很多时候，我们也无法区分一个系统里发现的模式是噪声导致还是由于元件之间的相互作用。
这四大诅咒是这些系统难以理解和预测的原因，而这个时候，复杂系统和机器学习的方法论可以作为一种非常有力的手段帮我们从复杂性中挖掘模式。
第一种方法叫模型驱动（Model approch），即想办法找到事物变化的原因，用一种降维的思路列出微分方程，即从非常繁复的要素中化简出最重要的一个或者两个，从而化繁琐为简单，不管三七二十一先抓住主要矛盾。其中的范例便是非线性动力学。
注：此处我们有两个基本假设让非线性动力学得到简化，一个是只讨论连续变量，另一个是不考虑系统内的随机性（无噪声项）。
1，如果一个系统可以化简到一维，那么你只需要研究其内部存在的反馈性质并描述它即可。负反馈导致稳定定点产生，正反馈导致不稳定性。很多事物多可以抽象为一维系统，包括简单环境下的人口增长问题。
2，如果一个系统可以化简到二维，那么你需要研究两个维度间的相互作用，最终可以互为负反馈而稳定下来，互为正反馈而爆发，或者产生此消彼长的周期轨道。比如恋爱中的男女是个二维系统，互为负反馈就回到普通朋友，互为正反馈在爱欲中爆发-比如罗密欧与朱丽叶，此消彼长那是玩捉迷藏的周期游戏。
3，如果一个系统是三维的，则混沌可能产生。混沌即对初值极为敏感的运动体系。你一旦偏离既定轨道一点，即几乎无法回去。
4，如果一个系统大于三维，那么你需要用一个复杂网络描述它的运动，这个时候我们可以得到我们复杂系统的主角- collective phenomena & emergence。复杂网络的性质主要取决于单体间相互作用的方式，以及系统与外界交换能量的方法，这两者又息息相关。最终我们得到涌现。

复杂网络的动力学往往混沌难以预测，对于高维混沌系统，第一个方法也只能给出对事物定性的描述，而我们可以祭出我们的第二种方法: 先不管数据背后错综复杂的动因，而是直接以数据驱动我们的预测。
这其中的哲学内涵即贝叶斯分析框架：即先不预测，而是列出所有可能的结果及根据以往知识和经验每种结果发生的可能性（先验概率），之后不停吸收新观测数据，调整每种可能结果的概率大小（后验概率），将想得到的结果概率最大化（MAP）最终做出决策。
如果你把贝叶斯分析的框架自动化，让电脑完成，你就得到机器学习的最基本框架。
机器学习如果可以进入一个问题中，往往要具备三个条件：
1，系统中可能存在模式
2，这种模式不是一般解析手段可以猜测到的。
3，数据可以获取。
如果三点有一点不符，都很难运用机器学习。
机器学习的一个核心任务即模式识别，也可以看出它和刚才讲的复杂系统提到的模式的关系。我们讲复杂系统难以通过其成分的分析对整体进行预测，然而由于复杂系统通常存在模式，我们通常可以模式识别来对系统进行归类，并预测各种可能的未来结果。比如一个投行女因为工作压力过大而自杀了，那么在她之前的活动行为数据（比如点击手机的某些app的频率）里是否可能存在某种模式? 这种模式是否可以判定她之后的行为类型？并且这个过程可否通过历史数据由计算机学习？如果都可以，这就是一个机器学习问题。
刚才讲的几大诅咒，高维，非线性，复杂反馈，随机性也称为机器学习需要核心面对的几大困难，由此得到一系列机器学习的核心算法。

机器学习在现实生活中被用于非常多的方面，最常见的如商务洞察（分类，聚类，推荐算法），智能语音语义服务（时间序列处理，循环网络），各种自动鉴别系统如人脸识别，虹膜识别，癌症检测（深度卷积网络），阿尔法狗，机器人控制（深度强化学习算法）。而由方法论分，又可以分成有监督学习，无监督学习，和强化学习。

在八月份的巡洋舰科技的《机器学习vs复杂系统特训课》中，我着重讲了几种机器学习的基本方法：
1. 贝叶斯决策的基本思想：
你要让机器做决策，一个基本的思路是从统计之前数据挖掘已有的模式（pattern）入手，来掌握新的数据中蕴含的信息。这个pattern在有监督学习的例子里，就是把某种数据结构和假设结论关联起来的过程，我们通常用条件概率描述。那么让机器做决策，就是通过不停的通过新数据来调整这个数据结构（特征）与假设结果对应的条件概率。通常我们要把我们预先对某领域的知识作为预设（prior），它是一个假设结果在数据收集前的概率密度函数，然后通过收集数据我们得到调整后的假设结果的概率密度函数，被称为后验概率（posterior），最终的目标是机器得到的概率密度函数与真实情况最匹配，即 Maximum a posterior(MAP)，这是机器学习的最终目标。
2，朴素贝叶斯分类器到贝叶斯网络：
分类，是决策的基础，商业中要根据收集客户的消费特征将客户分类从而精准营销。金融中你要根据一些交易行为的基本特征将交易者做分类。从贝叶斯分析的基本思路出发我们可以迅速得到几种分类器。
首当其冲的朴素贝叶斯分类器，它是机器学习一个特别质朴而深刻的模型：当你要根据多个特征而非一个特征对数据进行分类的时候，我们可以假设这些特征相互独立（或者你先假设相互独立），然后利用条件概率乘法法则得到每一个分类的概率，然后选择概率最大的那个作为机器的判定。
图：朴素贝叶斯分类器的基本框架， c是类别， A是特征。
如果你要根据做出分类的特征不是互相独立，而是互相具有复杂关联，这也是大部分时候我们面临问题的真相，我们需要更复杂的工具即贝叶斯网络。比如你对某些病例的判定，咳嗽，发烧，喉咙肿痛都可以看做扁条体发炎的症候，而这些症候有些又互为因果，此时贝叶斯网络是做出此类判定的最好方法。构建一个贝叶斯网络的关键是建立图模型，我们需要把所有特征间的因果联系用箭头连在一起，最后计算各个分类的概率。

图：贝叶斯网络对MetaStatic Cancer的诊断，此处的特征具有复杂因果联系
贝叶斯分析结合一些更强的假设，可以让我们得到一些经常使用的通用分类器，如逻辑斯提回归模型，这里我们用到了物理里的熵最大假设得到玻尔兹曼分布，因此之前简单贝叶斯的各个特征成立概率的乘积就可以转化为指数特征的加权平均。这是我们日常最常用的分类器之一。更加神奇的是，这个东西形式上同单层神经网络。

图： logistic函数，数学形式通玻尔兹曼分布，物理里熵最大模型的体现
3, 贝叶斯时间序列分析之隐马模型：
贝叶斯时间序列分析被用于挖掘存储于时间中的模式，时间序列值得是一组随时间变化的随机变量，比如玩牌的时候你对手先后撒出的牌即构成一个时间序列。时间序列模式的预设setting即马尔科夫链，之前动力学模式里讲到反馈导致复杂历史路径依赖，当这种依赖的最简单模式是下一刻可能出现的状态只与此刻的状态有关而与历史无关，这时候我们得到马尔科夫链。
马尔科夫链虽然是贝叶斯时间序列分析的基准模型，然而现实生活中遇到的时间序列问题，通常不能归于马尔科夫链，却可以间接的与马尔科夫链关联起来，这就是隐马过程，所谓含有隐变量的马尔科夫过程。

图：隐马过程示意

语音识别就是一类特别能利用隐马过程的应用，在这里语音可以看做一组可观测的时间序列，而背后的文字是与之关联的马尔科夫链，我们需要从可观测的量，按照一定的概率分布反推不可观测的量，并用马尔科夫链的观点对其建模，从而解决从语音到文字的反推过程。当今的语音识别则用到下面紧接讲的深度学习模型。
4，深度学习
刚刚讲的分类问题，只能根据我们已知的简单特征对事物进行分类，但假设我们手里的数据连需要提取的特征都不知道，我们如何能够对事物进行分类呢？比如你要从照片识别人名，你都不知道选哪个特征和一个人关联起来。没关系，此时我们还有一个办法，就是让机器自发学习特征，因此祭出深度学习大法。通常在这类问题里，特征本身构成一个复杂网络，下级的特征比较好确定，而最高层的特征，是由底层特征的组合确定的，连我们人类自己都不能抽象出它们。
深度学习即数据内涵的模式（特征）本身具备上述的多层级结构时候，我们的机器学习方法。从以毒攻毒的角度看，此时我们的机器学习机器也需要具有类似的多级结构，这就是大名鼎鼎的多层卷积神经网络。深度学习最大的优势是具有更高级的对“结构”进行自动挖掘的能力，比如它不需要我们给出所有的特征，而是自发去寻找最合适对数据集进行描述的特征。一个复杂模式-比如“人脸” 事实上可以看做一个简单模式的层级叠加，从人脸上的轮廓纹理这种底层模式，到眼睛鼻子这样的中级模式，直到一个独特个体这样最高级的复杂模式，你只有能够识别底层模式，才有可能找到中级模式，而找到中级模式才方便找到高级模式，我们是不能从像素里一步到达这种复杂模式的。而是需要学习这种从简单模式到复杂模式的结构，多层网络的结构应运而生。
图：从具体特征到抽象特征逐级深入的多级神经网络
6， RNN和神经图灵机
如果时间序列数据里的模式也包含复杂的多层级结构，这里和我之前说的复杂系统往往由于反馈导致复杂的时间依赖是一致的，那么要挖掘这种系统里的模式，我们通常的工具就是超级前卫的循环神经网络RNN，这种工具对处理高维具有复杂反馈的系统有神效，因为它本身就是一个高维具有复杂时间反馈的动力学系统。
图：循环神经网络，过去的信息可以通过循环存储在神经元之间
当一个复杂时间序列的问题里面，每个时间点的信息都可以对未来以任何方式产生复杂影响，那么处理这种复杂性的一个办法就是用循环神经网络，让它自发学习这种复杂结构。比如一个城市里的交通流，或者人与人之间的对话。
神经图灵机是在多层卷积神经网络或递归网络基础上加上一个较长期的记忆单元，从而达到处理需要更复杂时间关联的任务，比如对话机器人。而神经图灵机最厉害的地方在于他可以通过机器学习传统的梯度下降法反向破译一个程序，比如你写了一个python程序，你用很多不同的输入得到很多对应的输出，你可以把它给神经图灵机训练，最终本来对程序丝毫无所知的神经图灵机居然可以如同学会了这个程序。

❻ 如何用Tensorflow实现RNN

class TextLoader():
def __init__(self, data_dir, batch_size, seq_length, encoding='utf-8'):
self.data_dir = data_dir
self.batch_size = batch_size
self.seq_length = seq_length
self.encoding = encoding
#第一次运行程序时只有input.txt一个文件，剩下两个文件是运行之后产生的
input_file = os.path.join(data_dir, "input.txt")
vocab_file = os.path.join(data_dir, "vocab.pkl")
tensor_file = os.path.join(data_dir, "data.npy")
#如果是第一次执行则调用preprocess函数，否则调用load_preprocessed函数。
if not (os.path.exists(vocab_file) and os.path.exists(tensor_file)):
print("reading text file")
self.preprocess(input_file, vocab_file, tensor_file)
else:
print("loading preprocessed files")
self.load_preprocessed(vocab_file, tensor_file)
self.create_batches()
self.reset_batch_pointer()

def preprocess(self, input_file, vocab_file, tensor_file):
with codecs.open(input_file, "r", encoding=self.encoding) as f:
data = f.read()
#使用Counter函数对输入数据进行统计。counter保存data中每个字符出现的次数
counter = collections.Counter(data)
#对counter进行排序，出现次数最多的排在前面
count_pairs = sorted(counter.items(), key=lambda x: -x[1])
#将data中出现的所有字符保存，这里有65个，所以voacb_size=65
self.chars, _ = zip(*count_pairs)
self.vocab_size = len(self.chars)
#按照字符出现次数多少顺序将chars保存，vocab中存储的是char和顺序，这样方便将data转化为索引
self.vocab = dict(zip(self.chars, range(len(self.chars))))
with open(vocab_file, 'wb') as f:
#保存chars
cPickle.mp(self.chars, f)
#将data中每个字符转化为索引下标。
self.tensor = np.array(list(map(self.vocab.get, data)))
np.save(tensor_file, self.tensor)

def load_preprocessed(self, vocab_file, tensor_file):
#如果是第二次运行，则可以直接读取之前保存的chars和tensor
with open(vocab_file, 'rb') as f:
self.chars = cPickle.load(f)
self.vocab_size = len(self.chars)
self.vocab = dict(zip(self.chars, range(len(self.chars))))
self.tensor = np.load(tensor_file)
self.num_batches = int(self.tensor.size / (self.batch_size *
self.seq_length))

def create_batches(self):
#首先将数据按batch_size切割，然后每个batch_size在按照seq_length进行切割
self.num_batches = int(self.tensor.size / (self.batch_size *
self.seq_length))

if self.num_batches == 0:
assert False, "Not enough data. Make seq_length and batch_size small."

self.tensor = self.tensor[:self.num_batches * self.batch_size * self.seq_length]
xdata = self.tensor
#构造target，这里使用上一个词预测下一个词，所以直接将x向后一个字符即可
ydata = np.(self.tensor)
ydata[:-1] = xdata[1:]
ydata[-1] = xdata[0]
#将数据进行切分，这里我们假设数据总长度为10000，batch_size为100， seq_length为10.
# 所以num_batches=10，所以，xdata在reshape之后变成[100, 100],然后在第二个维度上切成10份，
# 所以最终得到[100, 10, 10]的数据
self.x_batches = np.split(xdata.reshape(self.batch_size, -1),
self.num_batches, 1)
self.y_batches = np.split(ydata.reshape(self.batch_size, -1),
self.num_batches, 1)

def next_batch(self):
x, y = self.x_batches[self.pointer], self.y_batches[self.pointer]
self.pointer += 1
return x, y

def reset_batch_pointer(self):
self.pointer = 0

❼ 只有一层隐藏层的CNN（RNN）算是深度学习吗

都可以,这个现在没有特别明晰的界限和定义,不必过分关心.
个人觉得用层数来界定深还是浅有点low, 深度学习与传统机器学习的最大区别是在于它的弹性,它的层数和结构可以非常方便的的延伸和拓展.

rnn预测股票价格

与rnn预测股票价格相关的内容