如何对股票进行聚类分析_如何对一只股票进行分析

『壹』如何对个股进行分析！

首先是技术面，看这支股票的趋势及空间
然后看它的基础面，看这家上市公司是做什么的，它的产品被不被人看好，以往的业绩怎么样，和未来是否被看好
第三要看它的消息面，看看短期有没有什么利好，利空之类的消息，国家政策有没有什么对股市的利的
最后可能要看看有没有内部的准确消息，消息不能全们，尤其是小道消息，除非你有朋友正在用大量奖金做这支股票，这样你可以跟着发点小财，但如果不是，千万不要盲目地进入。
技术看软件就行了，信息软件里也有，不过有一些不是准确的，也不是及时的，要想获得第一手的资料不是一个人两个人就能办到的，需要一个团体，如果只是单独的散户那么学好技术，短线操作，也能给你带来丰厚的利益，消息方面可以从证券公司手里得到。
我要说的就是这些了，希望你早日成为股市中的佼佼者!~~

『贰』如何用MATLAB对股票数据做聚类分析

直接调kmeans函数。
k = 3;%类别数
idx = kmeans(X, k);%idx就是每个样本点的标号。

『叁』聚类分析的主要步骤

聚类分析的主要步骤
聚类分析的主要步骤
1.数据预处理，2.为衡量数据点间的相似度定义一个距离函数，3.聚类或分组，4.评估输出。
数据预处理包括选择数量，类型和特征的标度，它依靠特征选择和特征抽取，特征选择选择重要的特征，特征抽取把输入的特征转化为一个新的显著特征，它们经常被用来获取一个合适的特征集来为避免“维数灾”进行聚类，数据预处理还包括将孤立点移出数据，孤立点是不依附于一般数据行为或模型的数据，因此孤立点经常会导致有偏差的聚类结果，因此为了得到正确的聚类，我们必须将它们剔除。
既然相类似性是定义一个类的基础，那么不同数据之间在同一个特征空间相似度的衡量对于聚类步骤是很重要的，由于特征类型和特征标度的多样性，距离度量必须谨慎，它经常依赖于应用，例如，通常通过定义在特征空间的距离度量来评估不同对象的相异性，很多距离度都应用在一些不同的领域，一个简单的距离度量，如Euclidean距离，经常被用作反映不同数据间的相异性，一些有关相似性的度量，例如PMC和SMC，能够被用来特征化不同数据的概念相似性，在图像聚类上，子图图像的误差更正能够被用来衡量两个图形的相似性。
将数据对象分到不同的类中是一个很重要的步骤，数据基于不同的方法被分到不同的类中，划分方法和层次方法是聚类分析的两个主要方法，划分方法一般从初始划分和最优化一个聚类标准开始。CrispClustering，它的每一个数据都属于单独的类；FuzzyClustering，它的每个数据可能在任何一个类中，CrispClustering和FuzzyClusterin是划分方法的两个主要技术，划分方法聚类是基于某个标准产生一个嵌套的划分系列，它可以度量不同类之间的相似性或一个类的可分离性用来合并和分裂类，其他的聚类方法还包括基于密度的聚类，基于模型的聚类，基于网格的聚类。
评估聚类结果的质量是另一个重要的阶段，聚类是一个无管理的程序，也没有客观的标准来评价聚类结果，它是通过一个类有效索引来评价，一般来说，几何性质，包括类间的分离和类内部的耦合，一般都用来评价聚类结果的质量，类有效索引在决定类的数目时经常扮演了一个重要角色，类有效索引的最佳值被期望从真实的类数目中获取，一个通常的决定类数目的方法是选择一个特定的类有效索引的最佳值，这个索引能否真实的得出类的数目是判断该索引是否有效的标准，很多已经存在的标准对于相互分离的类数据集合都能得出很好的结果，但是对于复杂的数据集，却通常行不通，例如，对于交叠类的集合。

『肆』如何对用户进行聚类分析

需要搜集用户的哪些特征？

聚类分析变量选择的原则是：在哪些变量组合的前提，使得类别内部的差异尽可能的小，即同质性高，类别间的差异尽可能的大，即同质性低，并且变量之间不能存在高度相关。

常用的用户特征变量有：

①
人口学变量：如年龄、性别、婚姻、教育程度、职业、收入等。通过人口学变量进行分类，了解每类人口的需求有何差异。

②
用户目标：如用户为什么使用这个产品？为什么选择线上购买？了解不同使用目的的用户的各自特征，从而查看各类目标用户的需求。

③
用户使用场景：用户在什么时候，什么情况下使用这个产品？了解用户在各类场景下的偏好/行为差异。

④
用户行为数据：如使用频率，使用时长，客单价等。划分用户活跃等级，用户价值等级等。

⑤
态度倾向量表：如消费偏好，价值观等，看不同价值观、不同生活方式的群体在消费取向或行为上的差异。

需要多少样本量？

没有限制，通常情况下与实际应用有关，如果非要加一个理论的限制，通常认为，样本的个数要大于聚类个数的平方。

①如果需要聚类的数据量较少（<100），那么三种方法(层次聚类法，K-均值聚类法，两步聚类法)都可以考虑使用。优先考虑层次聚类法，因为层次聚类法产生的树状图更加直观形象，易于解释，并且，层次聚类法提供方法、距离计算方式、标准化方式的丰富程度也是其他两种方法所无法比拟的。

②如果需要聚类的数据量较大（>1000），应该考虑选择快速聚类别法或者两步聚类法进行。

③如果数据量在100～1000之间，理论上现在的计算条件是可能满足任何聚类方法的要求的，但是结果的展示会比较困难，例如不可能再去直接观察树状图了。

应用定量方法还是定性方法？

聚类分析是一种定量分析方法，但对聚类分析结果的解释还需要结合定性资料讨论。

1.聚类分析的定义与用途

聚类分析（Cluster Analysis）是一种探索性的数据分析方法，根据指标/变量的数据结构特征，对数据进行分类，使得类别内部的差异尽可能的小，即同质性高，类别间的差异尽可能的大，即同质性低。

2.聚类分析的方法

①层次聚类法（Hierarchical），也叫系统聚类法。既可处理分类变量，也可处理连续变量，但不能同时处理两种变量类型，不需要指定类别数。聚类结果间存在着嵌套，或者说层次的关系。

②K-均值聚类法（K-Means Cluster），也叫快速聚类法。针对连续变量，也可处理有序分类变量，运算很快，但需要指定类别数。K-均值聚类法不会自动对数据进行标准化处理，需要先自己手动进行标准化分析。

③两步聚类法（Two-Step Cluster）：可以同时处理分类变量和连续变量，能自动识别最佳的类别数，结果比较稳定。如果只对连续变量进行聚类，描述记录之间的距离性时可以使用欧氏（Euclidean）距离，也可以使用对数似然值（Log-likelihood），如果使用前者，则该方法和传统的聚类方法并无太大区别；但是若进行聚类的还有离散变量，那么就只能使用对数似然值来表述记录间的差异性。当聚类指标为有序类别变量时，Two-Step Cluster出来的分类结果没有K-means cluster的明晰，这是因为K-means算法假定聚类指标变量为连续变量。

3.聚类分析的步骤

①确定研究目的：研究问题关注点有哪些、是否有先验分类数…

②问卷编制：态度语句李克特项目、有序类别…

③确定分析变量：问卷变量的类型，连续or分类，有序类别or无序类别、是否纳入后台数据，变量间相关性低…

④聚类分析：聚类分析方法选择、数据标准化方法、聚类类别数确定…

⑤结果检验：类别间差异分析、是否符合常理…

⑥聚类结果解释：类别的命名、类别间的差异、结合定性资料解释…

『伍』如何对一只股票进行分析

首先从行业分析入手。分析任何一个公司的时候，都要了解这个行业的景气度。目前市场上可以炒作的行业有三种，第一种新兴行业，比如人工智能、5G等。第二种周期行业，比如钢铁、有色、MDI等。第三种为国家扶持，比如农村振兴，扶贫等。

行业分析完以后，再来看看公司分析。这边是基于公司年报，半年报，季报，机构调研报告等，其中最主要的是上市公司年报，半年报，季报。这里面最主要的就是三大财务报表，也就是资产负债表，利润表，和现金流量表。

股票基本分析还包括文初提到的重要数据信息，总股本是指包括新股发行前的股份和新发行的股份的数量的总和，总值是指某特定时间内总股本数乘以当时股价得出的股票总价值。流通股指上市公司股份中，可以在交易所流通的股份数量。流值指某特定时间内当时可交易的流通股股数乘以当时股价得出的流通股票总价值。

『陆』如何运用聚类分析法

聚类分析法是理想的多变量统计技术，主要有分层聚类法和迭代聚类法。聚类通过把目标数据放入少数相对同源的组或“类”（cluster）里。分析表达数据，（1）通过一系列的检测将待测的一组基因的变异标准化，然后成对比较线性协方差。（2）通过把用最紧密关联的谱来放基因进行样本聚类，例如用简单的层级聚类（hierarchical clustering）方法。这种聚类亦可扩展到每个实验样本，利用一组基因总的线性相关进行聚类。（3）多维等级分析（multidimensional scaling analysis,MDS）是一种在二维Euclidean “距离”中显示实验样本相关的大约程度。（4）K-means方法聚类，通过重复再分配类成员来使“类”内分散度最小化的方法。

聚类方法有两个显著的局限：首先，要聚类结果要明确就需分离度很好（well-separated）的数据。几乎所有现存的算法都是从互相区别的不重叠的类数据中产生同样的聚类。但是，如果类是扩散且互相渗透，那么每种算法的的结果将有点不同。结果，每种算法界定的边界不清，每种聚类算法得到各自的最适结果，每个数据部分将产生单一的信息。为解释因不同算法使同样数据产生不同结果，必须注意判断不同的方式。对遗传学家来说，正确解释来自任一算法的聚类内容的实际结果是困难的（特别是边界）。最终，将需要经验可信度通过序列比较来指导聚类解释。

第二个局限由线性相关产生。上述的所有聚类方法分析的仅是简单的一对一的关系。因为只是成对的线性比较，大大减少发现表达类型关系的计算量，但忽视了生物系统多因素和非线性的特点。

从统计学的观点看，聚类分析是通过数据建模简化数据的一种方法。传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。采用k-均值、k-中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件包中，如SPSS、SAS等。
从机器学习的角度讲，簇相当于隐藏模式。聚类是搜索簇的无监督学习过程。与分类不同，无监督学习不依赖预先定义的类或带类标记的训练实例，需要由聚类学习算法自动确定标记，而分类学习的实例或数据对象有类别标记。聚类是观察式学习，而不是示例式的学习。
从实际应用的角度看，聚类分析是数据挖掘的主要任务之一。就数据挖掘功能而言，聚类能够作为一个独立的工具获得数据的分布状况，观察每一簇数据的特征，集中对特定的聚簇集合作进一步地分析。
聚类分析还可以作为其他数据挖掘任务（如分类、关联规则）的预处理步骤。
数据挖掘领域主要研究面向大型数据库、数据仓库的高效实用的聚类分析算法。

聚类分析是数据挖掘中的一个很活跃的研究领域，并提出了许多聚类算法。
这些算法可以被分为划分方法、层次方法、基于密度方法、基于网格方法和
基于模型方法。
1 划分方法(PAM:PArtitioning method) 首先创建k个划分，k为要创建的划分个数；然后利用一个循环
定位技术通过将对象从一个划分移到另一个划分来帮助改善划分质量。典型的划分方法包括：
k-means,k-medoids,CLARA(Clustering LARge Application),
CLARANS(Clustering Large Application based upon RANdomized Search).
FCM
2 层次方法(hierarchical method) 创建一个层次以分解给定的数据集。该方法可以分为自上
而下（分解）和自下而上（合并）两种操作方式。为弥补分解与合并的不足，层次合
并经常要与其它聚类方法相结合，如循环定位。典型的这类方法包括：
第一个是;BIRCH(Balanced Iterative Recing and Clustering using Hierarchies) 方法，它首先利用树的结构对对象集进行划分；然后再利
用其它聚类方法对这些聚类进行优化。
第二个是CURE(Clustering Using REprisentatives) 方法，它利用固定数目代表对象来表示相应聚类；然后对各聚类按照指定
量（向聚类中心）进行收缩。
第三个是ROCK方法，它利用聚类间的连接进行聚类合并。
最后一个CHEMALOEN，它则是在层次聚类时构造动态模型。
3 基于密度方法，根据密度完成对象的聚类。它根据对象周围的密度（如
DBSCAN）不断增长聚类。典型的基于密度方法包括：
DBSCAN(Densit-based Spatial Clustering of Application with Noise):该算法通过不断生长足够高密
度区域来进行聚类；它能从含有噪声的空间数据库中发现任意形状的聚类。此方法将一个聚类定义
为一组“密度连接”的点集。
OPTICS(Ordering Points To Identify the Clustering Structure):并不明确产生一
个聚类，而是为自动交互的聚类分析计算出一个增强聚类顺序。。
4 基于网格方法，首先将对象空间划分为有限个单元以构成网格结构；然后利
用网格结构完成聚类。
STING(STatistical INformation Grid) 就是一个利用网格单元保存的统计信息进行基
于网格聚类的方法。
CLIQUE(Clustering In QUEst)和Wave-Cluster 则是一个将基于网格与基于密度相结合的方
法。
5 基于模型方法，它假设每个聚类的模型并发现适合相应模型的数据。典型的
基于模型方法包括：
统计方法COBWEB:是一个常用的且简单的增量式概念聚类方法。它的输入对象是采
用符号量（属性-值）对来加以描述的。采用分类树的形式来创建
一个层次聚类。
CLASSIT是COBWEB的另一个版本.。它可以对连续取值属性进行增量式聚
类。它为每个结点中的每个属性保存相应的连续正态分布（均值与方差）；并利
用一个改进的分类能力描述方法，即不象COBWEB那样计算离散属性（取值）
和而是对连续属性求积分。但是CLASSIT方法也存在与COBWEB类似的问题。
因此它们都不适合对大数据库进行聚类处理.

『柒』如何对股票进行技术分析

任何一种技术分析研究的都是一种概率，任何人都不可能完全准确的预测股市。如果股市能够被人准确预测的话，那么多空分歧也就不存在了，股市也就不存在交易行为了，此时股市本身也就消亡了。大家在用炒股软件的时候，也不要一味的寄希望与此，所有的指标策略都是总结以往的经验而得的那么，在运用这些指标公示技术分析时，还是要结合自己的判断。

股票技术分析是从K线纯技术角度分析，基本面分析是从企业研发，技术，设备，人才到市场占有率的分析。

1、股票技术分析是以预测市场价格变化的未来趋势为目的，通过分析历史图表对市场价格的运动进行分析的一种方法。其目的是预测短期内股价涨跌的趋势，它是证券投资市场中非常普遍应用的一种分析方法。技术分析是指以市场行为为研究对象，以判断市场趋势并跟随趋势的周期性变化来进行股票及一切金融衍生物交易决策的方法的总和。
2、基本面分析又称基本分析，是以证券的内在价值为依据，着重于对影响证券价格及其走势的各项因素的分析，以此决定投资购买何种证券及何时购买。一般所讲的基本面分析是指对宏观经济面、公司主营业务所处行业、公司业务同行业竞争水平和公司内部管理水平包括对管理层的考察这诸多方面的分析，数据在这里充当了最大的分析依据，但往往不能以数据来做最终的投资决策，如果数据可以解决问题，那计算机早就代替人脑完成基本面分析，事实上除了数据还要包括许许多多无法以数据来衡量的东西。

『捌』对一只股票进行基本分析，怎么分析从哪些角度进行分析

公司所在的板块前景发展如何，公司是龙头，近年持续赚钱，营业收入增长率，净利润增长率，以上必须考虑的。

『玖』如何对用户进行聚类分析

你先要分开用户的类型，然后归类，进行分析人群的特点，望采纳

如何对股票进行聚类分析

与如何对股票进行聚类分析相关的内容