機器學習在股票交易中的應用_如何用Python和機器學習炒股賺錢

A. 用「機器學習」做「股票預測」能做到什麼程度

我最近也在思考這個東西，機器學習是基於統計數據的，但是問題在於統計數據的產生可能就受到政策的影響。你如何把收集到的新聞等也納入數據計算之中，或許才有可能吧。

B. 如何用 python 和機器學習炒股賺錢

很難實現。
因為所有的機器學習，都需要人為的指定學習的「特徵」，也就是為構建的智能體，指定通過哪些條件來自主的做出選擇。
而影響股票漲跌的條件，實在是太繁多太不穩定了，比如你可以讓智能體每天自動爬取一些股票分析網站的文章，通過自然語言處理分析出該網站對某些支股票的傾向，作為一個特徵。但是這個特徵就太片面而且並不一定準確。

C. 有沒有大佬能利用機器學習預測30天後股票漲跌情況啊，我實現不出來，頭都大了

考慮兩個最簡單的模型，第一個是趨勢跟隨，也就是正在上漲的股票後面大概率還會延續上漲，正在下跌的股票後面大概率還會延續下跌。第二個是均值回歸，就是跌得多了，一定會漲；漲的過頭了，一定會跌。用這兩個作為輸出，實現預測。

D. 如何用Python和機器學習炒股賺錢

相信很多人都想過讓人工智慧來幫你賺錢，但到底該如何做呢？瑞士日內瓦的一位金融數據顧問 Gaëtan Rickter 近日發表文章介紹了他利用 Python 和機器學習來幫助炒股的經驗，其最終成果的收益率跑贏了長期處於牛市的標准普爾 500 指數。雖然這篇文章並沒有將他的方法完全徹底公開，但已公開的內容或許能給我們帶來如何用人工智慧炒股的啟迪。

我終於跑贏了標准普爾 500 指數 10 個百分點！聽起來可能不是很多，但是當我們處理的是大量流動性很高的資本時，對沖基金的利潤就相當可觀。更激進的做法還能得到更高的回報。

這一切都始於我閱讀了 Gur Huberman 的一篇題為《Contagious Speculation and a Cure for Cancer: A Non-Event that Made Stock Prices Soar》的論文。該研究描述了一件發生在 1998 年的涉及到一家上市公司 EntreMed（當時股票代碼是 ENMD）的事件：

「星期天《紐約時報》上發表的一篇關於癌症治療新葯開發潛力的文章導致 EntreMed 的股價從周五收盤時的 12.063 飆升至 85，在周一收盤時接近 52。在接下來的三周，它的收盤價都在 30 以上。這股投資熱情也讓其它生物科技股得到了溢價。但是，這個癌症研究方面的可能突破在至少五個月前就已經被 Nature 期刊和各種流行的報紙報道過了，其中甚至包括《泰晤士報》！因此，僅僅是熱情的公眾關注就能引發股價的持續上漲，即便實際上並沒有出現真正的新信息。」

在研究者給出的許多有見地的觀察中，其中有一個總結很突出：

「（股價）運動可能會集中於有一些共同之處的股票上，但這些共同之處不一定要是經濟基礎。」

我就想，能不能基於通常所用的指標之外的其它指標來劃分股票。我開始在資料庫裡面挖掘，幾周之後我發現了一個，其包含了一個分數，描述了股票和元素周期表中的元素之間的「已知和隱藏關系」的強度。

我有計算基因組學的背景，這讓我想起了基因和它們的細胞信號網路之間的關系是如何地不為人所知。但是，當我們分析數據時，我們又會開始看到我們之前可能無法預測的新關系和相關性。

如果你使用機器學習，就可能在具有已知和隱藏關系的上市公司的寄生、共生和共情關系之上搶佔先機，這是很有趣而且可以盈利的。最後，一個人的盈利能力似乎完全關乎他在生成這些類別的數據時想出特徵標簽（即概念（concept））的強大組合的能力。

我在這類模型上的下一次迭代應該會包含一個用於自動生成特徵組合或獨特列表的單獨演算法。也許會基於近乎實時的事件，這可能會影響那些具有隻有配備了無監督學習演算法的人類才能預測的隱藏關系的股票組。

E. 怎樣讓《機器學習》進行股票分析，提

學習程序語言，並專研人工智慧；
設計相應程序，並不斷優化升級；
同時了解與分析股票市場，設計師都不懂，機器怎麼學？
設計眾多分析公式與指標，比對最合理的參數；
谷歌也做過這樣的分析，結果是無效。

現在不行，不等於將來不行。有志者事竟成。

F. 機器學習怎樣應用於量化交易

機器學習怎樣應用於量化交易（一）

曾有朋友問過，國內現在量化領域機器學習應用的少，是否因為效果不如簡單的策略。其實，把機器學習應用在量化交易上始終面臨著兩難，卻並不是無解的兩難。很多時候並不是機器學習不work，而是真正懂如何用正確科學的統計思維使用Machine Learning的人才太少。

機器學習涉及到特徵選擇、特徵工程、模型選擇、數據預處理、結果的驗證和分析等一整套建模流程，廣義角度來說就不單單是模型選擇的問題。所以，如果認為「用支持向量機成功預測股票漲跌」這樣的研究，就是把機器學習應用於量化交易，這種狹義的認識無疑是買櫝還珠，對機器學習領域散落遍地的珍珠視而不見。如果把機器學習的崛起放在歷史進程中考量，無非就是趨勢的延續：現在，可通過系統的數據分析證實過去模糊不定的經驗，機器學習演算法將未曾被察覺的規律得以浮現紙面。

在我看來，未來的發展概有兩個方向：

1.針對量化交易的統計學習演算法被提出，使其適合於雜訊大，分布不穩定的金融數據分析；

2.對於機器學習的熱情回歸理性，從工具為導向回歸到問題為導向。

針對如何以問題為導向，在機器學習演算法中挑選合適的工具，分享一些思路。

1.多因子模型的因子權重計算

當我們在構建多因子模型且已經選定了一系列因子之後，要如何根據不同的市場情況調整各個因子的權重呢？在以往的研究中發現，與其它演算法相比較，隨機森林演算法對於存在非線性、噪音和自變數共線性的訓練集的分析結果更出色。所以，目前在多因子模型的權重上，採用當期收益率對上期因子進行隨機森林回歸分析，以確定下一期多因子模型的因子權重。

2.缺失值處理

處理缺失值在金融的量化分析中是個無可避免的問題。選取合理的缺失值處理方法，依賴於數據本身的特點、數據缺失的情況、其對應的經濟學意義，以及我們需要使用數據進行何種計算。在嘗試構建多因子模型時，我們選擇了兩種缺失值替換方法：（1）採用期望最大化演算法來用同一變數的已知數據對缺失值進行極大似然估計。（2）把模型中包含的所有因子作為特徵變數，並賦予其相同的權重，再採用機器學習中的K-近鄰演算法來尋找最相似的標的，保證缺失值替換後，不會強化一部分因子的影響力。

其實在量化領域，機器學習解決著線性模型天生的缺陷或弊端，所以還是有著很深的介入的。除去凸優化、降維(提取市場特徵)等領域的應用，目前「非動態性」和「非線性」是兩個重要的弊端。金融關系之間並非靜態，很多時候也不是線性的。統計學習的優勢此時就會體現出來，它們能夠迅速地適應市場，或者用一種更「准確的」方式來描述市場。

在國內，機器學習在量化內應用跟領域有很大的關系，跟頻率也有很大的關系。比如，CTA的運用可能就要多於股票，它處理數據的維度要遠小於股票，獲取市場的長度和動態又強於股票。股票市場的momentum要弱於期貨市場的momentum，它的趨勢與股票相比更明顯和低雜訊。這些特徵對於機器學習發揮作用都更加有利。

很可能國內一些交易執行演算法的設計上就借鑒了機器學習。我們可以通過學習訂單薄特徵，對下一期盤口變化做一些概率上的預測，經過一定樣本的訓練之後，可以顯著地提升演算法表現。

而我仍謹慎看好深度學習等機器學習方法的原因在於，在認識市場上，現行的大部分方法與這些方法並不在一個維度上，這個優勢讓它們與其他方法相比，捕捉到更多的收益。也就是說，一個新的認識市場的角度才能帶來alpha。

G. 如何用機器學習炒股賺錢

下個炒股軟體，用模擬炒股功能練習，行情都是實時真實的。多總結經驗。

H. 3分鍾了解深度學習跟量化交易是什麼關系

機器學習怎樣應用於量化交易（一）
曾有朋友問過，國內現在量化領域機器學習應用的少，是否因為效果不如簡單的策略。其實，把機器學習應用在量化交易上始終面臨著兩難，卻並不是無解的兩難。很多時候並不是機器學習不work，而是真正懂如何用正確科學的統計思維使用Machine Learning的人才太少。機器學習涉及到特徵選擇、特徵工程、模型選擇、數據預處理、結果的驗證和分析等一整套建模流程，廣義角度來說就不單單是模型選擇的問題。所以，如果認為「用支持向量機成功預測股票漲跌」這樣的研究，就是把機器學習應用於量化交易，這種狹義的認識無疑是買櫝還珠，對機器學習領域散落遍地的珍珠視而不見。如果把機器學習的崛起放在歷史進程中考量，無非就是趨勢的延續：現在，可通過系統的數據分析證實過去模糊不定的經驗，機器學習演算法將未曾被察覺的規律得以浮現紙面。在我看來，未來的發展概有兩個方向：1.針對量化交易的統計學習演算法被提出，使其適合於雜訊大，分布不穩定的金融數據分析；2.對於機器學習的熱情回歸理性，從工具為導向回歸到問題為導向。針對如何以問題為導向，在機器學習演算法中挑選合適的工具，分享一些思路。1.多因子模型的因子權重計算當我們在構建多因子模型且已經選定了一系列因子之後，要如何根據不同的市場情況調整各個因子的權重呢？在以往的研究中發現，與其它演算法相比較，隨機森林演算法對於存在非線性、噪音和自變數共線性的訓練集的分析結果更出色。所以，目前在多因子模型的權重上，採用當期收益率對上期因子進行隨機森林回歸分析，以確定下一期多因子模型的因子權重。2.缺失值處理處理缺失值在金融的量化分析中是個無可避免的問題。選取合理的缺失值處理方法，依賴於數據本身的特點、數據缺失的情況、其對應的經濟學意義，以及我們需要使用數據進行何種計算。在嘗試構建多因子模型時，我們選擇了兩種缺失值替換方法：（1）採用期望最大化演算法來用同一變數的已知數據對缺失值進行極大似然估計。（2）把模型中包含的所有因子作為特徵變數，並賦予其相同的權重，再採用機器學習中的K-近鄰演算法來尋找最相似的標的，保證缺失值替換後，不會強化一部分因子的影響力。其實在量化領域，機器學習解決著線性模型天生的缺陷或弊端，所以還是有著很深的介入的。除去凸優化、降維(提取市場特徵)等領域的應用，目前「非動態性」和「非線性」是兩個重要的弊端。金融關系之間並非靜態，很多時候也不是線性的。統計學習的優勢此時就會體現出來，它們能夠迅速地適應市場，或者用一種更「准確的」方式來描述市場。在國內，機器學習在量化內應用跟領域有很大的關系，跟頻率也有很大的關系。比如，CTA的運用可能就要多於股票，它處理數據的維度要遠小於股票，獲取市場的長度和動態又強於股票。股票市場的momentum要弱於期貨市場的momentum，它的趨勢與股票相比更明顯和低雜訊。這些特徵對於機器學習發揮作用都更加有利。很可能國內一些交易執行演算法的設計上就借鑒了機器學習。我們可以通過學習訂單薄特徵，對下一期盤口變化做一些概率上的預測，經過一定樣本的訓練之後，可以顯著地提升演算法表現。而我仍謹慎看好深度學習等機器學習方法的原因在於，在認識市場上，現行的大部分方法與這些方法並不在一個維度上，這個優勢讓它們與其他方法相比，捕捉到更多的收益。也就是說，一個新的認識市場的角度才能帶來alpha。

I. 用「機器學習」做「股票預測」能做到什麼程度

你可以關注WB大彤金融俱樂部，裡面有具體操作及預判和推薦(每日更新)

J. 怎樣讓《機器學習》進行股票分析，提煉出規律

你好，這個要求太高了，目前的程序化或者機器人的深度學習都還沒有到這種地步。建議參考券商的程序化交易，來不斷提煉規律

機器學習在股票交易中的應用

機器學習怎樣應用於量化交易（一）

與機器學習在股票交易中的應用相關的內容