Redian新闻
>
[BSSD]Deep Learning炒股和写小说差不多
avatar
[BSSD]Deep Learning炒股和写小说差不多# Stock
C*5
1
我所知道的本质上差不多。用的都是一种叫Long-Short Term Memory(LSTM)的神经网络
。写小说无非是学习了一堆哈里波特然后“预测”下一个字,句是啥。然后用输出的字
当输入,迭代就能写出洋洋洒洒一大段。同样的炒股也是学习一堆历史股价数据,然后
试着预测下一个或者下面好多时间点的股价。
如果有空的话我真的可以train个model试一试,但是效果不见得好。Deep Learning入
门并不难,但是要做好需要很多经验,要靠个人修行体会。
avatar
m*n
2
真可以这样,用个写作机写,自动更新,起点岂不是成大神了?

【在 C*****5 的大作中提到】
: 我所知道的本质上差不多。用的都是一种叫Long-Short Term Memory(LSTM)的神经网络
: 。写小说无非是学习了一堆哈里波特然后“预测”下一个字,句是啥。然后用输出的字
: 当输入,迭代就能写出洋洋洒洒一大段。同样的炒股也是学习一堆历史股价数据,然后
: 试着预测下一个或者下面好多时间点的股价。
: 如果有空的话我真的可以train个model试一试,但是效果不见得好。Deep Learning入
: 门并不难,但是要做好需要很多经验,要靠个人修行体会。

avatar
C*5
3
问题是学习的效果并不如你想象的好。写着写着就成胡言乱语了。

【在 m*******n 的大作中提到】
: 真可以这样,用个写作机写,自动更新,起点岂不是成大神了?
avatar
m*n
4
小白读者只要多更就高潮,不能deserve更多了。

【在 C*****5 的大作中提到】
: 问题是学习的效果并不如你想象的好。写着写着就成胡言乱语了。
avatar
r*e
5
你先得找股市的feature才有可能learn,问一下股市是多少维的?
[在 CRH1235 (江左没狼) 的大作中提到:]
:我所知道的本质上差不多。用的都是一种叫Long-Short Term Memory(LSTM)的神经网
络。写小说无非是学习了一堆哈里波特然后“预测”下一个字,句是啥。然后用输出的
字当输入,迭代就能写出洋洋洒洒一大段。同样的炒股也是学习一堆历史股价数据,然
后试着预测下一个或者下面好多时间点的股价。
:如果有空的话我真的可以train个model试一试,但是效果不见得好。Deep Learning入
:门并不难,但是要做好需要很多经验,要靠个人修行体会。
avatar
l*7
6
一个最基本的问题:为什么需要机器来读写小说?优势在哪?假设一大堆股市序列人都
学不懂,为什么指望机器能为你创造“奇迹”,帮你读懂而且书写?这种期待、并见证
奇迹的目标客观么?
avatar
m*n
7
我记得哪贴过几篇机器生成的,读着还不错,但看得出人工润色过。
为什么需要机器来读写?这个,老邢最需要了,这样就有终极器人了,且不会被真人ID
骂了。

【在 l********7 的大作中提到】
: 一个最基本的问题:为什么需要机器来读写小说?优势在哪?假设一大堆股市序列人都
: 学不懂,为什么指望机器能为你创造“奇迹”,帮你读懂而且书写?这种期待、并见证
: 奇迹的目标客观么?

avatar
C*5
8
Deep learning的好处是不需要人工提取feature。
最简单的用收盘价就可以学习了,那input就是个一维(nx1)的vector(n是时间
),当然这样效果不一定好。讲究点的可以把开盘,收盘,高点,低点,成交量等等一
起当输入,这样输入就是(nx5)的二位matrix。还有其他的也可以加进去,输入就
是(nxm),但是还是二维的。

【在 r*****e 的大作中提到】
: 你先得找股市的feature才有可能learn,问一下股市是多少维的?
: [在 CRH1235 (江左没狼) 的大作中提到:]
: :我所知道的本质上差不多。用的都是一种叫Long-Short Term Memory(LSTM)的神经网
: 络。写小说无非是学习了一堆哈里波特然后“预测”下一个字,句是啥。然后用输出的
: 字当输入,迭代就能写出洋洋洒洒一大段。同样的炒股也是学习一堆历史股价数据,然
: 后试着预测下一个或者下面好多时间点的股价。
: :如果有空的话我真的可以train个model试一试,但是效果不见得好。Deep Learning入
: :门并不难,但是要做好需要很多经验,要靠个人修行体会。

avatar
C*5
9
这个简单,打个比方,用前100分钟的数据作input,用第101分钟的股价做
target,就可以train一个根据前100分钟预测第101天股价的mod
el。
美股有那么历史成交纪录,用100分钟的slidding window,训练数
据是海量的。而且用第2到第100分钟的已知股价+第101分钟的预测股价做输入
就可以预测第102分钟的股价,这样迭代下去你可以预测地球爆炸那天的股价,当然
越到后面越不靠谱。

【在 l********7 的大作中提到】
: 一个最基本的问题:为什么需要机器来读写小说?优势在哪?假设一大堆股市序列人都
: 学不懂,为什么指望机器能为你创造“奇迹”,帮你读懂而且书写?这种期待、并见证
: 奇迹的目标客观么?

avatar
r*e
10
这是我最不喜欢有人搞dnn的地方,什么feature也不提取,learn出来的是一坨屎
比如语音识别,不用feature learn的狗屁不是,用恰当的feature就用不上几个layer
的dnn了,一般的machine learning就行了
我不否认machine learning的用处,但现在满大街的dnn,扯淡的多
[在 CRH1235 (江左没狼) 的大作中提到:]
:Deep learning的好处是不需要人工提取feature。
:最简单的用收盘价就可以学习了,那input就是个一维(nx1)的vector(n是时间
:),当然这样效果不一定好。讲究点的可以把开盘,收盘,高点,低点,成交量等等
一起当输入,这样输入就是(nx5)的二位matrix。还有其他的也可以加进去,输入
就是(nxm),但是还是二维的。
avatar
C*5
11
根据我的体会,传统machine learning的人对deep learn
ing深恶痛绝,毕竟多年修炼的feature engineering大法
不稀罕了。一个对domain完全不了解的人可以很快捣鼓出性能差不多的mode
l。
不过deep learning的model计算比较大,传统Machine l
earning用嵌入式系统就能算得用deep learning要送到云里去算
。不过正因为这样咱才要买nvda啊。

layer

【在 r*****e 的大作中提到】
: 这是我最不喜欢有人搞dnn的地方,什么feature也不提取,learn出来的是一坨屎
: 比如语音识别,不用feature learn的狗屁不是,用恰当的feature就用不上几个layer
: 的dnn了,一般的machine learning就行了
: 我不否认machine learning的用处,但现在满大街的dnn,扯淡的多
: [在 CRH1235 (江左没狼) 的大作中提到:]
: :Deep learning的好处是不需要人工提取feature。
: :最简单的用收盘价就可以学习了,那input就是个一维(nx1)的vector(n是时间
: :),当然这样效果不一定好。讲究点的可以把开盘,收盘,高点,低点,成交量等等
: 一起当输入,这样输入就是(nx5)的二位matrix。还有其他的也可以加进去,输入
: 就是(nxm),但是还是二维的。

avatar
r*e
12
呵呵,大概如此吧
[在 CRH1235 (江左没狼) 的大作中提到:]
:根据我的体会,传统machine learning的人对deep lear
ning深恶痛绝,毕竟多年修炼的feature engineering大法不
得不稀罕了。一个对domain完全不了解的人可以很快捣鼓出性能差不多的mod
el。
:不过deep learning的model计算比较大,传统Machine
learning用嵌入式系统就能算得用deep learning要送到云里去
算。不过正因为这样咱才要买nvda啊。
:layer
avatar
y*n
13
股价(包括高低价和成交量)都是结果。你拿一大堆结果去预测下一个结果是没有答案
的。不管是人,还是NN,都没用。
你除非拿经济新闻的参数当input,或许还靠谱些。不过结果肯定和语音和围棋象棋不
一样,因为其他投资者的贪婪或恐慌的情绪很难预测。这种训练出来的算法还是没人敢
用,因为将来的新闻相当有一部分是过去没有发生过的新事物,所以NN算出来的预算是
没用价值的。
avatar
C*5
14
也许吧。不过试试才知道。股价在某种程度上还是能预测的吧,要不然街上那么多矿工
是干吗的?

【在 y********n 的大作中提到】
: 股价(包括高低价和成交量)都是结果。你拿一大堆结果去预测下一个结果是没有答案
: 的。不管是人,还是NN,都没用。
: 你除非拿经济新闻的参数当input,或许还靠谱些。不过结果肯定和语音和围棋象棋不
: 一样,因为其他投资者的贪婪或恐慌的情绪很难预测。这种训练出来的算法还是没人敢
: 用,因为将来的新闻相当有一部分是过去没有发生过的新事物,所以NN算出来的预算是
: 没用价值的。

avatar
C*5
15
语音的用CNN + RNN组合效果挺好的。识别率可以到99%。

layer

【在 r*****e 的大作中提到】
: 这是我最不喜欢有人搞dnn的地方,什么feature也不提取,learn出来的是一坨屎
: 比如语音识别,不用feature learn的狗屁不是,用恰当的feature就用不上几个layer
: 的dnn了,一般的machine learning就行了
: 我不否认machine learning的用处,但现在满大街的dnn,扯淡的多
: [在 CRH1235 (江左没狼) 的大作中提到:]
: :Deep learning的好处是不需要人工提取feature。
: :最简单的用收盘价就可以学习了,那input就是个一维(nx1)的vector(n是时间
: :),当然这样效果不一定好。讲究点的可以把开盘,收盘,高点,低点,成交量等等
: 一起当输入,这样输入就是(nx5)的二位matrix。还有其他的也可以加进去,输入
: 就是(nxm),但是还是二维的。

avatar
l*n
16
是啊,真的要做好估计可以写篇论文或申请个专利了:)
刚开始学,感觉black box效果不会好,需要经验和优化, 比如说
1. sigmoid (logistic) function 用在股价数据(连续)是否合适?
2. 怎么搭architecture效果更好
3. 怎么tune parameters, 要不要weight decay?
建好模型,data 倒是好多,历史数据, 相关股票的信息,把政治因素突发事件考虑进
去都有可能 (以前也加过息啊,竞选过总统啊,把那段时间的数据拿来learn一下不就
行了)

【在 C*****5 的大作中提到】
: 我所知道的本质上差不多。用的都是一种叫Long-Short Term Memory(LSTM)的神经网络
: 。写小说无非是学习了一堆哈里波特然后“预测”下一个字,句是啥。然后用输出的字
: 当输入,迭代就能写出洋洋洒洒一大段。同样的炒股也是学习一堆历史股价数据,然后
: 试着预测下一个或者下面好多时间点的股价。
: 如果有空的话我真的可以train个model试一试,但是效果不见得好。Deep Learning入
: 门并不难,但是要做好需要很多经验,要靠个人修行体会。

avatar
l*7
17
我理解你对DNN的热情,呵呵。嗯,时间序列的预测都是这类temporal embedding的做
法,具体怎么构建高维矢量,五花八门。
虽然我没做过股票的数据,不知道具体做股价序列预测有多靠谱;但是,我的要点不是
反对DNN可以用来做black-box建模,而是想说,对于高维随机矢量的时间序列建模,
(严格来说)没任何客观证据,表明DNN就是远远超越其他建模技术的银枪银弹。DNN唯
一抓住了大家眼球的,是似乎模拟了人脑神经网络的一种“神奇”技术,而事实远不是
这样。本质上,一个训练好的DNN,就是一个(deterministic)的函数映射,所以更客
观的名称是“人工神经网络”(ANN,Artificial NN),或者更客观点,function
approximator;而如何训练出这样一个最优化的函数映射,来一般性地表达时间序列动
力演化的“所有”模式,就是这类序列学习问题的关键难点(generalization)。凭良
心说,把人脑神经网络简化到这样,能在多大意义上真正“模拟”了人脑的智能呢?也
许可以说,在某些问题上,ANN模仿了人脑的某一个非常狭窄的方面的智能。
如果你用ANN建模,并且多和其他建模技术对比,这里特指时间序列的预测,你可以自
己客观地评判,是否DNN有绝对的优势。据我做论文(图形时间序列和文本序列建模)
的经验,ANN作为一类非线性模型,并不绝对地优于其他“时间”序列模型(比如线性
、贝叶斯动力模型、HMM等等)。所以,在这个意义上,DNN不是银枪银弹,站在商业投
资和应用开发角度,一股(没)脑地强调一项单一的技术(虽然DNN的确很酷),是一
个不客观的hype行为。
我只希望提供个人的经验和观点,可能有很多局限。

【在 C*****5 的大作中提到】
: 这个简单,打个比方,用前100分钟的数据作input,用第101分钟的股价做
: target,就可以train一个根据前100分钟预测第101天股价的mod
: el。
: 美股有那么历史成交纪录,用100分钟的slidding window,训练数
: 据是海量的。而且用第2到第100分钟的已知股价+第101分钟的预测股价做输入
: 就可以预测第102分钟的股价,这样迭代下去你可以预测地球爆炸那天的股价,当然
: 越到后面越不靠谱。

avatar
l*7
18
传统machine learning里,一个很重要的方向就是NN,而且NN的基本原理就是和特征自
动提取相吻合的。这个在Hinton最早的一篇文章和书里就重点阐述了。

【在 C*****5 的大作中提到】
: 根据我的体会,传统machine learning的人对deep learn
: ing深恶痛绝,毕竟多年修炼的feature engineering大法
: 不稀罕了。一个对domain完全不了解的人可以很快捣鼓出性能差不多的mode
: l。
: 不过deep learning的model计算比较大,传统Machine l
: earning用嵌入式系统就能算得用deep learning要送到云里去算
: 。不过正因为这样咱才要买nvda啊。
:
: layer

avatar
l*7
19
作为佐证DNN(这里你提到的LSTM-RNN)不是写小说的唯一银弹,甚至最简单的Markov
-chain Model都可能写出好玩的“小说”,这个是很古老的了,比如可以参见:
Kernighan & Pike“he Practice of Programming”

【在 C*****5 的大作中提到】
: 我所知道的本质上差不多。用的都是一种叫Long-Short Term Memory(LSTM)的神经网络
: 。写小说无非是学习了一堆哈里波特然后“预测”下一个字,句是啥。然后用输出的字
: 当输入,迭代就能写出洋洋洒洒一大段。同样的炒股也是学习一堆历史股价数据,然后
: 试着预测下一个或者下面好多时间点的股价。
: 如果有空的话我真的可以train个model试一试,但是效果不见得好。Deep Learning入
: 门并不难,但是要做好需要很多经验,要靠个人修行体会。

avatar
C*5
20
莱布妮子是行家啊。我是关公门口耍牙签了。以后还望不吝赐教啊。

Markov

【在 l********7 的大作中提到】
: 作为佐证DNN(这里你提到的LSTM-RNN)不是写小说的唯一银弹,甚至最简单的Markov
: -chain Model都可能写出好玩的“小说”,这个是很古老的了,比如可以参见:
: Kernighan & Pike“he Practice of Programming”

avatar
y*d
21
四维,我现在的理解是思维


: 你先得找股市的feature才有可能learn,问一下股市是多少维的?

: [在 CRH1235 (江左没狼) 的大作中提到:]

: :我所知道的本质上差不多。用的都是一种叫Long-Short Term Memory(LSTM)的
神经网

: 络。写小说无非是学习了一堆哈里波特然后“预测”下一个字,句是啥。然后用
输出的

: 字当输入,迭代就能写出洋洋洒洒一大段。同样的炒股也是学习一堆历史股价数
据,然

: 后试着预测下一个或者下面好多时间点的股价。

: :如果有空的话我真的可以train个model试一试,但是效果不见得好。Deep
Learning入

: :门并不难,但是要做好需要很多经验,要靠个人修行体会。



【在 r*****e 的大作中提到】
: 呵呵,大概如此吧
: [在 CRH1235 (江左没狼) 的大作中提到:]
: :根据我的体会,传统machine learning的人对deep lear
: ning深恶痛绝,毕竟多年修炼的feature engineering大法不
: 得不稀罕了。一个对domain完全不了解的人可以很快捣鼓出性能差不多的mod
: el。
: :不过deep learning的model计算比较大,传统Machine
: learning用嵌入式系统就能算得用deep learning要送到云里去
: 算。不过正因为这样咱才要买nvda啊。
: :layer

avatar
m*r
22

莱布妮子,这个昵称好,很配江左没狼啊。 :)

【在 C*****5 的大作中提到】
: 莱布妮子是行家啊。我是关公门口耍牙签了。以后还望不吝赐教啊。
:
: Markov

avatar
c*t
23
你说得很对,dnn对处理随机时间序列没帮助,楼主没有搞清股票信号是怎样的一种信
号,和dnn是什么特性

【在 l********7 的大作中提到】
: 我理解你对DNN的热情,呵呵。嗯,时间序列的预测都是这类temporal embedding的做
: 法,具体怎么构建高维矢量,五花八门。
: 虽然我没做过股票的数据,不知道具体做股价序列预测有多靠谱;但是,我的要点不是
: 反对DNN可以用来做black-box建模,而是想说,对于高维随机矢量的时间序列建模,
: (严格来说)没任何客观证据,表明DNN就是远远超越其他建模技术的银枪银弹。DNN唯
: 一抓住了大家眼球的,是似乎模拟了人脑神经网络的一种“神奇”技术,而事实远不是
: 这样。本质上,一个训练好的DNN,就是一个(deterministic)的函数映射,所以更客
: 观的名称是“人工神经网络”(ANN,Artificial NN),或者更客观点,function
: approximator;而如何训练出这样一个最优化的函数映射,来一般性地表达时间序列动
: 力演化的“所有”模式,就是这类序列学习问题的关键难点(generalization)。凭良

avatar
l*7
24
不要这么说,只要有兴趣交流讨论,无所谓行家、专家。有经验的人肯定有自己的局限
,更广一点,凡是个人都有自己的局限,总可以通过讨论交流获得不同视角的价值。
垃圾和无价值的类型,在我看来,只有一种,就是把脑子夹得像closed bucket一样,
除了威胁和耍大棒、还有装神弄鬼,毫无和人沟通的基本逻辑能力,本版这类的目前我
只看到一位:哪位盛产亿万的鸡精,呵呵。

【在 C*****5 的大作中提到】
: 莱布妮子是行家啊。我是关公门口耍牙签了。以后还望不吝赐教啊。
:
: Markov

avatar
C*5
25
总结的很好。

【在 l********7 的大作中提到】
: 不要这么说,只要有兴趣交流讨论,无所谓行家、专家。有经验的人肯定有自己的局限
: ,更广一点,凡是个人都有自己的局限,总可以通过讨论交流获得不同视角的价值。
: 垃圾和无价值的类型,在我看来,只有一种,就是把脑子夹得像closed bucket一样,
: 除了威胁和耍大棒、还有装神弄鬼,毫无和人沟通的基本逻辑能力,本版这类的目前我
: 只看到一位:哪位盛产亿万的鸡精,呵呵。

avatar
F*s
26
虽然你说的评语很适合你,“毫无和人沟通的基本逻辑能力”,你的这些语言在任何聚
会里都会被人冷落,不过这次不跟你计较,因为你已经毁掉了自己的思考能力,说的都
是别人的话,做的都是别人让你做的事,却声称自己是一个无政府主义者。你本该学会
在上帝面前Humble的。不过你见人就反政府,反着反着反到我头上来了,看来是觉得我
跟政府走得太近了。
----------
发信人: leibniz137 (莱布尼兹), 信区: Stock
标 题: Re: 市场布局通胀,迎接加息到来
发信站: BBS 未名空间站 (Sun Aug 21 18:47:55 2016, 美东)
我是个人财富和准无政府主义者

【在 l********7 的大作中提到】
: 不要这么说,只要有兴趣交流讨论,无所谓行家、专家。有经验的人肯定有自己的局限
: ,更广一点,凡是个人都有自己的局限,总可以通过讨论交流获得不同视角的价值。
: 垃圾和无价值的类型,在我看来,只有一种,就是把脑子夹得像closed bucket一样,
: 除了威胁和耍大棒、还有装神弄鬼,毫无和人沟通的基本逻辑能力,本版这类的目前我
: 只看到一位:哪位盛产亿万的鸡精,呵呵。

avatar
l*7
27
正好鸡精来了,我也顺便给你佐证和分析下为什么说,这个jerk毫无和人沟通的基本逻
辑能力。
######################################

分析:鸡精用的这个“因为”,没有基本的逻辑和事实依据,除了臆想,呵呵
:说的都 是别人的话,做的都是别人让你做的事,
分析:正常人肯定看不懂这句话的,思维跳跃太大。“别人”是谁,估计这个鸡冻脑子
全是鸡冻。
分析:我厌恶鸡精这种jerk,因为我讨厌任何一个不会理性和人交流,只会装大神、拿
政府和“法律”来威胁他人的蠢货,所以推论出我认为鸡精“跟政府走得太近了”?这
种推论缺乏基本逻辑联系,又一样,除了自己的臆想。
####################

【在 F****s 的大作中提到】
: 虽然你说的评语很适合你,“毫无和人沟通的基本逻辑能力”,你的这些语言在任何聚
: 会里都会被人冷落,不过这次不跟你计较,因为你已经毁掉了自己的思考能力,说的都
: 是别人的话,做的都是别人让你做的事,却声称自己是一个无政府主义者。你本该学会
: 在上帝面前Humble的。不过你见人就反政府,反着反着反到我头上来了,看来是觉得我
: 跟政府走得太近了。
: ----------
: 发信人: leibniz137 (莱布尼兹), 信区: Stock
: 标 题: Re: 市场布局通胀,迎接加息到来
: 发信站: BBS 未名空间站 (Sun Aug 21 18:47:55 2016, 美东)
: 我是个人财富和准无政府主义者

avatar
l*7
28
娱乐🐎,少废话,有种你就给大伙爆我的猛料,否则少意淫,早点滚蛋。

【在 F****s 的大作中提到】
: 虽然你说的评语很适合你,“毫无和人沟通的基本逻辑能力”,你的这些语言在任何聚
: 会里都会被人冷落,不过这次不跟你计较,因为你已经毁掉了自己的思考能力,说的都
: 是别人的话,做的都是别人让你做的事,却声称自己是一个无政府主义者。你本该学会
: 在上帝面前Humble的。不过你见人就反政府,反着反着反到我头上来了,看来是觉得我
: 跟政府走得太近了。
: ----------
: 发信人: leibniz137 (莱布尼兹), 信区: Stock
: 标 题: Re: 市场布局通胀,迎接加息到来
: 发信站: BBS 未名空间站 (Sun Aug 21 18:47:55 2016, 美东)
: 我是个人财富和准无政府主义者

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。