Redian新闻
>
我想建立一个自动选股票系统
avatar
我想建立一个自动选股票系统# DataSciences - 数据科学
c*t
1
大家看这事情可能吗?每个股票可能每天都发生很多事情
假设事情的种类是有限的,比如ABC三件事情发生了,导致
股票大跌或大涨,每天都有新的数据去不断train这个model
有没有到一个程度,可以自动利用实时数据来predict哪个
股票会大涨或大跌?我现在挑选了生物股票,就用了有限
的大约20类事件来做预测,从目前情况来看还是不错的。
请问各位有什么好建议吗?
avatar
O*O
2
举个例子?

【在 c*****t 的大作中提到】
: 大家看这事情可能吗?每个股票可能每天都发生很多事情
: 假设事情的种类是有限的,比如ABC三件事情发生了,导致
: 股票大跌或大涨,每天都有新的数据去不断train这个model
: 有没有到一个程度,可以自动利用实时数据来predict哪个
: 股票会大涨或大跌?我现在挑选了生物股票,就用了有限
: 的大约20类事件来做预测,从目前情况来看还是不错的。
: 请问各位有什么好建议吗?

avatar
x*s
3
这个东西很多金融机构都做,首先要有个爬虫程序realtime从各种渠道抓新闻,然后进
行语义分析这个事件对某个股票或者行业的影响是正面还是负面,最后制定交易策略。
有的事件影响大,马上就反应在股价里,有的影响小,市场消化可能需要半个小时,你
需要对影响进行量化然后backtest验证模型。
avatar
b*s
4
event driven trading
avatar
s*3
5
这些实时的event 刚一发生,股票的价格就已经反映出来了。你看每次财报的时候股价
的volatility多大。感觉你想通过这些event来判断很难。而且假设你可以通过NLP来分
析 正负,但是有时候你很难判断 MM的意图是什么。有的股每次财报都 under
estimate,每次都疯长,或者是beat了大跌的情况也不少见。
那种搞high frequency trading的应该有这些东西了。主要是你news里面权重占多少呢
。 TA+FA+news 怎么分配? 你说到药股,那你应该知道 VRX吧,你看看近期的走势
,感觉很难预测。。。
而且现在大部分都用机器人交易,想打败机器人必须用机器人我感觉。或者是依靠时间
和耐心,短期上基本很难
avatar
l*s
6
几个问题
1. 20个事件,如何从新闻中抽取?关键字?精确度如何
2. back-testing怎么做的 效果如何

【在 c*****t 的大作中提到】
: 大家看这事情可能吗?每个股票可能每天都发生很多事情
: 假设事情的种类是有限的,比如ABC三件事情发生了,导致
: 股票大跌或大涨,每天都有新的数据去不断train这个model
: 有没有到一个程度,可以自动利用实时数据来predict哪个
: 股票会大涨或大跌?我现在挑选了生物股票,就用了有限
: 的大约20类事件来做预测,从目前情况来看还是不错的。
: 请问各位有什么好建议吗?

avatar
j*0
7
一直想做这么个系统.
主要是在TA 上下功夫.
主要是对股票了解不多所以不知道怎么下手.
希望这个贴继续讨论下去,也可以跟大牛学习学习
avatar
H*6
8
我也有兴趣,以前有时间的时候也做过一些尝试。但对于股票知识完全是门外汉,正在
一点点积累。希望可以和大家一起讨论,共同提高。
有没有微信群,或者类似的我们可以每天讨论?
avatar
g*g
9
做event走到event对立面怎么办呢。。。
avatar
y*e
10
同有兴趣
就是对股票一窍不通正在学习中
有微信的话给个号码呀
申请加入哈
avatar
y*e
11
如果知道关键字的话可以做个template
然后通过template match搜索信息
只是不知道什么样的关键字才最重要
feature比较难琢磨呀
有feature就好搜了

【在 l*******s 的大作中提到】
: 几个问题
: 1. 20个事件,如何从新闻中抽取?关键字?精确度如何
: 2. back-testing怎么做的 效果如何

avatar
OE
13
有人有这方面的微信群么?
这种timing的模型是不太容易做的.
lz 是否可以用这些信号来做pair trading, 想办法对冲掉大盘.

【在 c*****t 的大作中提到】
: 大家看这事情可能吗?每个股票可能每天都发生很多事情
: 假设事情的种类是有限的,比如ABC三件事情发生了,导致
: 股票大跌或大涨,每天都有新的数据去不断train这个model
: 有没有到一个程度,可以自动利用实时数据来predict哪个
: 股票会大涨或大跌?我现在挑选了生物股票,就用了有限
: 的大约20类事件来做预测,从目前情况来看还是不错的。
: 请问各位有什么好建议吗?

avatar
l*s
14
靠关键字的话,如下问题无法解决:
1。一词多义;多词一以;
2.上下文语义,比如肯定否定;
3。人名地名机构名,这个不能靠穷尽的列表匹配;没有那个资源,且精确度也是问题;
4.OOV问题,即out of vocabulary词就捕捉不到了;
5.事件里面牵扯到的实体之间的关系无法查找;
6.指代消解问题。比如上一句提到Fed,下一句用they指代,但真正的事件只在第二句
里提到;
这玩意得上NLP,但开发需要大量人力物力。

【在 y******e 的大作中提到】
: 如果知道关键字的话可以做个template
: 然后通过template match搜索信息
: 只是不知道什么样的关键字才最重要
: feature比较难琢磨呀
: 有feature就好搜了

avatar
y*e
15
确实你考虑的比较周到
你说的问题,如果是漏检没捕捉到的,很难补救了
但如果是不必要的信息,倒是可以进一步筛选,再做一次feature extraction
NLP正在发展中,我没搞那个
我师弟在搞
我问他进展如何
也就那么回事
NLP噱头够,表面上很强大,发展空间很广泛
但是实际效果呢?
还处在开发中呀
要应用还得等啊!
而且我觉得越复杂的越麻烦问题越多
有时候就用简单的算法就能取得不错的效果了
当然我只是个小虾米,人蠢没办法
牛人有更好的算法

题;

【在 l*******s 的大作中提到】
: 靠关键字的话,如下问题无法解决:
: 1。一词多义;多词一以;
: 2.上下文语义,比如肯定否定;
: 3。人名地名机构名,这个不能靠穷尽的列表匹配;没有那个资源,且精确度也是问题;
: 4.OOV问题,即out of vocabulary词就捕捉不到了;
: 5.事件里面牵扯到的实体之间的关系无法查找;
: 6.指代消解问题。比如上一句提到Fed,下一句用they指代,但真正的事件只在第二句
: 里提到;
: 这玩意得上NLP,但开发需要大量人力物力。

avatar
l*s
16
NLP确实在发展中 但是在这个应用上 基本已经有比较成熟的方法了 比如NER, Co-ref
, Relation Event detection, SRL等 实际效果也很好
我说的需要投入大量人力物力 是说需要准备很多training data来建立模型。
按照目前的方法 基本上是可以保证不错的效果的 但是还是那句话 需要拖入精力做很
多数据准备工作

【在 y******e 的大作中提到】
: 确实你考虑的比较周到
: 你说的问题,如果是漏检没捕捉到的,很难补救了
: 但如果是不必要的信息,倒是可以进一步筛选,再做一次feature extraction
: NLP正在发展中,我没搞那个
: 我师弟在搞
: 我问他进展如何
: 也就那么回事
: NLP噱头够,表面上很强大,发展空间很广泛
: 但是实际效果呢?
: 还处在开发中呀

avatar
y*e
17
你后面说的这些我没接触过,所以不知道,呃

ref

【在 l*******s 的大作中提到】
: NLP确实在发展中 但是在这个应用上 基本已经有比较成熟的方法了 比如NER, Co-ref
: , Relation Event detection, SRL等 实际效果也很好
: 我说的需要投入大量人力物力 是说需要准备很多training data来建立模型。
: 按照目前的方法 基本上是可以保证不错的效果的 但是还是那句话 需要拖入精力做很
: 多数据准备工作

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。