Skip to content

SnakeWayne/PHBS_2020_BigData

Repository files navigation

PHBS_2020_BigData

homeword and projects

分工

  1. 方闻数据组的任务就是切数据,因为数据列其实比较有限,我们需要变着花样来切我们的数据,有特征工程那味,多整点这部分在整个pre过程中也有的讲。
    具体分类如下 :
    1.1 不同时间尺度 :1S与1min内的时间切片(探究不同时间尺度下的预测能力,其他的1min时间尺度可以在本地根据数据自行重组)
    1.2 不同的切片标准:不用必须按照时间尺度来切分,有资料显示按照固定成交额或者成交笔数来切具有更好的预测效果,比如每成交1000手切一次。
    1.3 非价量信息:刚才说的属于行上如何划分,对于列上也可以发散思维,比如统计这段时间内的主动买单与卖单个数,占这段时间的成交笔数的比例差之类的。或者完成某个某个固定交易量所用的时间。1.1,1.2都可以切同样的常见的OHLC数据,但是1.3需要结合具体的交易策略来给出需求。所有的切好的数据整理到本地时,最好能整合成方便后续处理的格式,比如一股一天一csv文件,列为特征,行为时间。或者一特征一天一csv文件(推荐),列为股票代码,行为时间。有些整合工作可在mapreduce阶段完成,请参考:https://blog.csdn.net/chuxingbubian/article/details/84555996

  2. 策略组@王子雄 雄和我分别是策略一组和二组:主要利用方闻的结果生成策略。
    可选的点有:
    2.1 对于同一策略使用不同的数据粒度探究表现变化:比如1min到5min的切片的预测能力以及预测几分钟IC最高,生成策略之后一天几次换手,累计收益最高。
    2.2 模型的选择:单因子,多因子,fama截面orbarra,或者机器学习预测
    2.3:特异性模型:虽然2.1和2.2可以通过排列组合的方式混搭,但是有些就是用高频信息做日频数据的信息,比如我就使用每日最后三分钟成交的主动买卖单量做反转策略,每天交易一次。可以参考这些研报以获取一些思路:https://robo.datayes.com/v2/details/report/4010161?tab=original https://robo.datayes.com/v2/details/report/3971861?tab=original

我们两个可以一组做2.1*2.2的一个组合 一组做2.3,时间允许的话再对调让任务加一倍。我的个人想先做2.3

推荐使用python进行后续处理,方便调用模型,累计收益曲线类的图如果不想手画可以使用pyfinance包来出图。

关于扣费:如果想要收益率曲线做的好看,在高换手率下可能需要考虑细节,例如不换仓时就不对股票扣除手续费。

是否多空,还是纯多,要不要多空相等等不做要求

两个策略组之间不需要代码统一。本次时间紧,对各位的代码规范不做要求,但是还是要提交到gitub上:https://github.com/SnakeWayne/PHBS_2020_BigData, 每个组建立自己的文件夹即可

后续的ppt编排也基本上按照分工的思路顺序走就ok了。

  1. 时间安排:
    11.8:晚,数据组尝试切片1.1与1.2,策略组进行策略规划
    11.9:策略组提出数据需求,数据组给出响应反馈,策略组开始构建项目
    11.10:基本上完成策略构建,如果完成的比较顺利,可以适当新增策略
    11.11:策略调优,画ppt
    根据实际情况可后延到周四上午。

About

homeword and projects

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published