第二步,产生套利信号。对比当前价差S0 与预测值ES,记套利成本为Fee,期望收益为r,则按如下情况产生套利信号(1,表示开多仓,做多价差;-1,表示开空仓,做空价差):
第三步,盘中监控与平仓。开仓后,将最新观察的数据纳入样本中,根据贝叶斯公式更新价差预测值 E S ' 。如果最新价差 S '
中信建投证券: 机器学习之贝叶斯文本分类算法的实现 解读分析: 这篇研报用的思想自然语言处理(NLP) 、朴素贝叶斯分类模型、大数据。 他们从以下几个方面获取数据: 财经新闻指数 个股新闻指数:每支股票每天对应的新闻总数。 个股情绪指数:个股情绪新闻正负面加权汇总。 宏观经济指数:通过财经文本分析,得到新闻正负面,构建加权宏观经济指数等。 股吧相关指数 个股舆情指数:统计个股相关舆情,判断正负面,加权汇总。 个股每日股吧指数:个股相关每日帖子总数。 个股每周股吧指数:个股相关每周帖子总数。 微信公众号指数 个股每日微信推送指数:个股每日被所有相关机构微信公众号推荐总次数。 微信每日推荐个股指数:所有相关机构微信公众号每日推送个股数总数。 微博相关指数 个股每日微博指数:个股相关每日微博总次数。 个股官方微博指数:个股官方微博文章总数量 个股高官微博指数:公司高管在微博发文总数及情绪加权汇总。 公司关注度指数 个股搜索指数:个股每天被百度,搜狗等主流搜索引擎被搜索次数总和。 个股访问热度指数:个股行情被用户访问总数。 个股新闻点击率指数:个股新闻被点击总数。 其它相关指标 商个股销量指数:淘宝,京东等电商个股相关商品金额总数。 电商行业销量指数:淘宝,京东等电商行业相关商品商量总数。 电商个股综合指数:淘宝,京东等电商个股相关商品的浏览量、点击量、客户评价、客户收藏量等基础数据的综合指标。 电商行业综合指数:淘宝,京东等电商行业相关商品的浏览量、点击量、客户评价、客户收藏量等基础数据的综合指标。 银联消费指数:银联刷卡相关个股或者行业数据组成的指标。 贝叶斯文本分析原理 朴素贝叶斯算法假设前提:在给定目标值时属性值之间相互条件独立。 贝叶斯方法的新实例分类目标是在给定描述实例的属性值(A1,A2...An)下,得到最可能的目标值 V。 V = arg maxP(B[j]/ A1,A2...An) 根据贝叶斯公式: V = arg maxP(A1,A2...An /B[j]) * P(B[j]) / P(A1,A2...An) 由于 P(A1,A2...An)是不依赖于 B[i]的常量,故简化为: V = arg maxP(A1,A2...An /B[j]) * P(B[j]) 因为属性值之间相互条件独立,即联合 A1,A2...An 的概率等于每个单独属性的概率乘积: Vnb = arg maxP(B[j])* ∏P(Ai | B[j]) 其中 i 为 1 到 n。Vnb 表示朴素贝叶斯输出的目标值。 朴素贝叶斯分类模型 1) 多元分布模型(muiltinomial model) (责任编辑:本港台直播) |