项目背景
FBP 项目全称 FootBallPrediction, 历经 9 个月完成的足球比赛预测项目. 项目结合大数据 + 机器学习, 不断摸索开发了一款软件. 软件根据各大博彩公司赔率多维度预测足球比赛结果(包含胜和不胜). 机器学习用的是自己建立的 "三木板模型" 算法, 已在国家期刊发表论文并被万方数据库收录(三木板模型算法论文地址: 网页链接 http://wanfangdata.com.cn/ 搜索 "基于机器学习的预测算法模型及其在环评领域的应用"). 目前准确率可达 80%. 目前软件版本为 14.0.FBP 项目在 GitHub 网站已经有超过 80 人关注(网页链接 https://github.com/acredjb/FBP ), 并在自己创建的微信群里已经吸引了很多人, 并且每天均有部分人根据预测结果参考投注竞彩, 参考的人都获得了相应的收益. 现在想通过认识更多的有识之士, 一起探索如何将项目做大做强, 找到合伙人, 实现共赢.
技术实现(完整可下载开源代码: 网页链接 http://github.com/acredjb/FBP )
数据清洗
1, 只抓取主队为让球方 (上盘) 的场次, 保证数据具有一致性.
2, 只抓取主队胜赔, 作为影响因子.
3, 过滤掉蚊子肉, 将 Oddset<1.45 或伟德 < 1.45 的场次过滤掉.
机器学习
FBP 项目中的核心模型: 三木板模型 (参考万方数据库论文), 即任意选取三家菠菜公司的赔率作为组合对象与历史数据的三家比较, 统计出历史数据标签 y/n(胜 / 不胜) 的数量, 并输出符合条件 "y>n*3 或 n>y*3" 的结果(3 为参数, 目前尚未调整过此参数, 可根据算法模型及评估结果适时调整). 此结果作为选择信心场次的依据.
其余 KNN,bagging, 反向传播等算法参考详细设计书.
评估模型
用正向激励和反向激励统计出哪些组合对比赛结果有较大的影响, 作为今后选择信心场次的优先依据.
优势
准确率高, 达到 80% 左右不断更新预测模型的数据, 随着历史数据的不断更新, 不断迭代修正原始模型, 符合机器学习中的反向传播算法理论, 准确率会不断提高, 并稳定在高准确率不受个人情绪影响, 完全由程序输出看好的比赛对比同行公众号推荐: 大多数都是人为看盘口, 现在是人工智能时代, 必定被机器学习淘汰. 别的公众号推篮球, 足球, 足球还推让 2 球, 大小球, 角球, 能有那么多精力, 很难相信做的专业. 甚至还有推荐让平让负双选, 最后还是预测错误. FBP 程序只预测主队为上盘的比赛, 只推胜或不胜(也就是让负), 简约而不简单. 高赔率优势, 赔率一般在 1.8-2.2 之间. 最重要的一点: 程序给出当天预测的信心指数, 完全数据量化的数值, 根据指数的大小分配投资金额. 目前三次 > 9.0 的全部命中. 时间早, 可以提前 1 天做出程序预测不受操盘手影响, 无视盘口的变化预测模型是一个 "历史赔率组合不断迭代修正" 的过程, 符合机器学习中的反向传播算法理论, 以大数据赔率组合情况产生的结果做预测系统化的方式描述预测规则, 处理历史数据, 观察预测在过去的表现如何, 进而根据具体结果合理的改进这些预测规则还会结合新的规则, 程序目前可能忽略的预测规则(如程序 1.0 版本只考虑了各大菠菜公司的赔率, 程序 2.0 就增加了联赛的维度, 程序 3.0 又增加了阶段性数据作为新的预测规则), 此时的程序预测能力就提高了很多, 更精确, 更快, 更不受情绪干扰并不是盲从程序的建议, 而在程序预测的同时, 本人也进行分析(结合基本面尤其是历史交锋), 然后对二者进行对比. 当程序的决策与我不同, 我会追溯原因并总结.
技术支持
GitHub 网站: 网页链接 https://github.com/acredjb/FBP
Kaggle 网站: 网页链接 https://www.kaggle.com/FootballPrediction
微信号: acredjb
公众号: AI 金胆
来源: http://www.bubuko.com/infodetail-3116027.html