最近有2个月放空,没有沉淀一些技术上的内容,反而是调整一个工作状态,把更多的时间还原到了生活和娱乐中。当然,就目前来看,这种适当的放空收到了奇效,当时考虑业务的前景时非常的不明朗,甚至对数据质量本身的要求极度偏激,导致对团队的成员有偏见。不过在适当的休息后,这种感觉没有了,取而代之的是清晰的业务方向和思路。
为什么会这样,我想这个和我最近痴迷橄榄球NFL有关(怎么这个句式特别像广告呢)。年初的超级碗全场录像把橄榄球运动拉入了我的视野,随着2014-2015NFL新赛季的开始,我也开始关注NFL,美式橄榄球是项非常棒的运动,为什么这么说?运动本身有几个特点非常吸引人:1)高强度身体对抗——无疑这是一项男人的运动,比赛中最常见的就是身体接触。2)规则和体系非常合理,橄榄球的进攻防守规则是非常合理的,进攻组司职攻城略地,而防守组负责守卫家园,这个对于原始的战争游戏模拟的非常到位。3)策略和战术要求极高,橄榄球进攻和防守战术非常多样化,进攻端可以采用地面冲球和传球,传球的话又可以分远距离、中距离和近距离传球,传球的对象,也可以是外接或者跑卫,外接的跑动路线……说不完啊。4)数据拟合准确,当然这是让我最痴迷NFL的原因,美式橄榄球把数据运用到了极致,对于球员的指标衡量非常的准确形象。
比起拳击那样的攻击与防御,它显得安全了很多;比起网球、乒乓球这样的球类运动,就相当的刺激荷尔蒙;比起足球和篮球这样的流行运动,橄榄球的规则和完整的体系以及无可出其右的策略性,是最吸引人的。当然足球的魅力在于团队配合可以打得非常精彩,同时个人英雄的出现也可以拯救世界,但是足球里衡量运动员综合素质的指标体系实在是不够好。我个人认为像橄榄球和棒球(NFL和MLB)是最好的数据决策运动体系,好笑的是这都是美国人为之疯狂的运动,而在世界上其他国家却知之甚少。
结合橄榄球运动和数据体系构建,确实给了数据从业人员很大灵感,玩NFL Fantasy的玩家都知道每周的Pick’Em可以来预测比赛,要知道一周15场比赛完全猜对的人非常非常多,为什么?因为数据刻画形象且透明,也就是说,我们做预测,不在于算法有多牛逼,而在于指标是否足够好,模型是否足够清晰的能刻画业务本身。这是我一直在做数据挖掘强调的,但是仍然有太多太多的人纠结在算法中不能自拔……NFL有一套自己的rating算法来评估球员的素质,当然这在FM游戏里也有,但是我个人认为NFL的计算更合理,因为橄榄球运动目标性非常强,没有像足球那样过多的回传和组织,橄榄球单箭头的向前就是最好的约束条件,这为数据可操作性提供了基本保障,我个人是这么认为的。另外NFL联盟的运作也类似一个数据体系,联盟约定工资帽,不会出现过分的强弱队之分,一个队伍都是明星大牌,工资帽不允许啊,所以NFL的32支球队,大体水平相当(当然有弱队和强队,这里说的大体相当是指在一场NFL比赛预测中,没有那么明显的胜负趋势,优势微弱=属性连续、分布完美)。另外不同的战术相生相克,在场上随时可以通过暂停来及时调整,这是小步快跑实时运算的等价比喻,足球比赛一开场就至少踢45分钟,这是典型的批处理,教练有个意图都是大声喊,也不见得球员遵循,但是橄榄球就完全不同,每次攻守基本都是战术的完整体现。说起时间,因为足球篮球是连续比赛,而棒球和橄榄球则是分档进攻,这其中的区别体现在数据的可分析性以及一次操作的影响性分析上,其实是很明显的。足球的连续比赛,导致我们在分析一次进攻的成功因素时,需要考虑的变量非常的多,因为时间窗口太大——45分钟,而橄榄球是阶段性的,一次成功的推进,一定是经历一个开球-传球或跑球这样的流程,这明显是规格化的产物,谁告诉你足球进球一定要是本方守门员大脚开球到前锋射门呢?所以对于橄榄球这种阶段性运动,一次分析可以根据本身的进攻和防守阶段被拆成很多的细片,在细片上完成分析,这也符合分析的规律——样本干净且完整。这有点像分布式计算,橄榄球天生分布式,而足球只能一把搞到内存里做完全分析……
胡乱扯了一通NFL的东西,美式橄榄球运动是项极度体现智慧的运动,结合数据去玩Fantasy,更觉得其乐无穷。
回头有空,再详细举例NFL的数据故事。没准也还聊聊手游和数据的事。