运动分析有相当一部分属于机器学习,即从数据中研究战术和能力。
这与其他机器学习应用程序相同,为了评估战术,我们只看这种战术的预测性能。不否认棒球中的内场转移防守战术是对付极端击球手(如Joc Pederson或Altuve)的绝佳战术,只是因为它恰好被一个打得不好的球逆转,因为我们可以从数据中发现,这种战术对于这类击球手未来的预期表现更强。去左边的牛棚被左边的马特奥尔森射中?这个选择是正确的,数据也告诉我们,马特奥尔森在左路投篮的预期表现比右路要差很多:99 vs 144 wRC,左路投篮的表现只有右路的69%。
一个常规赛强势的铁牛投手三天前炸了2分,这场比赛继续去高杠杆局,结果又炸了?垃圾调度,投手心态炸了,不断投高杠杆。一个强壮的铁牛投手三天前上场,轰了2分。这局继续去高杠杆局,结果是三上三下?好的调度,好的投球内容/偶尔几投不中,运气不好,给球员信心。领先2分,0出局,二垒有人,二击不中,不碰,最后没分?垃圾调度,战术技能,推进技能。2分领先,0出局,2垒,有人没打中,第二次打中,打中,最后直接接触失败,打中一个小飞球?这也是一种垃圾战术。一切都是为了中锋,打击和不信任球员。反正摸嘴摸皮肤的时候,一切都是合理的;我有键盘,全世界都有。
即使单个事件的概率很低,当我们多次观察这些事件时,也不一定很低。连续7次为正的概率是不是很小(~0.8%)?然而,如果我们观察到100次正反概率各为一半的硬币翻转,则至少有一次连续出现7次正概率的概率约为32%。如果你观察1000次呢?那是98%!如果把范围拉长,比如你看一个赛季的数据,看输赢,看投手和打者,那么真的有那么多数据供你观察。也就是说,如果你深挖一个赛季的数据,你总会发现一些奇怪的事情发生的概率很大。如上所述,抛硬币的结果纯粹是随机的,显然对未来没有预测作用。
或者,有足够有说服力的实验数据具备预测未来的能力。有很多这样的。物理定律,从量子力学到天体物理学,都需要实验证据来说话。药物研发往往需要一个完整的、多周期的试验,证明对未来有可接受副作用的患者有效,才能通过FDA的严格检查。顺便说一句,这个要求与这个科学研究的对象是自然科学还是社会科学无关。事实上,正规的社会科学研究,如心理学、(计算)语言学或现代微观经济学,至少需要和许多自然科学一样多的预测能力,甚至更为严谨。