巴西奪冠可能性最大?牛津?qū)W者用統(tǒng)計(jì)模型預(yù)測(cè)世界杯比賽****
(來(lái)源:PLoS One)論文中指出,在該模型中,每個(gè)球隊(duì)的進(jìn)球數(shù)都可以被換算成泊松概率分布。并且,通過(guò)該模型可以統(tǒng)計(jì)出球隊(duì)在比賽過(guò)程中的進(jìn)球個(gè)數(shù),其均值取決于球隊(duì)的進(jìn)攻和防守能力。實(shí)際比賽的過(guò)程中,除了雙方的綜合實(shí)力,還受運(yùn)氣等外在因素影響,因此結(jié)果具有不確定性??紤]到這點(diǎn),在用“雙泊松”模型描述球隊(duì)水平時(shí),會(huì)提前設(shè)置“進(jìn)攻”與“防守脆弱性”指數(shù)。其中,“進(jìn)攻”指數(shù)越高表示球隊(duì)進(jìn)球越容易,“防守脆弱性”指數(shù)則相反,越高表示進(jìn)球越難。在獲得“進(jìn)攻”與“防御脆弱性”指數(shù)后就能算出“泊松概率分布”平均值?!半p泊松”模型中設(shè)定不同的球隊(duì)可以根據(jù)各自不同的“雙泊松”過(guò)程得分,并將 A 和 B 球隊(duì)的預(yù)期進(jìn)球得分設(shè)定為 μ(A,B)。需要注意的是,統(tǒng)計(jì)模型在計(jì)算的過(guò)程中會(huì)將進(jìn)球速度看做是恒定的,也不考慮進(jìn)球的具體時(shí)間,只需要考慮進(jìn)球數(shù)。此外,“泊松概率分布”的計(jì)算過(guò)程使用了“無(wú)記憶”假設(shè),即一個(gè)進(jìn)球不會(huì)影響比賽其余的進(jìn)球數(shù)。這些通常是模型的潛在錯(cuò)誤來(lái)源。圖 | 各國(guó)贏球概率預(yù)測(cè)(來(lái)源:Matthew Penn)同樣值得注意的是,在這個(gè)模型中,沒(méi)有對(duì)主客場(chǎng)比賽進(jìn)行區(qū)分。也就是說(shuō),無(wú)論比賽在哪里進(jìn)行,A 隊(duì)對(duì) B 隊(duì)的預(yù)期進(jìn)球數(shù)都將等于 μ(A,B)。這是一個(gè)簡(jiǎn)化的假設(shè),不僅減少了參數(shù)的數(shù)量,而且避免了小數(shù)據(jù)集的過(guò)度擬合。事實(shí)上,由于不同球隊(duì)之間的相關(guān)聯(lián)結(jié)果數(shù)量很少(其中許多球隊(duì)根本沒(méi)有進(jìn)行過(guò)比賽),會(huì)根據(jù)情況減少模型中的參數(shù)數(shù)量。預(yù)估球隊(duì)分?jǐn)?shù)接下來(lái),在計(jì)算不同球隊(duì)預(yù)計(jì)進(jìn)球數(shù)的過(guò)程中,模型默認(rèn)球員都按照最理想的情況發(fā)揮。“預(yù)計(jì)進(jìn)球數(shù)”等于 A 球隊(duì)的進(jìn)攻指數(shù)乘以 B 球隊(duì)的防守脆弱性指數(shù),在計(jì)算 B 球隊(duì)的進(jìn)球數(shù)過(guò)程中也是如此。例如,A 球隊(duì)的進(jìn)攻指數(shù)是 8,防守脆弱性指數(shù)是 0.4;B 球隊(duì)進(jìn)攻指數(shù)是 10,防守脆弱性指數(shù)是 0.6,雙方的得分為 4.8:4(模型默認(rèn)為 5:4)。但是,由于比賽過(guò)程中充滿不確定因素,A 隊(duì) 4.8 的進(jìn)球數(shù)與 B 隊(duì) 0.6 的進(jìn)球數(shù)都被當(dāng)做平均泊松概率分布。所有比分的概率大小取決于兩個(gè)進(jìn)球數(shù)概率值的乘積。A 和 B 球隊(duì)攻擊力和防守脆弱性指數(shù)都是根據(jù)球隊(duì)過(guò)去的表現(xiàn)與分?jǐn)?shù)綜合地確定,需要不斷更新與調(diào)整,將預(yù)測(cè)的柏松概率分布數(shù)值與比賽中實(shí)際獲得的分?jǐn)?shù)匹配。(來(lái)源:Pixabay)因此,在實(shí)際預(yù)測(cè)過(guò)程中,球隊(duì)可能出現(xiàn)的分?jǐn)?shù)都會(huì)被預(yù)測(cè)出來(lái),最后可以預(yù)估出奪冠的球隊(duì)。馬修·佩恩在牛津大學(xué)官網(wǎng)上表示:“雙柏松統(tǒng)計(jì)模型預(yù)測(cè)了一百萬(wàn)次球賽,得出世界杯十六強(qiáng)晉級(jí)****及冠軍歸屬。根據(jù)預(yù)測(cè)結(jié)果,荷蘭、伊朗、阿根廷、丹麥、西班牙、克羅地亞、巴西等球隊(duì)會(huì)進(jìn)入十六強(qiáng)。阿根廷進(jìn)入四強(qiáng),巴西將在四分之一決賽時(shí)淘汰西班牙?!?/span>
來(lái)源:麻省理工評(píng)論
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。