[세이버메트릭스] WPA(Winning Probability Added): 얼마나 승패에 영향을 미치는가, 혹은 얼마나 영양가가 높은가
영양가에 대한 논란
9회말 2사 2-2 동점에서 솔로홈런을 치면, 3-2가 되면서 게임이 끝난다. 이 홈런은 게임의 향방을 결정지은 "승리타점"이 된다. 하지만, 9회초 15-0으로 앞서 있는 상황에서 솔로홈런을 치면, 16-0이 된다. 15-0이나 16-0이나 어차피 이길 확률이 100%에 가까운 것은 마찬가지이므로, 이 홈런은 게임의 향방과는 거의 관계가 없는 홈런이다. 소위 홈런의 "영양가"가 다른 것이다.
HR, RBI, OBP, SLG, OPS, RC, wOBA, EqA 등 우리가 사용하는 거의 모든 스탯은 이 두 홈런을 똑같은 가치로 취급한다. 시즌 기록으로 생각하면, 한 시즌은 꽤 긴 기간이므로, "영양가 있는 순간"과 "영양가 없는 순간"은 상당 부분 상쇄될 것이다. 또한, 클러치 능력이라는 게 랜덤에 가깝다는 주장을 수용한다면, 올해에 "영양가 있는 적시타"를 유난히 많이 쳤다고 해서 내년에도 그러리라는 보장은 없는 것이다. 따라서, 일반적으로 선수의 능력을 판단할 때에는 위의 스탯들을 사용하는 것으로 별 무리가 없다.
하지만, 그 "영양가"를 구체적으로 따져보고 싶은 경우에는 어떻게 해야 할까? 예를 들어 특정 경기의 수훈 선수를 한 명 꼽고 싶다면? 위의 스탯들로는 해결이 불가능하다. 이럴 때 사용하면 좋은 것이 바로 WPA(Win Probability Added) 이다.
WE(Win Expectancy)에 대한 복습
WE에 대해서는 이미 이전 포스팅에서 소개한 바 있다.
Insidethebook 사이트에 공개되어 있는 표를 이용하여 다시 복습을 해 보자.
Inning: 6, Top
1B | 2B | 3B | Out | -4 | -3 | -2 | -1 | Tie | 1 | 2 | 3 | 4 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
— | — | — | 0 | 0.089 | 0.146 | 0.230 | 0.348 | 0.500 | 0.651 | 0.769 | 0.854 | 0.911 |
— | — | — | 1 | 0.097 | 0.158 | 0.249 | 0.375 | 0.534 | 0.690 | 0.802 | 0.879 | 0.929 |
— | — | — | 2 | 0.103 | 0.167 | 0.263 | 0.394 | 0.560 | 0.717 | 0.825 | 0.896 | 0.941 |
1B | — | — | 0 | 0.078 | 0.128 | 0.204 | 0.310 | 0.448 | 0.594 | 0.717 | 0.812 | 0.881 |
1B | — | — | 1 | 0.089 | 0.145 | 0.230 | 0.347 | 0.498 | 0.649 | 0.766 | 0.852 | 0.910 |
1B | — | — | 2 | 0.099 | 0.161 | 0.253 | 0.380 | 0.542 | 0.697 | 0.808 | 0.884 | 0.932 |
— | 2B | — | 0 | 0.069 | 0.114 | 0.182 | 0.280 | 0.410 | 0.557 | 0.689 | 0.793 | 0.868 |
— | 2B | — | 1 | 0.083 | 0.136 | 0.216 | 0.327 | 0.473 | 0.625 | 0.749 | 0.840 | 0.902 |
— | 2B | — | 2 | 0.095 | 0.155 | 0.244 | 0.368 | 0.526 | 0.682 | 0.797 | 0.876 | 0.928 |
— | — | 3B | 0 | 0.058 | 0.098 | 0.158 | 0.247 | 0.369 | 0.517 | 0.662 | 0.774 | 0.856 |
— | — | 3B | 1 | 0.071 | 0.118 | 0.189 | 0.291 | 0.427 | 0.582 | 0.719 | 0.820 | 0.889 |
— | — | 3B | 2 | 0.093 | 0.152 | 0.240 | 0.362 | 0.519 | 0.675 | 0.793 | 0.873 | 0.926 |
1B | 2B | — | 0 | 0.062 | 0.102 | 0.164 | 0.253 | 0.372 | 0.506 | 0.633 | 0.742 | 0.827 |
1B | 2B | — | 1 | 0.078 | 0.127 | 0.202 | 0.308 | 0.445 | 0.590 | 0.711 | 0.806 | 0.877 |
1B | 2B | — | 2 | 0.092 | 0.151 | 0.238 | 0.358 | 0.513 | 0.665 | 0.780 | 0.862 | 0.917 |
1B | — | 3B | 0 | 0.051 | 0.085 | 0.139 | 0.218 | 0.327 | 0.463 | 0.602 | 0.720 | 0.813 |
1B | — | 3B | 1 | 0.067 | 0.111 | 0.178 | 0.274 | 0.402 | 0.548 | 0.682 | 0.786 | 0.864 |
1B | — | 3B | 2 | 0.089 | 0.146 | 0.231 | 0.349 | 0.500 | 0.652 | 0.770 | 0.855 | 0.912 |
— | 2B | 3B | 0 | 0.046 | 0.078 | 0.127 | 0.201 | 0.303 | 0.431 | 0.569 | 0.695 | 0.795 |
— | 2B | 3B | 1 | 0.062 | 0.102 | 0.165 | 0.255 | 0.377 | 0.517 | 0.652 | 0.764 | 0.848 |
— | 2B | 3B | 2 | 0.087 | 0.143 | 0.226 | 0.341 | 0.490 | 0.639 | 0.757 | 0.845 | 0.906 |
1B | 2B | 3B | 0 | 0.042 | 0.071 | 0.116 | 0.183 | 0.277 | 0.395 | 0.523 | 0.644 | 0.748 |
1B | 2B | 3B | 1 | 0.060 | 0.099 | 0.159 | 0.245 | 0.362 | 0.495 | 0.622 | 0.731 | 0.818 |
1B | 2B | 3B | 2 | 0.084 | 0.137 | 0.217 | 0.328 | 0.471 | 0.617 | 0.733 | 0.823 | 0.888 |
위의 표는 홈팀의 입장에서 6회초의 각 상황별로 기대 승률, 즉 Win Expectancy를 표시한 것이다. 즉, 6회초에 동점이고 무사에 주자가 없는 경우(위 표의 빨간색 글씨), 홈팀이 이 경기를 이길 확률은 정확히 0.5 이다. 하지만, 홈팀이 원정팀에게 1점 뒤진 상태에서 2사 3루의 상황을 맞이한 경우(위 표의 파란색 글씨), 홈팀이 최종적으로 이 경기를 이길 확률은 0.362 로 내려간다.
이 표는 Run Environment가 5.0인 상황, 즉 각 팀별로 경기당 평균 5점씩 득점하는 리그를 기준으로 한 것이다. 이 Run Environment가 바뀔 경우에는 WE Matrix도 바뀌게 된다.
아래 엑셀파일은 Tom Tango의 웹사이트에 걸려 있는 외부 링크에서 집어온 것이다. (출처는 여기)
파일 안에 있는 "BigTable" sheet가 바로 Run Environment=4.5일 때의 Win Expectancy 표이다. 위의 표와 6회초 부분을 비교해 보면 숫자가 조금씩 다름을 알 수 있다. 1점을 득점하거나 실점하는 경우 첨부파일의 WE가 더 크게 변하는 것을 볼 수 있는데, Run Environment가 작으므로(=게임당 평균득점이 적음) 1점의 위력이 더 큰 것이다.
WPA : Win Probability Added
WPA는 Win Probability Added의 약자로, 단어 안에 그 의미가 이미 드러나 있다. 즉, 기대 승률이 변화한 정도를 나타내는 것이다.
이런 상황이 9회에서 발생했다면 어떻게 다를까? 9회초 노아웃에 무사, 동점인 상황에서 선두타자에게 홈런을 허용한 경우 홈팀의 기대 승률은 50%에서 16.2%로 크게 떨어진다. 여기에서 타자와 투수가 얻게 되는 WPA는 각각 +0.338, -0.338에 달한다. 6회초의 홈런에 비해 2배 이상 높은 것이다. 그만큼 같은 동점이라도 9회초의 홈런이 6회초의 홈런에 비해 훨씬 크게 승부를 좌우한다는 의미이다. 즉, 홈런의 "영양가"가 더 높은 것이다.
9회말, 홈팀이 3점 뒤진 상황에서 2사 만루에 타석에 들어섰다면, 이때 홈팀의 승률은 9.1%에 불과하다. 그런데, 여기서 만루홈런을 쳐서 역전승을 거뒀다면, 승리를 거두었으므로 기대승률은 100%가 되어 이 타석의 WPA는 +0.909에 달한다. 그야말로 영양가 만점이라고 할 수 있을 것이다.
이번에는 원정팀이 6점 앞서 있는 상황에서 9회초를 시작하는 것을 가정해 보자. 이때 홈팀의 승률은 0.3%에 불과하다. 여기에서 원정팀의 선두타자가 홈런을 쳐서 7점차로 벌어지면, 홈팀의 승률은 0.1%로 떨어진다. 같은 홈런이지만, 이 타석에서 타자의 WPA는 +0.002에 불과하다. 어차피 이길 확률이 매우 높은 상황이었으므로 영양가가 거의 없는 홈런이다. 같은 홈런인데도 이렇게 차이가 나는 것이다.
선수별 WPA는 Fangraphs에서 찾아볼 수 있다. 또한, Fangraphs는 메이저리그 정규시즌 및 포스트시즌에서 모든 게임의 WPA 변화를 실시간으로 중계해 준다.
WPA의 장점 그리고 한계
wRAA와 같은 스탯은 해당 선수가 팀 득점에 얼마나 기여했는지를 나타내는 스탯이지만, WPA는 해당 선수가 팀 승리에 얼마나 기여했는지를 나타내는 스탯이다. WPA가 높다는 것은 그만큼 팀 승리에 결정적인 공헌을 많이 했다는 것이고, 영양가 있는 활약을 했다는 이야기가 된다. (물론 162게임의 시즌은 상당히 긴 기간이므로 wRAA가 높은 타자는 아무래도 WPA가 높게 되기 마련이지만...) 만약 MVP를 순수하게 "팀 승리에 제일 많이 기여한 선수"에게 주고자 한다면, WPA가 가장 높은 선수에게 주는 방법도 고려해 볼 수 있다.
하지만, WPA는 그 배분 방식에 문제를 가지고 있다. 예를 들어 타자가 홈런을 친 경우, 승률의 변화를 그대로 타자의 WPA에 플러스 해 주고 투수의 WPA에 마이너스 해 주면 된다. 하지만, 타자의 타구가 수비수의 어설픈 수비로 인해 안타로 연결된 경우, 이 때 승률의 변화는 어떻게 계산해 주어야 할까? 타자는 어쨌든 안타를 만들었기에 변화한 승률 만큼을 플러스 WPA로 가져가지만, 수비측은 투수의 일방적인 책임으로 보기에는 어려운 상황이다. 이 경우에는 관측자의 주관적 판단에 따라 투수와 수비수의 책임 수준을 평가하여 마이너스 WPA를 배분하게 된다. 그런데, Fangraphs의 경우는 이러한 주관적 판단을 배제하고 수비측에서 받게 되는 모든 WPA를 투수에게만 부여하고 있다. 수비수의 호수비로 안타성 타구가 아웃이 되어 플러스 WPA를 얻게 된 경우에도 투수가 이득을 보고, 수비수의 어설픈 수비로 아웃될 타구를 안타로 만들어준 경우의 마이너스 WPA도 역시 투수가 모두 가져가게 되는 것이다. 이것은 관측자의 주관적 판단으로 인한 오류를 배제하는 장점이 있고, 또한 WPA를 리얼타임으로 계산할 수 있게 해 준다. 이렇게 쉽게 계산하기 때문에 Fangraphs가 메이저리그 시즌 중에 실시간으로 각 경기의 WPA 변화를 업데이트해 줄 수 있는 것이다.
또한, WPA는 과거의 팀 기여도를 살펴보는 데에는 유용하지만, 미래를 예측하는 데에는 상당히 부적절하다. 올해 유난히 결승타를 많이 올린 선수가 있다고 해서, 내년에도 특유의 클러치 능력을 발휘하리라는 보장이 전혀 없는 것이다.
Today's Music : Fleetwood Mac - Don't Stop (Live)
Don't stop thinking about tomorrow
Don't stop, it'll soon be here
It'll be better than before
Yesterday's gone, yesterday's gone
새해를 기념하여 좀 긍정적인 분위기의 곡을 골라 보았다.
새해 복 많이 받으세요...!!!
(이 글은 한국야구팬사이트에서도 보실 수 있습니다.)