앞에서 "WPA(Winning Probability Added)"를 살펴본 바 있다.

WPA는 이미 벌어진 일에 대한 평가이다. 어떤 이벤트(홈런, 병살, 삼진, 볼넷 등...)가 벌어졌을 때, 그 이벤트로 인해 해당 팀의 기대 승률이 얼마나 변했는지를 통해, 해당 이벤트가 승부에 끼친 영향력의 정도를 평가하는 것이다.

그렇다면, 현재 타석에 들어선 타자가 승부에 끼칠 수 있는 영향력의 정도는 어떻게 되는 것일까? 이 타자의 타석에서 벌어질 수 있는 여러 이벤트들과 그들로 인하여 변하게 되는 WPA의 변화 정도를 가중 평균하면 해당 타석에서 평균적으로 일어나는 WPA의 변화 수준을 얻을 수 있는 것이다. 이것이 바로 특정 순간이 승부에 미치는 중요도, 즉 LI(Leverage Index) 이다.

WPA나 LI는 Tom Tango의 발명품이므로, 그가 The Hardball Times에 직접 기고한 예를 가지고 LI를 이해하여 보자.

9회 초, 홈팀이 원정팀에 3점 차로 앞서 있다. 노아웃에 주자 1, 2루. 원정팀이 한 방으로 경기의 흐름을 바꿀 수도 있는 상황이다. 메이저리그에서, 이러한 상황에 놓인 홈팀이 결국 이 경기를 승리로 가져갈 확률은 경험적으로 0.841이다. 예를 간단하게 하기 위해, 여기에서 원정팀의 타자가 타격을 했을 때, 결과는 안타와 삼진 밖에 없다고 하자. 안타를 치면 원정팀이 1점을 득점하며, 상황은 무사 1, 3루로 바뀐다. 반면, 삼진을 당하면 1사 1, 2루가 된다. (Tango의 예에서는 "안타"와 "주자가 진루하지 않는 아웃"이므로, 그냥 아웃을 삼진이라고 표현하였다.) 이 타자는 33%의 확률로 안타를 치고 67%의 확률로 삼진을 당한다고 하자.

이 타자가 안타를 쳐서 2점차에 무사 1, 3루가 되면, 홈 팀의 WPA는 0.701로 내려가게 되어 원래 WPA에서 0.140이 감소한다. 반면, 이 타자가 삼진을 당해서 3점차에 1사 1, 2루가 되면, 홈 팀의 WPA는 0.910으로 올라가게 되어 원래 WPA에 비해 0.069가 증가한다.

이제 각각의 이벤트에 대해 발생 확률과 기대 승률의 변화 정도를 가지고 가중 평균을 구해 보자.

0.33 * 0.140 + 0.67 * 0.069 = 0.09243

이것이 바로 이 타석에서 발생할 수 있는 WPA의 변화 수준이다. 이 계산 과정에서 WPA의 변화 값의 절대값을 사용하고 있음에 유의해야 한다. 홈팀이 유리해졌는지, 불리해졌는지는 생각하지 않는 것이다. 오직 승부가 얼마나 크게 변할 수 있는가만 살펴보는 것이다.


이 0.9243이라는 숫자가 얼마나 큰 숫자인지를 알기 위해서는, 절대적인 비교 대상이 필요하다. 그래서 Tom Tango와 동료들은 1999-2002년 4년간의 메이저리그 전체 데이터를 가지고 계산을 해 보았다. 그 결과, 메이저리그에서 한 타석의 평균 WPA 변화 수준은 0.0346으로 나타났다.

앞의 타석은 평균적인 상황에 비해 얼마나 중요한 것일까?

0.09243 / 0.0345 = 2.7

이 상황은 메이저리그의 보통 타석에 비해 2.7배 WPA를 많이 변화시킨다, 즉 2.7배 중요한 타석임을 알 수 있다. 이것이 바로 LI(Leverage Index) 이다. 정의에 따라, LI의 평균값은 1이 된다. 1보나 낮으면 평균보다 덜 중요한 순간이며, LI가 1보다 클 수록 게임의 향방을 좌우하는 중요한 순간이 된다.


물론 실제로 특정 타자가 타석에 들어섰을 때 벌어질 수 있는 이벤트는 1루타와 삼진 이외에도 무척 많다. Tom Tango와 동료들은 각각의 상황에 대해 발생할 수 있는 모든 이벤트의 LI를 계산해서 표로 만들었다.

표 링크

표에서 회색은 보통의 LI, 파란색은 1.5 이상의 높은 LI(중요한 상황), 빨간색은 매우 높은 LI(매우 중요한 상황)임을 나타내며, 아무 색깔이 없는 상황은 낮은 LI이다. 야구에서 LI가 가장 높은 상황, 즉 한방으로 승패를 가장 크게 좌우하는 상황은 9회말 2사 만루에서 홈팀이 1점 뒤져 있을 때 임을 알 수 있다.  왜 2사 만루 동점이 아니고 2사 만루 1점차 상황일까? 2사 만루 동점일 때보다 1점 뒤져 있을 때가 홈 팀의 WPA가 낮지만, 안타 한 방이면 역전승(=홈팀 WPA 1.000) 하는 것은 거의 마찬가지이므로, 1점 뒤져 있을 때의 WPA 변화 정도가 더 큰 것이다.


세이버메트리션들은 특히 마무리투수의 기용에 대해 지속적으로 의문을 제기해 왔다. 9회초 무사, 주자 없음, 홈팀 3점 리드인 상황에서 마무리투수가 등판하면, 이 때의 LI는 0.2에 불과하다. 어쨌든 이 투수가 아웃 3개를 잡으면 세이브가 기록된다. 하지만, 예를 들어 8회초 무사, 주자 만루, 홈팀 2점 리드인 상황의 LI는 4.1로 매우 높다. 이런 훨씬 중요한 순간에 왜 클로저를 안 내보내고 그보다 구위가 떨어지는 셋업맨을 내보내는 것일까?

일반적으로 생각되는 이유는 세 가지 이다. 우선 팀 동료들과 감독 본인에게 끼치는 심리적인 효과이다. 어쨌든 가장 좋은 릴리버가 경기 맨 마지막을 책임짐으로써 뒷문을 든든하게 잠가 주는 것 같은 심리적 안정감을 주는 것이다. 선수들과 감독 자신이 받는 이런 심리적 안정감은 의외로 큰 모양이어서, 한때 Red Sox가 Bill James의 충고에 따라 집단 마무리 체제를 운용하다가 실패한 사례가 있다. (그런데 셋업맨이 8회에 경기를 날려 버리면 클로저는 나올 기회조차 없지 않은가? -_-;;; )  두 번째는 클로저 본인의 자존심이다. 클로저들은 자신들이 경기를 마무리해야 한다고 믿고 있으며, 이러한 기회를 빼앗기게 되면 불만을 표시하거나 트레이드를 요청하기도 한다. 마지막으로, 감독이 스스로 비난을 자초하기 싫어한다는 것이다. 9회의 "세이브 상황"에 클로저를 내보내서 클로저가 블론세이브를 기록하면, 그것은 클로저가 불쇼를 했기 때문이라는 식으로 선수에게 비난이 집중된다. 감독은 정해진 역할에 따라 할 일을 했을 뿐이다. 반면, 7회나 8회 노아웃 만루의 위기 상황에 클로저를 내보내 일단 불을 끈 후 9회에 셋업맨을 올렸다가 경기를 날린 경우, 비난의 화살은 주로 등판 순서를 바꾼 감독에게 집중된다. 감독이 굳이 이런 식으로 스스로 욕먹을 짓을 할 이유가 없다는 것이다.

Fangraphs에서는 구원투수가 게임에 들어설 때의 LI를 gmLI, 강판될 때의 LI를 exLI로 구분하여 보여주고 있다. 릴리버의 gmLI가 높다는 것은 그만큼 감독이 그 투수를 믿고 위기상황에서 많이 내보낸다는 의미가 된다.

이번 오프시즌에 Fernando Rodney가 37세이브 1블론의 일견 그럴싸해 보이는 기록 덕분에 Angels와 2년 11M의 짭짤한 계약을 챙길 수 있었다. 이러한 높은 세이브 성공률은 Tigers의 Leyland 감독의 철저한 관리 덕분이라는 비판이 있었는데, 실제로 그의 gmLI를 확인해 보면 1.44에 불과하여 규정이닝을 채운 MLB 릴리버 중 38위에 불과하다. 다른 팀의 클로저 들은 물론이고 웬만한 셋업맨들(Mark Lowe, Jeremy Affeldt, Nick Masset, Luke Gregerson, Phil Hughes, Grant Balfour) 보다도 gmLI가 낮은 것이다. 그가 어렵지 않은 상황에 많이 등판하여 쉬운 세이브를 많이 챙겼음을 보여주는 강력한 증거이다. 2년 11M 계약은 의심의 여지가 없는 확실한 오버페이이다.


Today's Music : Rainbow - Kill the King (Live)



7-80년대를 풍미했던 Ritchie Blackmore(guitar), Ronnie James Dio(lead vocal), Cozy Powell(drums)의 전설적 뮤지션들을 모두 만날 수 있는 귀중한 영상. 명불허전의 퍼포먼스이다.
Posted by FreeRedbird
:

영양가에 대한 논란

9회말 2사 2-2 동점에서 솔로홈런을 치면, 3-2가 되면서 게임이 끝난다. 이 홈런은 게임의 향방을 결정지은 "승리타점"이 된다. 하지만, 9회초 15-0으로 앞서 있는 상황에서 솔로홈런을 치면, 16-0이 된다. 15-0이나 16-0이나 어차피 이길 확률이 100%에 가까운 것은 마찬가지이므로, 이 홈런은 게임의 향방과는 거의 관계가 없는 홈런이다. 소위 홈런의 "영양가"가 다른 것이다.

HR, RBI, OBP, SLG, OPS, RC, wOBA, EqA 등 우리가 사용하는 거의 모든 스탯은 이 두 홈런을 똑같은 가치로 취급한다. 시즌 기록으로 생각하면, 한 시즌은 꽤 긴 기간이므로, "영양가 있는 순간"과 "영양가 없는 순간"은 상당 부분 상쇄될 것이다. 또한, 클러치 능력이라는 게 랜덤에 가깝다는 주장을 수용한다면, 올해에 "영양가 있는 적시타"를 유난히 많이 쳤다고 해서 내년에도 그러리라는 보장은 없는 것이다. 따라서, 일반적으로 선수의 능력을 판단할 때에는 위의 스탯들을 사용하는 것으로 별 무리가 없다.

하지만, 그 "영양가"를 구체적으로 따져보고 싶은 경우에는 어떻게 해야 할까? 예를 들어 특정 경기의 수훈 선수를 한 명 꼽고 싶다면? 위의 스탯들로는 해결이 불가능하다. 이럴 때 사용하면 좋은 것이 바로 WPA(Win Probability Added) 이다.


WE(Win Expectancy)에 대한 복습

WE에 대해서는 이미 이전 포스팅에서 소개한 바 있다.

Insidethebook 사이트에 공개되어 있는 표를 이용하여 다시 복습을 해 보자.

Inning: 6, Top

1B 2B 3B Out -4 -3 -2 -1 Tie 1 2 3 4
0 0.089 0.146 0.230 0.348 0.500 0.651 0.769 0.854 0.911
1 0.097 0.158 0.249 0.375 0.534 0.690 0.802 0.879 0.929
2 0.103 0.167 0.263 0.394 0.560 0.717 0.825 0.896 0.941
1B 0 0.078 0.128 0.204 0.310 0.448 0.594 0.717 0.812 0.881
1B 1 0.089 0.145 0.230 0.347 0.498 0.649 0.766 0.852 0.910
1B 2 0.099 0.161 0.253 0.380 0.542 0.697 0.808 0.884 0.932
2B 0 0.069 0.114 0.182 0.280 0.410 0.557 0.689 0.793 0.868
2B 1 0.083 0.136 0.216 0.327 0.473 0.625 0.749 0.840 0.902
2B 2 0.095 0.155 0.244 0.368 0.526 0.682 0.797 0.876 0.928
3B 0 0.058 0.098 0.158 0.247 0.369 0.517 0.662 0.774 0.856
3B 1 0.071 0.118 0.189 0.291 0.427 0.582 0.719 0.820 0.889
3B 2 0.093 0.152 0.240 0.362 0.519 0.675 0.793 0.873 0.926
1B 2B 0 0.062 0.102 0.164 0.253 0.372 0.506 0.633 0.742 0.827
1B 2B 1 0.078 0.127 0.202 0.308 0.445 0.590 0.711 0.806 0.877
1B 2B 2 0.092 0.151 0.238 0.358 0.513 0.665 0.780 0.862 0.917
1B 3B 0 0.051 0.085 0.139 0.218 0.327 0.463 0.602 0.720 0.813
1B 3B 1 0.067 0.111 0.178 0.274 0.402 0.548 0.682 0.786 0.864
1B 3B 2 0.089 0.146 0.231 0.349 0.500 0.652 0.770 0.855 0.912
2B 3B 0 0.046 0.078 0.127 0.201 0.303 0.431 0.569 0.695 0.795
2B 3B 1 0.062 0.102 0.165 0.255 0.377 0.517 0.652 0.764 0.848
2B 3B 2 0.087 0.143 0.226 0.341 0.490 0.639 0.757 0.845 0.906
1B 2B 3B 0 0.042 0.071 0.116 0.183 0.277 0.395 0.523 0.644 0.748
1B 2B 3B 1 0.060 0.099 0.159 0.245 0.362 0.495 0.622 0.731 0.818
1B 2B 3B 2 0.084 0.137 0.217 0.328 0.471 0.617 0.733 0.823 0.888


위의 표는 홈팀의 입장에서 6회초의 각 상황별로 기대 승률, 즉 Win Expectancy를 표시한 것이다. 즉, 6회초에 동점이고 무사에 주자가 없는 경우(위 표의 빨간색 글씨), 홈팀이 이 경기를 이길 확률은 정확히 0.5 이다. 하지만, 홈팀이 원정팀에게 1점 뒤진 상태에서 2사 3루의 상황을 맞이한 경우(위 표의 파란색 글씨), 홈팀이 최종적으로 이 경기를 이길 확률은 0.362 로 내려간다.

이 표는 Run Environment가 5.0인 상황, 즉 각 팀별로 경기당 평균 5점씩 득점하는 리그를 기준으로 한 것이다. 이 Run Environment가 바뀔 경우에는 WE Matrix도 바뀌게 된다.

아래 엑셀파일은 Tom Tango의 웹사이트에 걸려 있는 외부 링크에서 집어온 것이다. (출처는 여기)
파일 안에 있는 "BigTable" sheet가 바로 Run Environment=4.5일 때의 Win Expectancy 표이다. 위의 표와 6회초 부분을 비교해 보면 숫자가 조금씩 다름을 알 수 있다. 1점을 득점하거나 실점하는 경우 첨부파일의 WE가 더 크게 변하는 것을 볼 수 있는데, Run Environment가 작으므로(=게임당 평균득점이 적음) 1점의 위력이 더 큰 것이다.

WPA : Win Probability Added

WPA는 Win Probability Added의 약자로, 단어 안에 그 의미가 이미 드러나 있다. 즉, 기대 승률이 변화한 정도를 나타내는 것이다.

예를 들어... 위의 엑셀 파일에서처럼 Run Environment가 4.5인 상황에서 양 팀이 0-0이고, 6회초가 막 시작되고 있다고 가정해 보자. 이 상황에서 양팀의 기대 승률은 똑같이 50% 이다. 그런데, 6회초에 원정팀의 선두타자가 나와서 솔로 홈런을 쳤다고 하면, 점수는 0-1로 바뀌고, 노아웃 주자 없음 상황은 그대로 유지된다. 이제 홈팀이 1점을 뒤지게 되었으므로, 위의 표에서 -1점, 노아웃, 주자 없음을 찾아 보면 33.6%로 기대 승률이 내려갔음을 알 수 있다. 홈런 한 방을 맞음으로써 이 경기를 이길 확률이 16.4%가 줄어든 것이다. 따라서, 홈런을 친 선두타자는 +0.164의 WPA를 인정받게 되며, 반대로 홈런을 허용한 홈팀 투수는 -0.164의 WPA를 기록하게 된다.

이런 상황이 9회에서 발생했다면 어떻게 다를까? 9회초 노아웃에 무사, 동점인 상황에서 선두타자에게 홈런을 허용한 경우 홈팀의 기대 승률은 50%에서 16.2%로 크게 떨어진다. 여기에서 타자와 투수가 얻게 되는 WPA는 각각 +0.338, -0.338에 달한다. 6회초의 홈런에 비해 2배 이상 높은 것이다. 그만큼 같은 동점이라도 9회초의 홈런이 6회초의 홈런에 비해 훨씬 크게 승부를 좌우한다는 의미이다. 즉, 홈런의 "영양가"가 더 높은 것이다.

9회말, 홈팀이 3점 뒤진 상황에서 2사 만루에 타석에 들어섰다면, 이때 홈팀의 승률은 9.1%에 불과하다. 그런데, 여기서 만루홈런을 쳐서 역전승을 거뒀다면, 승리를 거두었으므로 기대승률은 100%가 되어 이 타석의 WPA는 +0.909에 달한다. 그야말로 영양가 만점이라고 할 수 있을 것이다.

이번에는 원정팀이 6점 앞서 있는 상황에서 9회초를 시작하는 것을 가정해 보자. 이때 홈팀의 승률은 0.3%에 불과하다. 여기에서 원정팀의 선두타자가 홈런을 쳐서 7점차로 벌어지면, 홈팀의 승률은 0.1%로 떨어진다. 같은 홈런이지만, 이 타석에서 타자의 WPA는 +0.002에 불과하다. 어차피 이길 확률이 매우 높은 상황이었으므로 영양가가 거의 없는 홈런이다. 같은 홈런인데도 이렇게 차이가 나는 것이다.

선수별 WPA는 Fangraphs에서 찾아볼 수 있다. 또한, Fangraphs는 메이저리그 정규시즌 및 포스트시즌에서 모든 게임의 WPA 변화를 실시간으로 중계해 준다.


WPA의 장점 그리고 한계

wRAA와 같은 스탯은 해당 선수가 팀 득점에 얼마나 기여했는지를 나타내는 스탯이지만, WPA는 해당 선수가 팀 승리에 얼마나 기여했는지를 나타내는 스탯이다. WPA가 높다는 것은 그만큼 팀 승리에 결정적인 공헌을 많이 했다는 것이고, 영양가 있는 활약을 했다는 이야기가 된다. (물론 162게임의 시즌은 상당히 긴 기간이므로 wRAA가 높은 타자는 아무래도 WPA가 높게 되기 마련이지만...) 만약 MVP를 순수하게 "팀 승리에 제일 많이 기여한 선수"에게 주고자 한다면, WPA가 가장 높은 선수에게 주는 방법도 고려해 볼 수 있다.

하지만, WPA는 그 배분 방식에 문제를 가지고 있다. 예를 들어 타자가 홈런을 친 경우, 승률의 변화를 그대로 타자의 WPA에 플러스 해 주고 투수의 WPA에 마이너스 해 주면 된다. 하지만, 타자의 타구가 수비수의 어설픈 수비로 인해 안타로 연결된 경우, 이 때 승률의 변화는 어떻게 계산해 주어야 할까? 타자는 어쨌든 안타를 만들었기에 변화한 승률 만큼을 플러스 WPA로 가져가지만, 수비측은 투수의 일방적인 책임으로 보기에는 어려운 상황이다. 이 경우에는 관측자의 주관적 판단에 따라 투수와 수비수의 책임 수준을 평가하여 마이너스 WPA를 배분하게 된다. 그런데, Fangraphs의 경우는 이러한 주관적 판단을 배제하고 수비측에서 받게 되는 모든 WPA를 투수에게만 부여하고 있다. 수비수의 호수비로 안타성 타구가 아웃이 되어 플러스 WPA를 얻게 된 경우에도 투수가 이득을 보고, 수비수의 어설픈 수비로 아웃될 타구를 안타로 만들어준 경우의 마이너스 WPA도 역시 투수가 모두 가져가게 되는 것이다. 이것은 관측자의 주관적 판단으로 인한 오류를 배제하는 장점이 있고, 또한 WPA를 리얼타임으로 계산할 수 있게 해 준다. 이렇게 쉽게 계산하기 때문에 Fangraphs가 메이저리그 시즌 중에 실시간으로 각 경기의 WPA 변화를 업데이트해 줄 수 있는 것이다.

또한, WPA는 과거의 팀 기여도를 살펴보는 데에는 유용하지만, 미래를 예측하는 데에는 상당히 부적절하다. 올해 유난히 결승타를 많이 올린 선수가 있다고 해서, 내년에도 특유의 클러치 능력을 발휘하리라는 보장이 전혀 없는 것이다.


Today's Music : Fleetwood Mac - Don't Stop (Live)



Don't stop thinking about tomorrow
Don't stop, it'll soon be here
It'll be better than before
Yesterday's gone, yesterday's gone

새해를 기념하여 좀 긍정적인 분위기의 곡을 골라 보았다.

새해 복 많이 받으세요...!!!


(이 글은 한국야구팬사이트에서도 보실 수 있습니다.)
Posted by FreeRedbird
: