FA 3루수 Adrian Beltre가 Red Sox와 1년 계약에 합의한 모양이다. 연봉은 9M이고, 여기에 5M의 플레이어 옵션 or 1M의 바이아웃이 걸려 있으므로, 사실상 1년 10M이라고 보면 될 것이다.
링크(MLBTR)

Beltre의 에이전트 Scott Boras는 연간 10-12M 수준의 다년계약을 주장해 왔으나, 그런 요구에 호응해 주는 구단은 전혀 없었다. 결국 FA시장의 분위기가 영 별로라고 판단하고 1년 계약 쪽으로 선회한 것 같다. Beltre는 워낙 데뷔가 빨랐던 덕분에 아직도 나이가 30세에 불과하므로, Red Sox에서 1년 동안 좋은 성적을 낸다면 내년 FA시장에서 대박을 노릴 수도 있을 것 같다.

어쨌거나, Red Sox는 낮은 시장 시세를 이용하여 Beltre를 싸게 잡았다. Beltre는 작년과 같은 부상이 아니라면 꾸준히 연간 3-4 WAR의 활약을 해 줄 수 있는 플레이어이다. 보수적으로 예상하여 3 WAR이라고 해도, 연봉이 10M이니 3.3M/WAR로 상당히 저렴한 편이다.

나는 Red Sox가 올 시즌을 포기한 것 같다는 주장에 대해 동의하지 않는다. 비록 Granderson과 Vasquez를 영입한 Yankees 만큼은 아니지만, Red Sox도 나름대로 비용 대비 실속있게 팀을 업그레이드 해 가고 있다.  Jason Bay --> Mike Cameron은 1 WAR 이상의 업그레이드이고, John Lackey 딜은 좀 오버페이의 느낌이 있으나 어쨌든 로테이션에 큰 도움이 될 것이다. Marco Scutaro의 2009년 성적은 뽀록으로 보이지만, 그래도 앞으로 2년간 리그 평균 이상은 해 줄 것이다. Yankees가 2009 시즌보다 7-8승 정도는 더 할 수 있는 팀을 만들었다면, Red Sox의 업그레이드도 최소한 4승 이상 될 것 같다. 두 팀간 격차가 더 벌어지고 있는 것이 문제이지만... 지구에서 2위 하더라도 와일드카드만 잡으면 어쨌든 플레이오프에 진출할 수 있지 않은가? 현재 FA시장에 남은 선수들의 수준과 Red Sox의 로스터 구성을 고려할 때, 팜을 완전히 거덜내는 트레이드를 하지 않는 이상 딱히 크게 업그레이드 할 수 있는 여지도 별로 없어 보인다. 특히 수비 측면에서는 MLB 전체에서 Mariners와 함께 독보적인 위치에 서게 될 것이다. 나에게 현재 MLB에서 최고의 단장을 3명 꼽으라면, 그다지 많이 고민하지 않고 Theo Epstein을 3명 안에 넣을 것 같다. Epstein은 여전히 잘 하고 있다.

이제 Epstein 단장에게 남은 큰 과제는, Mike Lowell을 어떻게든 다시 트레이드 시키는 것인데... 이건 정말 어려운 일일 듯 하다.


글로벌 경제위기로 인해 작년에 크게 낮아진 FA시장 시세가 올해에도 별로 올라갈 기미를 보이지 않고 있다. 2007년 말-2008년 초에 4.5M/WAR까지 치솟았던 FA 몸값은 현재 대략 3.5M/WAR 수준으로 내려간 상태이다. 이런 분위기라면 Cardinals도 적정 수준에서 Matt Holliday를 잡을 수 있을 것으로 보인다. (Holliday가 5.5 WAR 플레이어라고 보고, 다년계약으로 10% 정도의 discount를 적용하면 대략 6년 100M 부근을 생각할 수 있을 듯. 시장에 경쟁자가 없음을 감안하면 이보다 더 싸게 계약할 수도 있을 것 같다. Scott Boras가 떠들어대던 연간 18-20M, 8년 이상 계약은 완전히 물건너 갔다.) 물론, Boras가 에이전트인 이상 Beltre처럼 1년 계약 후 FA재수를 택할 가능성도 충분히 있다. 현재 양측이 활발하게 협상을 벌이고 있는 것으로 알려져 있으므로, 조만간 확정 발표가 나면 바로 포스팅하도록 하겠다.


그런데... 이런 FA시장의 저렴한 분위기에도 불구하고 Brandon Lyon에게 3년 15M을 퍼주고 Fernando Rodney에게 2년 11M을 안겨주는 단장들은 도대체 무슨 생각으로 이렇게 막 지르는 것인지 잘 모르겠다. Jason Bay의 4년 66M+옵션 계약도 마찬가지...


Today's Music : the Smashing Pumpkins - Tonight Tonight (Live)


Jimmy Chamberlin이 약물때문에 밴드에서 쫓겨났던 시절의 MTV 라이브. Chamberlin이 없다는 것만 빼면 훌륭한 퍼포먼스이다. Chamberlin이 없다는 것만 빼면.

Posted by FreeRedbird
:

이 글은 "한국야구팬사이트"에서 승짱님의 한국 프로야구 투수 랭킹 계산을 돕기 위한 예로서 작성된 것이다.
단지 "예"일 뿐이므로 스탯에 대한 해석, 계산 방법에 대한 입장의 차이에 따라 얼마든지 변형과 조정이 가능하다.

계산 방법은 기본적으로 이전 포스팅에서 소개해 드린 것과 동일하다.

다만, FIP를 RA scale로 바꿔줄 때 0.92를 사용하는 대신 실제 KBO의 ERA와 RA 비율을 계산하여 사용하였다. 결과는 아래 첨부파일에서 볼 수 있듯이 0.91~0.92로 대동소이하게 나온다.

또한, FIP Constant 역시 KBO의 실제 데이터를 가지고 계산하였다. 2007년 시즌은 FIP Constant가 2.84에 불과한 충격적인 결과가 나왔으나, 2008년과 2009년은 그럭저럭 MLB와 유사한 숫자가 나왔다.

2009년과 2008년 KBO 시즌에서 각각 5명의 선발투수를 골라서 직접 계산을 해 보았다.

5명의 선발투수는 완전히 임의로 고른 것이다. (나는 KBO에 좋아하는 팀이 없으며, 8개 구단에 대해 완전히 중립이다...)


이 계산에는 다음과 같은, 근거가 부족한 가정들이 들어가 있다. 이런 부분들을 말끔하게 해결할 수 없는 것은 KBO의 데이터 부족, 개인적인 지식 부족, 그리고 개인적인 시간 부족에 기인한 것이다.

1. KBO에서 각 이벤트는 MLB와 비슷한 Run Value를 가지며, 따라서 FIP 계산식은 동일하다.

2. KBO에서 Run Scoring Environment는 MLB와 유사하여, Runs per Win을 MLB와 동일하게 [((상대 팀 이닝*상대 팀 실점수준)+(소속 팀 이닝*소속 팀 실점수준)/(상대 팀 이닝+소속 팀 이닝))+2] * 1.5 의 근사식으로 산출할 수 있다.

3. KBO에서 선발투수의 Replacement Level은 MLB와 동일하며, 따라서 Replacement Level 선발투수의 기대 승률은 .380이다.
--> 단, KBO의 Replacement Level이 실제로는 이와 다르다고 해도, 상대적 비교에는 지장이 없다. 이 계산에서 투수 A가 투수 B보다 WAR이 높게 나타났다면, Replacement Level을 바꾸더라도 A가 B보다 높게 나타나는 것은 변함이 없다. 단지 절대값이 바뀔 뿐이다.


다음은 중요한 참고 사항이다.

1. KBO 선수들의 모든 데이터는 스탯티즈에서 가져왔다. 스탯티즈는 보면 볼수록 놀랍고 대단한 사이트이다. (우리나라의 척박한 야구 기록 환경을 생각하면 더더욱 그렇다.) 단, FIP는 스탯티즈의 데이터를 쓰지 않고 직접 계산하였다. 이유는, 스탯티즈의 FIP가 Constant를 3.20으로 항상 동일하게 사용하고 있고, BB와 IBB의 구분이 이루어지고 있지 않기 때문이다.

2. 여기에서 계산한 선발투수의 WAR는 선발로 등판한 기록만을 대상으로 한 것이다. 한국 프로야구는 투수의 역할이 모호한 경우가 많아 시즌 내내 100% 선발 투수로만 등판하는 투수는 그다지 많지 않으며, 대부분의 선발투수가 구원 등판 기록을 가지고 있다. 따라서, 정확한 계산을 위해서는 해당 투수가 구원으로 등판한 기록을 가지고 구원투수의 WAR를 계산하여 합산해 주어야 할 것이다. (결국 내가 구원투수 WAR를 구하는 방법을 최대한 빨리 포스팅해야 할 것 같다... -_- )


다음은 이 계산을 하고 난 뒤의 소감.

1. 07, 08, 09년 3년간의 FIP Constant를 계산하면서 시즌 스탯을 확인한 결과 시즌과 시즌 사이의 득점 수준 변화가 매우 크게 나타났다. (3년 사이에 타고투저 현상이 심화됨) 팀 수도 적고 게임 수도 적다보니 샘플이 적어져서 데이터의 변동성이 MLB에 비해 훨씬 크게 나타나는 것 같다. (KBO 1시즌 = 1,056게임, MLB 1시즌 = 4,860게임)

2. 그럼에도 불구하고 ERA/RA 비율이 유사하게 나타나는 것을 보면 비슷한 규칙을 가지고 비슷하게 야구를 하니 비슷한 결과가 나온다는 느낌이어서... MLB의 메트릭을 KBO에 적용하는 것이 완전히 엉뚱한 결과를 도출하지는 않을 것이라는 생각이 든다.

3. 류현진은 정말 좋은 투수인 것 같다. 다른 선수들을 많이 계산해 본 적은 없으나 한국야구에서 5 WAR면 엄청나게 높은 수치일 것 같은데... 위의 계산 파일에는 들어있지 않으나, 08년 스탯으로 계산해도 윤석민과 동일하게 3.6 WAR로 나온다.

Posted by FreeRedbird
:

영양가에 대한 논란

9회말 2사 2-2 동점에서 솔로홈런을 치면, 3-2가 되면서 게임이 끝난다. 이 홈런은 게임의 향방을 결정지은 "승리타점"이 된다. 하지만, 9회초 15-0으로 앞서 있는 상황에서 솔로홈런을 치면, 16-0이 된다. 15-0이나 16-0이나 어차피 이길 확률이 100%에 가까운 것은 마찬가지이므로, 이 홈런은 게임의 향방과는 거의 관계가 없는 홈런이다. 소위 홈런의 "영양가"가 다른 것이다.

HR, RBI, OBP, SLG, OPS, RC, wOBA, EqA 등 우리가 사용하는 거의 모든 스탯은 이 두 홈런을 똑같은 가치로 취급한다. 시즌 기록으로 생각하면, 한 시즌은 꽤 긴 기간이므로, "영양가 있는 순간"과 "영양가 없는 순간"은 상당 부분 상쇄될 것이다. 또한, 클러치 능력이라는 게 랜덤에 가깝다는 주장을 수용한다면, 올해에 "영양가 있는 적시타"를 유난히 많이 쳤다고 해서 내년에도 그러리라는 보장은 없는 것이다. 따라서, 일반적으로 선수의 능력을 판단할 때에는 위의 스탯들을 사용하는 것으로 별 무리가 없다.

하지만, 그 "영양가"를 구체적으로 따져보고 싶은 경우에는 어떻게 해야 할까? 예를 들어 특정 경기의 수훈 선수를 한 명 꼽고 싶다면? 위의 스탯들로는 해결이 불가능하다. 이럴 때 사용하면 좋은 것이 바로 WPA(Win Probability Added) 이다.


WE(Win Expectancy)에 대한 복습

WE에 대해서는 이미 이전 포스팅에서 소개한 바 있다.

Insidethebook 사이트에 공개되어 있는 표를 이용하여 다시 복습을 해 보자.

Inning: 6, Top

1B 2B 3B Out -4 -3 -2 -1 Tie 1 2 3 4
0 0.089 0.146 0.230 0.348 0.500 0.651 0.769 0.854 0.911
1 0.097 0.158 0.249 0.375 0.534 0.690 0.802 0.879 0.929
2 0.103 0.167 0.263 0.394 0.560 0.717 0.825 0.896 0.941
1B 0 0.078 0.128 0.204 0.310 0.448 0.594 0.717 0.812 0.881
1B 1 0.089 0.145 0.230 0.347 0.498 0.649 0.766 0.852 0.910
1B 2 0.099 0.161 0.253 0.380 0.542 0.697 0.808 0.884 0.932
2B 0 0.069 0.114 0.182 0.280 0.410 0.557 0.689 0.793 0.868
2B 1 0.083 0.136 0.216 0.327 0.473 0.625 0.749 0.840 0.902
2B 2 0.095 0.155 0.244 0.368 0.526 0.682 0.797 0.876 0.928
3B 0 0.058 0.098 0.158 0.247 0.369 0.517 0.662 0.774 0.856
3B 1 0.071 0.118 0.189 0.291 0.427 0.582 0.719 0.820 0.889
3B 2 0.093 0.152 0.240 0.362 0.519 0.675 0.793 0.873 0.926
1B 2B 0 0.062 0.102 0.164 0.253 0.372 0.506 0.633 0.742 0.827
1B 2B 1 0.078 0.127 0.202 0.308 0.445 0.590 0.711 0.806 0.877
1B 2B 2 0.092 0.151 0.238 0.358 0.513 0.665 0.780 0.862 0.917
1B 3B 0 0.051 0.085 0.139 0.218 0.327 0.463 0.602 0.720 0.813
1B 3B 1 0.067 0.111 0.178 0.274 0.402 0.548 0.682 0.786 0.864
1B 3B 2 0.089 0.146 0.231 0.349 0.500 0.652 0.770 0.855 0.912
2B 3B 0 0.046 0.078 0.127 0.201 0.303 0.431 0.569 0.695 0.795
2B 3B 1 0.062 0.102 0.165 0.255 0.377 0.517 0.652 0.764 0.848
2B 3B 2 0.087 0.143 0.226 0.341 0.490 0.639 0.757 0.845 0.906
1B 2B 3B 0 0.042 0.071 0.116 0.183 0.277 0.395 0.523 0.644 0.748
1B 2B 3B 1 0.060 0.099 0.159 0.245 0.362 0.495 0.622 0.731 0.818
1B 2B 3B 2 0.084 0.137 0.217 0.328 0.471 0.617 0.733 0.823 0.888


위의 표는 홈팀의 입장에서 6회초의 각 상황별로 기대 승률, 즉 Win Expectancy를 표시한 것이다. 즉, 6회초에 동점이고 무사에 주자가 없는 경우(위 표의 빨간색 글씨), 홈팀이 이 경기를 이길 확률은 정확히 0.5 이다. 하지만, 홈팀이 원정팀에게 1점 뒤진 상태에서 2사 3루의 상황을 맞이한 경우(위 표의 파란색 글씨), 홈팀이 최종적으로 이 경기를 이길 확률은 0.362 로 내려간다.

이 표는 Run Environment가 5.0인 상황, 즉 각 팀별로 경기당 평균 5점씩 득점하는 리그를 기준으로 한 것이다. 이 Run Environment가 바뀔 경우에는 WE Matrix도 바뀌게 된다.

아래 엑셀파일은 Tom Tango의 웹사이트에 걸려 있는 외부 링크에서 집어온 것이다. (출처는 여기)
파일 안에 있는 "BigTable" sheet가 바로 Run Environment=4.5일 때의 Win Expectancy 표이다. 위의 표와 6회초 부분을 비교해 보면 숫자가 조금씩 다름을 알 수 있다. 1점을 득점하거나 실점하는 경우 첨부파일의 WE가 더 크게 변하는 것을 볼 수 있는데, Run Environment가 작으므로(=게임당 평균득점이 적음) 1점의 위력이 더 큰 것이다.

WPA : Win Probability Added

WPA는 Win Probability Added의 약자로, 단어 안에 그 의미가 이미 드러나 있다. 즉, 기대 승률이 변화한 정도를 나타내는 것이다.

예를 들어... 위의 엑셀 파일에서처럼 Run Environment가 4.5인 상황에서 양 팀이 0-0이고, 6회초가 막 시작되고 있다고 가정해 보자. 이 상황에서 양팀의 기대 승률은 똑같이 50% 이다. 그런데, 6회초에 원정팀의 선두타자가 나와서 솔로 홈런을 쳤다고 하면, 점수는 0-1로 바뀌고, 노아웃 주자 없음 상황은 그대로 유지된다. 이제 홈팀이 1점을 뒤지게 되었으므로, 위의 표에서 -1점, 노아웃, 주자 없음을 찾아 보면 33.6%로 기대 승률이 내려갔음을 알 수 있다. 홈런 한 방을 맞음으로써 이 경기를 이길 확률이 16.4%가 줄어든 것이다. 따라서, 홈런을 친 선두타자는 +0.164의 WPA를 인정받게 되며, 반대로 홈런을 허용한 홈팀 투수는 -0.164의 WPA를 기록하게 된다.

이런 상황이 9회에서 발생했다면 어떻게 다를까? 9회초 노아웃에 무사, 동점인 상황에서 선두타자에게 홈런을 허용한 경우 홈팀의 기대 승률은 50%에서 16.2%로 크게 떨어진다. 여기에서 타자와 투수가 얻게 되는 WPA는 각각 +0.338, -0.338에 달한다. 6회초의 홈런에 비해 2배 이상 높은 것이다. 그만큼 같은 동점이라도 9회초의 홈런이 6회초의 홈런에 비해 훨씬 크게 승부를 좌우한다는 의미이다. 즉, 홈런의 "영양가"가 더 높은 것이다.

9회말, 홈팀이 3점 뒤진 상황에서 2사 만루에 타석에 들어섰다면, 이때 홈팀의 승률은 9.1%에 불과하다. 그런데, 여기서 만루홈런을 쳐서 역전승을 거뒀다면, 승리를 거두었으므로 기대승률은 100%가 되어 이 타석의 WPA는 +0.909에 달한다. 그야말로 영양가 만점이라고 할 수 있을 것이다.

이번에는 원정팀이 6점 앞서 있는 상황에서 9회초를 시작하는 것을 가정해 보자. 이때 홈팀의 승률은 0.3%에 불과하다. 여기에서 원정팀의 선두타자가 홈런을 쳐서 7점차로 벌어지면, 홈팀의 승률은 0.1%로 떨어진다. 같은 홈런이지만, 이 타석에서 타자의 WPA는 +0.002에 불과하다. 어차피 이길 확률이 매우 높은 상황이었으므로 영양가가 거의 없는 홈런이다. 같은 홈런인데도 이렇게 차이가 나는 것이다.

선수별 WPA는 Fangraphs에서 찾아볼 수 있다. 또한, Fangraphs는 메이저리그 정규시즌 및 포스트시즌에서 모든 게임의 WPA 변화를 실시간으로 중계해 준다.


WPA의 장점 그리고 한계

wRAA와 같은 스탯은 해당 선수가 팀 득점에 얼마나 기여했는지를 나타내는 스탯이지만, WPA는 해당 선수가 팀 승리에 얼마나 기여했는지를 나타내는 스탯이다. WPA가 높다는 것은 그만큼 팀 승리에 결정적인 공헌을 많이 했다는 것이고, 영양가 있는 활약을 했다는 이야기가 된다. (물론 162게임의 시즌은 상당히 긴 기간이므로 wRAA가 높은 타자는 아무래도 WPA가 높게 되기 마련이지만...) 만약 MVP를 순수하게 "팀 승리에 제일 많이 기여한 선수"에게 주고자 한다면, WPA가 가장 높은 선수에게 주는 방법도 고려해 볼 수 있다.

하지만, WPA는 그 배분 방식에 문제를 가지고 있다. 예를 들어 타자가 홈런을 친 경우, 승률의 변화를 그대로 타자의 WPA에 플러스 해 주고 투수의 WPA에 마이너스 해 주면 된다. 하지만, 타자의 타구가 수비수의 어설픈 수비로 인해 안타로 연결된 경우, 이 때 승률의 변화는 어떻게 계산해 주어야 할까? 타자는 어쨌든 안타를 만들었기에 변화한 승률 만큼을 플러스 WPA로 가져가지만, 수비측은 투수의 일방적인 책임으로 보기에는 어려운 상황이다. 이 경우에는 관측자의 주관적 판단에 따라 투수와 수비수의 책임 수준을 평가하여 마이너스 WPA를 배분하게 된다. 그런데, Fangraphs의 경우는 이러한 주관적 판단을 배제하고 수비측에서 받게 되는 모든 WPA를 투수에게만 부여하고 있다. 수비수의 호수비로 안타성 타구가 아웃이 되어 플러스 WPA를 얻게 된 경우에도 투수가 이득을 보고, 수비수의 어설픈 수비로 아웃될 타구를 안타로 만들어준 경우의 마이너스 WPA도 역시 투수가 모두 가져가게 되는 것이다. 이것은 관측자의 주관적 판단으로 인한 오류를 배제하는 장점이 있고, 또한 WPA를 리얼타임으로 계산할 수 있게 해 준다. 이렇게 쉽게 계산하기 때문에 Fangraphs가 메이저리그 시즌 중에 실시간으로 각 경기의 WPA 변화를 업데이트해 줄 수 있는 것이다.

또한, WPA는 과거의 팀 기여도를 살펴보는 데에는 유용하지만, 미래를 예측하는 데에는 상당히 부적절하다. 올해 유난히 결승타를 많이 올린 선수가 있다고 해서, 내년에도 특유의 클러치 능력을 발휘하리라는 보장이 전혀 없는 것이다.


Today's Music : Fleetwood Mac - Don't Stop (Live)



Don't stop thinking about tomorrow
Don't stop, it'll soon be here
It'll be better than before
Yesterday's gone, yesterday's gone

새해를 기념하여 좀 긍정적인 분위기의 곡을 골라 보았다.

새해 복 많이 받으세요...!!!


(이 글은 한국야구팬사이트에서도 보실 수 있습니다.)
Posted by FreeRedbird
: