[세이버메트릭스] 타자의 가치(Value) : WAR(Wins Above Replacement Level) 계산 - Revisited -
(주: 타자의 WAR를 구하는 글은 이미 이전에 포스팅한 바 있었으나, 일부 잘못된 계산을 바로잡고 내용을 보충하여 다시 포스팅 하기로 하였다. 또한, 이제 2009 시즌이 끝났으므로 계산에서 사용한 예도 2009년의 스탯들로 바꾸었다.)
Chase Utley : 항상 실력에 비해 충분한 인정을 받지 못하고 있는, 심각하게 저평가된 플레이어이다.
타자가 팀의 득점에 기여하는 방법은 크게 보아 공격(타격), 수비, 주루가 있을 것이다. 그래서 좋은 타자를 이야기할 때 "공, 수, 주 3박자를 두루 갖췄다"는 표현을 사용하기도 한다.
각각의 타자에 대해서 이러한 득점 기여의 정도가 어느 정도인지를 측정하기 위해, 이전의 글들을 통해 공격, 수비, 주루의 측면을 차례로 검토해 왔다. 또한 비교 대상으로서 절대적 기준이 되는 Replacement Level 및 수비 포지션에 따른 조정 수준에 대해서도 살펴본 바 있다. 각각의 항목에 대해 다시 한번씩 훑어 보시면 이해에 도움이 되시리라고 생각하여 링크를 걸어 본다.
1. 타격 기여 수준 : wOBA 및 wRAA
2. 비교의 절대적 기준 : Replacement Level
3. 수비 기여 수준 : UZR, TZ
4. 포지션별 차이 : Positional Adjustment
5. 주루 기여 수준 : 도루 성공/실패, EqBRR
이를 종합하면 특정 타자의 전체 기여 수준, 혹은 그의 가치(Value)를 계산할 수 있는데, 이것이 바로 RAR(Runs Above Replacement level) 및 WAR(Wins Above Replacement level) 이다.
여기에서는 우선 Fangraphs와 동일한 방식으로 WAR를 구해 볼 것이다. 원문에서는 여기까지만 시도했었지만, 이 글에서는 Fangraphs 방식의 한계와 그 보완 방법까지 생각해 보고자 한다.
먼저 RAR을 구해 보면... 위의 다섯 가지를 차례로 더해 주면 된다.
RAR = Batting + Replacement Level + Defense + Positional Adjusment + Running
이제 RAR을 WAR로 환산해야 하는데... 원칙적으로는 팀 전체 득점과 실점에 대해 해당 플레이이어의 RAR이 미치는 점수 변화 정도를 가지고 Pythagorean Expectation의 식에 넣어서 계산하는 것이 맞지만... Pythagorean 관련 포스팅에서 언급한 바와 같이, "10점 득점 = 1승"의 단순한 계산 방법이 의외로 높은 정확도를 가지므로, 계산의 편의를 위해 이를 활용하는 것이 좋을 것이다. 즉, 아래와 같이 쉽게 계산할 수 있다.
WAR = RAR/10
이제부터 실제 예를 통해서 자세히 살펴보자.
계산에 필요한 Raw Data는 Baseball-Reference과 Fangraphs에서 얻었으며, 이후의 모든 계산은 직접 하였다. 계산에 사용한 엑셀 sheet를 첨부하였으므로, 계산 결과를 쉽게 확인하실 수 있을 것이다.
아래는 Chase Utley의 2009년 성적이다.
공격 : 687 PA, 98 1B, 28 2B, 4 3B, 31 HR, 85 NIBB, 3 IBB, 24 HBP, 4 RBOE
수비 : 10.8 UZR
주루 : 23 SB, 0 CS
(NIBB : 고의사구가 아닌 볼넷, IBB : 고의사구, RBOE : 에러로 인해 타자가 출루한 경우)
순서에 따라 차례차례 계산해 보면...
1-1. Park Adjust
먼저 wOBA를 계산하기에 앞서서, 구장으로 인한 효과를 보정해 주는 것이 계산의 신뢰도를 높이는 데 도움이 될 것이다. Park Factor를 계산하는 방법은 여러 가지가 있고, 개인적으로는 어떤 방법이 가장 좋은지 아직 결론을 내리지 못하고 있다. 일단 여기서는 Fantasy411의 2006-08년 Park Factor를 빌려와서 사용하도록 하겠다. 이 자료는 엑셀 파일에 포함되어 있다. (단, RBOE의 Park Factor는 어디에서도 얻을 수가 없었다. 어차피 Utley의 RBOE가 4에 불과하여 Park Factor가 있더라도 그다지 영향은 없었겠지만...)
정밀한 조정을 위해서는 Utley의 경기별 홈구장을 일일이 찾아서 계산해야겠지만... 너무 품이 많이 들므로, 다음과 같은 간단한 방법을 사용하였다. 1) 타석의 절반은 홈, 절반은 원정에서 기록한 것으로 본다. 2) 원정구장들의 평균 Park Factor는 100이다. (실제로는 홈구장을 뺀 15개 NL 구장의 평균이므로 100에 근접한 값일 것이나, 큰 오차는 없으리라고 본다) 3) 따라서, 조정된 Park Factor는 (100 + 홈구장 Park Factor) / 2 로 계산할 수 있다.
계산시 1B, 2B, 3B, HR에 대해 Park Factor를 적용하였으나, 볼넷이나 HBP, 도루 등의 경우는 구장별 차이가 있다고 인정하기가 어려운 관계로 반영하지 않았다. 이런 부분에도 구장으로 인한 차이가 존재한다고 생각한다면... 취향에 따라 해당 스탯의 Park Factor를 찾아서 추가적으로 적용해 주면 된다. 또한, 1루타에 대한 Park Factor가 따로 없으므로... 안타 총 합계(H)의 Park Factor와 장타(XBH)의 Park Factor, 그리고 실제 2009년 메이저리그 안타, 장타 기록으로부터 1루타의 Park Factor를 유추하였다.
이렇게 조정한 Utley의 09년 성적은 아래와 같다.
687 PA, 97 1B, 28 2B, 5 3B, 28 HR, 85 NIBB, 3 IBB, 24 HBP, 4 RBOE
역시 홈런이 많은 홈구장을 쓰다 보니, 조정 결과 홈런이 약간 줄어든 것을 확인할 수 있다.
1-2. wOBA 및 wRAA 계산
wOBA 및 wRAA의 계산식 및 이론적 근거는 위의 링크를 참고하시고... Park Factor를 적용한 기록을 가지고 Utley의 wOBA를 계산한 결과는 다음과 같다. (엑셀 sheet 참조)
(Park Adjusted) wOBA = 0.390
한편, 2008년 NL 전체 타격 기록을 가지고 구한 리그 평균 wOBA는 0.328이므로, 이를 이용하여 Utley의 wRAA를 구하면 다음과 같다. (엑셀 sheet 참조)
wRAA = 37.45 Runs
즉, 2009년 시즌의 Chase Utley는 NL 평균 타자에 비해 타격으로 팀 득점에 37.45점 더 기여했다는 의미가 된다.
2. wRAA를 Batting RAR로 : Replacement Level의 설정
wRAA는 Runs Above Average라는 단어의 의미에서도 알 수 있듯이 리그 평균과 비교하는 스탯이므로, 이를 Replacement Level과의 비교로 조정하여 RAR(Runs Above Replacement leve)로 만들 필요가 있다. 이전부터 한 시즌을 기준으로 리그 평균 수준의 주전 선수와 Replacement Level의 땜빵 선수 차이에는 20점 혹은 2승 정도의 차이가 난다는 경험적 분석 결과들이 있었는데, 작년 말에 THT에 게재된 Sean Smith의 뛰어난 연구는 이를 다시 한 번 확인시켜 주었다. 즉, 600 PA를 기준으로 리그 평균과 Replacement Level의 사이에는 20점(20 Runs)의 기여 수준 격차가 있다는 것이다. 이러한 격차를 wRAA 값에 더해주면, RAR로 쉽게 환산된다.
Utley의 경우로 돌아가면, Utley는 687 PA를 기록했으므로, 687 PA에서 평균과 Replacement Level의 격차를 계산해 보면...
600/20 x 687 = 22.90 Runs
이 값이 Utley의 Replacenemt Level 값이 된다. 즉, Utley 대신 Replacement Level 선수를 시즌 내내 기용했다면, 아마도 22.9점 만큼 덜 득점했을 것이라는 이야기이다.
3. 수비 기여 수준 : UZR
이전 포스팅에서 ZR을 개선한 합리적인 스탯으로 UZR, TZ(TZR), +/-를 소개한 바 있다. 그 포스팅에서 언급한 바와 같이, +/-는 유료 정보이며 연말에 발표되고, TZ의 경우 현역 메이저리거들에 대한 데이터는 아직 작업중인 상태여서 조회가 되지 않으므로, 현재로서는 UZR이 거의 유일한 선택이라고 할 수 있다. UZR은 Fangraphs에 거의 실시간으로 계속 업데이트 되므로, 지난 시즌의 결과물 뿐 아니라 현재 진행중인 시즌에 대해서도 누구가 쉽고 빠르게 정보를 얻을 수 있다. 뿐만 아니라, TZ의 창시자인 Sean Smith조차 UZR이 가장 뛰어난 수비 스탯이라고 인정하고 있으므로, UZR을 쓰는 것이 여러 모로 좋은 선택이라고 생각한다.
Utley는 2009년 1년 내내 2루수로만 출장했으며, 1년간의 누적 UZR 값은 10.8이다.
UZR = 10.8 Runs
이는 Utley가 2008년 시즌에 수비를 통해 실점을 평균 2루수보다 10.8점 더 방지하는 정도의 기여를 했음을 의미한다.
4. Positional Adjustment
포수 : +12.5 Runs
유격수 : +7.5 Runs
중견수, 2루수, 3루수 : +2.5 Runs
좌익수, 우익수 : -7.5 Runs
1루수 : -12.5 Runs
지명타자 : -17.5 Runs
이 조정 점수는 162게임의 풀 시즌을 기준으로 만들어진 것임에 유의해야 한다. 162게임을 이닝으로 환산하면 1,458 이닝이 되므로, 실제 수비에 참가한 이닝을 1458로 나눠서 위의 조정 점수를 곱해 주면 실제 해당 시즌의 조정 점수가 될 것이다.
Utley는 2008년에 2루에서 1357 이닝을 뛰었다. 따라서...
(2.5 x 1357) / 1458 = 2.33 Runs
이 점수가 Utley의 수비 포지션에 따른 최종 조정 점수가 된다.
5. 주루플레이의 기여 수준: 도루 성공과 실패
Fangraphs는 주루플레이에 대해 도루 성공/실패만을 반영하고 있는데, 이는 Fangraphs가 다른 주루 능력에 관심이 없어서라기보다는 무료로 이용 가능한 공개 주루 스탯이 존재하지 않기 때문일 것이다. 주루 스탯을 제공하는 곳이 BP와 Bill James Online 정도밖에 없는데, 둘 다 Fangraphs에 자료를 그냥 링크해 줄 생각은 없는 듯하다.
Fangraphs의 선수 페이지에서 맨 아래에 있는 Value를 보면, Running 항목이 따로 존재하지 않고 도루 성공/실패를 Batting에 합산하고 있다. 평균적으로 도루 성공은 0.175, 도루 실패는 -0.467점의 가치(Run Value)를 지니므로, 도루 및 도루 실패의 갯수에 Run Value를 곱해서 계산하는 것이다.
Utley는 2009년에 23 SB, 0 CS를 기록하였으므로...
23 x 0.175 - 0 x 0.467 = 4.03 Runs
도루를 통해 4.03점 만큼 팀 득점에 기여하였다는 결론을 얻을 수 있다.
6. RAR 및 WAR의 산출
이제 모든 구성 요소의 계산을 다 했으므로, 지금까지 나온 값을 모두 더하면 타자의 총 기여 수준, 혹은 그의 가치(Value)가 된다.
RAR = 37.45(타격) + 22.9(Replacement Level) + 10.8(수비) + 2.33(포지션 조정) + 4.03(도루)
= 77.50
득점 10점은 1승과 동일하므로,
WAR = RAR/10 = 7.8
즉, 거칠게 표현하자면, 2009년 Chase Utley는 7.8승짜리 플레이어였다는 것이다.
2009년 Phillies는 93승 69패를 기록하였는데, 만약 Utley 대신 1년 내내 Miguel Cairo와 같은 Replacement Level 플레이어들로 2루를 돌려막기 했다면, Phillies는 아마도 85승 77패를 기록했을 것이라는 이야기이다. 이렇게 되면 Florida Marlins와 동률이 되므로, 플레이오프 진출을 장담할 수 없게 되어 버린다. 이것이 바로 진정한 스타 플레이어 한 명의 위력이다.
Fangraphs의 Utley 페이지를 보면, 2009년 그의 WAR를 7.6로 계산하고 있다. Fangraphs의 WAR 계산 로직은 이 글에서 내가 설명해 온 바와 동일하다. 0.2의 오차는 타격 기여도 계산에서 생겨난 것인데, 내가 타격에 37.45, 도루에 4.03으로 총 41.48점으로 계산한 데 비해 Fangraphs는 둘을 합쳐 39.4로 계산하고 있다. 오차의 원인으로 생각되는 것은 사용한 Park Factor 데이터의 차이 및 Park Factor 적용 방법의 차이가 가장 유력하다. 또한, 소숫점 반올림으로 인한 약간의 오차도 발생할 수 있다.
이번에는 Joe Mauer의 2009년 성적을 이용해서 WAR를 계산하여 보자.
(역시 첨부한 엑셀 sheet에 계산한 결과물이 들어 있다.)
다음은 Mauer의 2009년 타격 Raw Stat이다.
606 PA, 131 1B, 30 2B, 1 3B, 28 HR, 14 IBB, 62 NIBB, 2 HBP, 3 RBOE
Twins의 홈인 Metrodome의 Park Factor를 고려하여 위의 스탯을 조정해 주면 아래와 같다.
606 PA, 132 1B, 30 2B, 1 3B, 30 HR, 14 IBB, 62 NIBB, 2 HBP, 3 RBOE
이 기록으로부터 wOBA 및 wRAA를 계산하면,
wOBA = 0.449
wRAA = 57.50
Replacement Level = 20 / 600 * 608 = 20.2
수비 : UZR = 0 (포수는 UZR데이터가 없다.)
포지션 조정 : Mauer는 포수로 939 이닝을 뛰었으며, 지명타자로 28게임에 출장하였다. 따라서...
12.5 x 939 / 1458 - 17.5 x 28 / 162 = 5.03
도루성공/실패 : 4 SB, 1 CS이므로
4 x 0.175 - 1 x 0.467 = 0.23
이제 모두 더해주면,
RAR = 57.5(타격) + 20.2(Replacement) + 0(수비) + 5.03(포지션 조정) + 0.23(도루) = 82.96
WAR = RAR/10 = 8.3
즉, 2009년 Mauer는 8.3승짜리 플레이어였다는 것이다.
Fangraphs의 계산 결과는 8.2이다. 역시 0.1의 차이는 Park Factor 및 소수점 반올림 등으로 인한 오차로 생각된다.
여기까지가 Fangraphs의 WAR 계산 방법인데... 주루플레이가 도루 성공/실패만 단순히 계산되고 있고, 포수 UZR이 없어 포수 수비력의 차이가 반영되지 않는다는 문제점이 있음을 알 수 있다. 이제 이를 보완하는 방법을 찾아 보자.
주루플레이에 대해서는 이전에 소개한 바와 같이, Baseball Prospectus의 EqBRR을 대신 사용할 수 있다. Chase Utley의 경우 2009년 EqBRR이 8.80으로, 매우 뛰어난 주자임을 알 수 있다. 도루성공/실패로 계산한 숫자 대신 이 EqBRR을 대신 넣어서 계산하면 아래와 같다.
RAR = 37.45(타격) + 22.9(Replacement Level) + 10.8(수비) + 2.33(포지션 조정) + 8.8(주루) = 82.28
WAR = RAR/10 = 8.2
Fangraphs에서 저평가되었던 주루 능력을 제대로 평가해준 결과, Chase Utley는 이제 8.2승짜리 선수가 되었다. 워낙 주루능력이 좋은 선수이다 보니, 주루를 이렇게 반영해주지 않았더라면 억울할 뻔 했다.
이번에는 Joe Mauer를 재평가해 보자.
EqBRR에 의하면 Joe Mauer의 주루 능력은 -3.60으로 나온다. 포수들은 일반적으로 좋은 주자가 아니라는 상식과 일치하고 있다.
포수 수비력은 아직 의견이 분분한 분야이나... 이 글을 참고하면 Mauer는 2009년 수비에서 4.4점 기여한 것으로 되어 있다. 역시 Mauer는 수비가 좋은 포수라는 상식과 일치하는 결과이다.
이 둘을 기존 계산식의 주루와 UZR 대신 넣어서 계산해 보면,
RAR = 57.5(타격) + 20.2(Replacement) + 4.4(수비) + 5.03(포지션 조정) - 3.6(도루) = 83.43
WAR = RAR/10 = 8.3
수비에서 플러스 된 대신 주루에서 마이너스가 되어 RAR은 0.5점 올라가는 데 그쳤다. 결국 8.3 WAR로 거의 같은 결과를 얻게 됨을 알 수 있다. 비록 결과값은 비슷하지만 이것은 주루와 수비를 제대로 반영해 준 값이다.
나로서는 위의 방법이 크게 어렵지 않으면서도 타자의 공/수/주를 모두 커버하고 있어서 현재로서는 가장 좋은 툴이라고 생각하고 소개한 것이지만, 이러한 방법이 타자를 평가하는 단 하나의 절대적인 기준이 될 수는 없다. 취향에 따라 특정 스탯을 넣을 수도, 뺄 수도 있다. 예를 들어 EqA를 선호한다면 위의 계산에서 wRAA와 EqBRR을 빼고 대신 EqA로부터 Batting+Running Runs를 유도하여 넣어 주면 될 것이다. 혹 수비 스탯은 아무 것도 믿을 수 없다는 매우 회의적인 시각을 가진 사람이라면, UZR를 빼 버리면 될 것이다. 어떻게 활용하느냐는 각자의 몫이다.
또한, 세이버메트릭스에 절대적으로 의존하기보다는 활용 가능한 모든 정보(스카우팅 등)를 총 동원하여 여러 가지 각도에서 선수를 평가하는 것이 더욱 좋을 것이다. 물론 전문적인 스카우팅 훈련을 받거나 직접 선수생활을 해보지 않은 보통의 팬들이 자기 스스로의 안목을 가질 수 있는 방법은 역시 세이버메트릭스 만한 것이 없다고 생각하지만...
(이 글은 한국야구팬사이트에서도 보실 수 있습니다.)
Today's Music : Phil Collins Playing Drums!!! (with Chester Thompson)
Phil Collins는 무수히 많은 히트곡을 만든 송라이터이자 보컬리스트로서 유명하지만, 사실은 그런 것 이전에 매우 탁월한 드러머였다. 특히 Genesis의 초기 앨범들을 들어보면 Collins의 드럼 실력에 정말 놀라게 될 것이다. Collins는 공연시에 주로 자신의 드럼 연주로 오프닝을 장식하곤 했는데, 위의 두 라이브 클립에서는 세션 드러머 Chester Thompson(역시 아주 뛰어난 드러머임)과 환상적인 호흡을 보여준다.
Collins는 올해 가을, 아쉽게도 드러머로서 은퇴를 발표했다. 척수 부위의 부상으로 인해 스틱을 잡을 수조차 없게 되었기에, 50년간 쳐 왔던 드럼을 더 이상 칠 수 없게 되었다는 것이다. 너무나도 안타까운 일이 아닐 수 없다.