(주: 이 글의 내용 및 첨부된 계산 파일은 일부 오류를 포함하고 있으므로, 내용을 수정하여 다시 올린 새 글을 참고하시기 바란다.)

 


Chase Utley : 2008년 NL MVP 투표에서는 고작 15위에 머물렀지만, WAR로 보면 Pujols에 이어 메이저리그 전체 2위였다. 올 시즌 타자 WAR 리스트에서도 Pujols와 Hanley Ramirez에 이어 3위를 달리고 있지만, MVP 투표에서는 또 10위권 밖으로 밀려날 것이다. 항상 실력에 비해 충분한 인정을 받지 못하고 있는, 심각하게 저평가된 플레이어이다.


타자가 팀의 득점에 기여하는 방법은 크게 보아 공격(타격), 수비, 주루가 있을 것이다. 그래서 좋은 타자를 이야기할 때 "공, 수, 주 3박자를 두루 갖췄다"는 표현을 사용하기도 한다.

각각의 타자에 대해서 이러한 득점 기여의 정도가 어느 정도인지를 측정하기 위해, 지금까지 공격, 수비, 주루의 측면을 차례로 검토해 왔다. 또한 비교 대상으로서 절대적 기준이 되는 Replacement Level 및 수비 포지션에 따른 조정 수준에 대해서도 살펴본 바 있다. 이 글을 쓸 때까지 다소 시간 간격이 있었으므로... 다시 한번씩 훑어 보시면 이해에 도움이 되시리라고 생각하여 링크를 걸어 본다.

1. 타격 기여 수준 : wOBA 및 wRAA
2. 비교의 절대적 기준 : Replacement Level
3. 수비 기여 수준 : UZR, TZ
4. 포지션별 차이 : Positional Adjustment
5. 주루 기여 수준 : 도루 성공과 실패

이를 종합하면 특정 타자의 전체 기여 수준, 혹은 그의 가치(Value)를 계산할 수 있는데, 이것이 바로 RAR(Runs Above Replacement level) 및 WAR(Wins Above Replacement level) 이다.

먼저 RAR을 구해 보면... 위의 다섯 가지를 차례로 더해 주면 된다.

RAR = wRAA + Replacement Level + UZR + Positional Adjusment + SB/CS Runs

이제 RAR을 WAR로 환산해야 하는데... 원칙적으로는 팀 전체 득점과 실점에 대해 해당 플레이이어의 RAR이 미치는 점수 변화 정도를 가지고 Pythagorean Expectation의 식에 넣어서 계산하는 것이 맞지만... Pythagorean 관련 포스팅에서 언급한 바와 같이, "10점 득점 = 1승"의 단순한 계산 방법이 의외로 높은 정확도를 가지므로, 계산의 편의를 위해 이를 활용하는 것이 좋을 것이다. 즉, 아래와 같이 쉽게 계산할 수 있다.

WAR = RAR/10

이제부터 실제 예를 통해서 자세히 살펴보자.
계산에 필요한 Raw Data는 Retrosheet, Baseball-Reference, Fangraphs의 세 사이트에서 얻었으며, 이후의 모든 계산은 직접 하였다. 계산에 사용한 엑셀 sheet를 첨부하였으므로, 계산 결과를 쉽게 확인하실 수 있을 것이다.


아래는 Chase Utley의 2008년 성적이다.

공격 : 159 G, 607 AB, 707 PA, 99 1B, 41 2B, 4 3B, 33 HR, 50 NIBB, 14 IBB, 27 HBP, 5 RBOE
수비 : 20.2 UZR
주루 : 14 SB, 2 CS


(NIBB : 고의사구가 아닌 볼넷, IBB : 고의사구, RBOE : 에러로 인해 타자가 출루한 경우)

순서에 따라 차례차례 계산해 보면...

1-1. Park Adjust

먼저 wOBA를 계산하기에 앞서서, 구장으로 인한 효과를 보정해 주는 것이 계산의 신뢰도를 높이는 데 도움이 될 것이다. Park Factor를 계산하는 방법은 여러 가지가 있고, 개인적으로는 어떤 방법이 가장 좋은지 아직 결론을 내리지 못하고 있다. 일단 여기서는 Fantasy411의 2006-08년 Park Factor를 빌려와서 사용하도록 하겠다. (단, RBOE의 Park Factor는 어디에서도 얻을 수가 없었다. 어차피 Utley의 RBOE가 5에 불과하여 Park Factor가 있더라도 그다지 영향은 없었겠지만...)



정밀한 조정을 위해서는 Utley의 경기별 홈구장을 일일이 찾아서 계산해야겠지만... 너무 품이 많이 들므로, 다음과 같은 간단한 방법을 사용하였다. 1) 타석의 절반은 홈, 절반은 원정에서 기록한 것으로 본다. 2) 원정구장들의 평균 Park Factor는 100이다. (실제로는 홈구장을 뺀 15개 NL 구장의 평균이므로 100에 근접한 값일 것이나, 큰 오차는 없으리라고 본다) 3) 따라서, 홈 구장 Park Factor의 50%를 Raw Stat에 적용하여 보정한다.

이렇게 조정한 Utley의 성적은 아래와 같다.
707 PA, 98 1B, 41 2B, 4 3B, 29 HR, 51 NIBB, 13 IBB, 27 HBP, 5 RBOE

홈런이 줄어든 것이 눈에 띈다. 나머지 기록은 거의 변화 없음을 알 수 있다.

1-2. wOBA 및 wRAA 계산

이전의 포스팅에서 wOBA를 소개할 때에 비하여, 지금은 wOBA를 더욱 신뢰하게 되었다. 최근 THT의 Colin Wyers가 수행한 연구에 의하면, 90년대 및 2000년대의 메이저리그 기록을 가지고 분석할 경우 wOBA가 EqA보다도 정확도가 좀 더 높은 것으로 나타났기 때문이다. 현재 세이버메트릭스 진영에서 득점 기여 수준을 측정하는 가장 우수한 스탯으로 여겨지는 wOBA와 EqA의 승부(둘 다 실제 득점과의 correlation이 0.97로 매우 높으므로, 정말 뛰어난 스탯들이다)에서 wOBA가 근소하게나마 더 우수한 것으로 판명되었기 때문에, 타자의 공격 기여도를 측정함에 있어 wOBA를 근간으로 삼는 것은 현재로서는 최선의 방법이라고 생각된다. 또한, wOBA가 EqA보다 훨씬 계산식이 간단하고 이해하기 쉽다는 것도 큰 장점이다.

계산식 및 이론적 근거는 이전의 포스팅을 참고하시고... Park Factor를 적용한 기록을 가지고 Utley의 wOBA를 계산한 결과는 다음과 같다. (앞에 첨부한 엑셀 sheet 참조)

(Park Adjusted) wOBA = 0.382

한편, 2008년 NL 전체 타격 기록을 가지고 구한 리그 평균 wOBA는 0.330이므로, 이를 이용하여 Utley의 wRAA를 구하면 다음과 같다. (엑셀 sheet 참조)

wRAA = 32.05 Runs

즉, 2008년 시즌의 Chase Utley는 NL 평균 타자에 비해 팀 득점에 32.05점 더 기여했다는 의미가 된다.


2. wRAA를 Batting RAR로 : Replacement Level의 설정

wRAA는 Runs Above Average라는 단어의 의미에서도 알 수 있듯이 리그 평균과 비교하는 스탯이므로, 이를 Replacement Level과의 비교로 조정하여 RAR(Runs Above Replacement leve)로 만들 필요가 있다. 이전부터 한 시즌을 기준으로 리그 평균 수준의 주전 선수와 Replacement Level의 땜빵 선수 차이에는 20점 혹은 2승 정도의 차이가 난다는 경험적 분석 결과들이 있었는데, 작년 말에 THT에 게재된 Sean Smith의 뛰어난 연구는 이를 다시 한 번 확인시켜 주었다. 즉, 600 PA를 기준으로 리그 평균과 Replacement Level의 사이에는 20점(20 Runs)의 기여 수준 격차가 있다는 것이다. 이러한 격차를 wRAA 값에 더해주면, RAR로 쉽게 환산된다.

Utley의 경우로 돌아가면, Utley는 707 PA를 기록했으므로, 707 PA에서 평균과 Replacement Level의 격차를 계산해 보면...

600/20 x 707 = 23.57 Runs

이 값이 Utley의 Replacenemt Level 값이 된다.


3. 수비 기여 수준 : UZR

이전의 포스팅에서 ZR을 개선한 합리적인 스탯으로 UZR, TZ(TZR), +/-를 소개한 바 있다. 그 포스팅에서 언급한 바와 같이, +/-는 유료 정보이며 연말에 발표되고, TZ의 경우 현역 메이저리거들에 대한 데이터는 아직 작업중인 상태여서 조회가 되지 않으므로, 현재로서는 UZR이 거의 유일한 선택이라고 할 수 있다. UZR은 Fangraphs에 거의 실시간으로 계속 업데이트 되므로, 지난 시즌의 결과물 뿐 아니라 현재 진행중인 시즌에 대해서도 누구가 쉽고 빠르게 정보를 얻을 수 있다. 뿐만 아니라, TZ의 창시자인 Sean Smith조차 UZR이 가장 뛰어난 수비 스탯이라고 인정하고 있으므로, TZ나 +/- 대신 UZR을 쓰는 것이 그다지 나쁜 선택은 아닐 것 같다.

여담이지만, 2000년대 초중반에 Cardinals는 UZR의 창시자인 MGL(Mitchel Lichtman)에게 상당히 큰 돈을 주고 UZR 데이터를 독점한 바 있다. UZR이 Fangraphs에 공개될 수 있었던 것은 이러한 독점 계약이 종료되었기 때문이다. 이런 것으로 보면 Cardinals도 이전부터 세이버메트릭스에 상당한 관심과 이해가 있었던 것 같다.

다시 본론으로 돌아가서... Utley는 2루에서 20.2 Runs, 1루에서 0.4 Runs를 기록하였으므로, 이를 간단히 더해주면 된다.

UZR = 20.6 Runs

이는 Utley가 2008년 시즌에 수비를 통해 실점을 20.6점 방지하는 정도의 기여를 했음을 의미한다.


4. Positional Adjustment

이전의 포스팅에도 있지만, 다시 한 번 포지션별 조정 점수를 정리해 보면 아래와 같다.

포수 : +12.5 Runs
유격수 : +7.5 Runs
중견수, 2루수, 3루수 : +2.5 Runs
좌익수, 우익수 : -7.5 Runs
1루수 : -12.5 Runs
지명타자 : -17.5 Runs


이 조정 점수는 162게임의 풀 시즌을 기준으로 만들어진 것임에 유의해야 한다. 162게임을 이닝으로 환산하면 1,458 이닝이 되므로, 실제 수비에 참가한 이닝을 1458로 나눠서 위의 조정 점수를 곱해 주면 실제 해당 시즌의 조정 점수가 될 것이다.

Utley는 2008년에 2루에서 1395 2/3 이닝, 1루에서 14이닝을 뛰었다. 따라서...

((2.5x1392.67) + (-12.5x14)) / 1458 = 2.27 Runs

이 점수가 Utley의 수비 포지션에 따른 최종 조정 점수가 된다.


5. 주루플레이의 기여 수준: 도루 성공과 실패

이전의 포스팅에서 밝힌 바와 같이, 도루 성공은 0.175, 도루 실패는 -0.467점의 가치를 지닌다. 개인적으로 그 밖의 주루 스탯에 대해 아직 신뢰하지 않고 있는 관계로, 단지 도루 성공과 실패만을 계산할 것이다.

Utley는 2008년에 14 SB, 2 CS를 기록하였으므로...

14x0.175 - 2x0.467 = 1.52 Runs

도루를 통해 1.52점 만큼 팀 득점에 기여하였다는 결론을 얻을 수 있다.


6. RAR 및 WAR의 산출

이제 모든 구성 요소의 계산을 다 했으므로, 지금까지 나온 값을 모두 더하면 타자의 총 기여 수준, 혹은 그의 가치(Value)가 된다.

RAR = 32.05(타격) + 23.57(Replacement Level) + 20.6(수비) + 2.27(포지션 조정) + 1.52(도루)
      = 80.01


득점 10점은 1승과 동일하므로,

WAR = RAR/10 = 8.0

즉, 거칠게 표현하자면, 2008년 Chase Utley는 8승짜리 플레이어였다는 것이다.

2008년 Phillies는 92승 70패를 기록하였는데, 만약 Utley 대신 1년 내내 Tadahito Iguchi나 Eric Brunett과 같은 Replacement Level 플레이어들로 2루를 돌려막기 했다면, Phillies는 아마도 84승 78패를 기록했을 것이라는 이야기이다. 이런 성적으로는 플레이오프에 나갈 수 없었을 것이고, 따라서 월드시리즈 우승도 할 수 없었을 것이다. 이것이 바로 진정한 스타 플레이어 한 명의 위력이다.

Fangraphs의 Utley 페이지를 보면, 2008년 그의 WAR를 8.1로 계산하고 있다. Fangraphs의 로직은 이 글에서 내가 설명해 온 바와 동일하다고 보면 된다. 0.1의 오차는 타격 기여도 계산에서 생겨난 것인데, 아마도 wOBA 계산 방법이 약간 다르고, Park Factor의 적용에도 차이가 있을 것으로 추정된다. 또한, Fangraphs는 주루를 따로 표시하지 않고, 타격에 합산하여 놓고 있다.


한편, 첨부된 엑셀 파일에는 작년 AL MVP였던 Dustin Pedroia의 WAR도 계산되어 있다. 다만, 이쪽은 Fangraphs가 6.6 WAR로 계산했는데 반해 엑셀 sheet에서는 5.8이 되어서, 차이가 0.8로 제법 크게 나타나고 있다. 실제 계산된 값을 보시면 알 수 있듯이 타격 기여 수준을 빼고는 값이 완전히 동일하므로... 역시 Park Factor의 차이가 작용하고 있는 것으로 추정된다. (Fangraphs는 어떤 Park Factor를 적용하고 있는지 명시하지 않고 있다.) 또한, schedule의 차이를 고려한 플러스 점수가 있는 것 같기도 하다. AL 동부에 속해 있는 Red Sox는 아무래도 Phillies보다는 강한 팀들을 상대로 게임을 하게 되므로, 이를 보정해 주었을 가능성이 있다. 이러한 schedule에 의한 보정이 어떻게 이루어지는지 파악이 될 경우에는, 여기에 추가로 업데이트를 하고자 한다.

Posted by FreeRedbird
:


Pujols vs A-Rod : 전통의 떡밥

우리나라의 MLB 게시판에서... 가장 흔한 낚시질은 "Pujols와 A-Rod 중 누가 더 대단한 선수일까?" 와 같은 비교글이다.
오래된 떡밥임에도 불구하고 언제나 효과 만점이어서, 수많은 MLB 팬들이 이런 저런 근거를 대 가며 싸우게 되기 마련이다. 비록 A-Rod의 약물 복용 사실이 드러난 뒤에는 낚시질의 효과가 좀 떨어지기는 했지만, 그래도 여전히 매력적인 떡밥임은 틀림없다.

위의 논쟁에서 A-Rod 편을 드는 사람들이 주로 하는 이야기가 바로 "3루수는 1루수보다 수비하기가 훨씬 어려운 포지션이므로, 1루수가 아무리 잘해봤자 3루수를 따라올 수 없다"는 식의 주장이다. 정말 그럴까? 3루가 1루보다 수비하기 어려운 것은 정설로 되어 있지만, 문제는 과연 얼마만큼 어려운가이다.

세이버메트릭스 진영에서는 이러한 문제에 대해서도 많은 연구가 있어 왔다. 각 포지션 별로 수비의 난이도를 평가하여, 선수를 평가할 때 포지션에 따라 조정을 해 주는 것이다. 이를 Positional Adjustment라고 한다.

Adjustment 값에 대한 연구는 주로 두 개 이상의 포지션을 오랫동안 소화한 선수들이 각 포지션에서 상대적으로 어느 정도의 수비 능력을 보였는가를 비교함으로써 이루어졌다. 예를 들어, 어떤 선수가 좌익수로 기용될 때에는 +5 Runs의 좋은 수비수였는데, 팀 사정에 따라 이 선수를 중견수로 기용하였더니 -5의 수비수가 되었다고 하면, 이 경우 좌익수와 중견수의 난이도 차이는 10 Runs인 셈이다. 수 년에 걸쳐 이런 경우를 모두 모아서 평균을 구해 보면 포지션별 상대적 난이도를 얻을 수 있을 것이다.

이 값은 시대에 따라, 연구자에 따라 조금씩 다른데... 여기에는 현대 메이저리그에 대한 Tom Tango의 값을 소개한다. (단, 162게임에 대한 점수임에 유의해야 한다.)

포수 : +12.5 Runs
유격수 : +7.5 Runs
중견수, 2루수, 3루수 : +2.5 Runs
좌익수, 우익수 : -7.5 Runs
1루수 : -12.5 Runs
지명타자 : -17.5 Runs



예를 들어, 리그 평균 수준의 유격수와 리그 평균 수준의 우익수는 한 시즌에 15점 정도의 수비 기여도가 차이나는 것이다. 혹은 유격수가 우익수에 비해 시즌 당 15점 정도의 차이가 날 만큼 수비하기 더 어려운 포지션이라고 말할 수도 있겠다.

이 값은 Sean Smith에 의해 검증되었으며, 상당히 정확한 것으로 나타났다. 다만, Sean Smith는 포수와 1루수에 대해 각각 +10, -10을 적용할 것을 제안하고 있다. 자세한 내용은 아래 글을 참고하시기 바란다.
http://www.hardballtimes.com/main/article/replacement-level-article/

이에 대하여 원작자인 Tom Tango가 답변한 내용은 아래 글 참조.
http://www.insidethebook.com/ee/index.php/site/article/replacement_level_using_forecasted_players/


여기서 문제가 되는 것이 DH의 경우이다. DH는 실제로 수비를 하지 않으므로 위와 같은 비교 연구가 불가능하기 때문이다. -17.5의 수치는 이론적으로 나온 것으로... Tom Tango는 지명타자를 "수비가 나쁜 1루수"로 간주하여 그를 풀타임 1루수로 기용할 경우 일반 1루수에 비해 1승(10점) 만큼 팀에 더 피해를 입힌다고 보았다. 이렇게 하면 지명타자의 Positional Adjustment가 -12.5 - 10 = -22.5가 되어야 할 것이다. 하지만, 그가 <The Book>에서 밝힌 연구결과와 같이, 어떤 선수가 DH로 뛰게 되면 오히려 수비를 할 때에 비해 일정 수준 타격능력이 떨어지게 되는 현상이 발견되었다. 수비를 안하고 벤치에 앉아 있기만 해서 몸이 안 풀려서 그런 것인지는 잘 모르겠으나, 대부분의 DH들은 수비수로 뛸 때보다 타격이 분명히 약화되었다. 이를 감안하여, "DH로 뛴다는 것의 어려움"을 고려하여 +5점을 해 줘서, 최종적으로 DH의 Positional Adjustment는 -17.5가 된 것이다.


이제 원래의 떡밥으로 돌아가자. A-Rod는 3루수이므로 1루수인 Pujols보다 수비에서 무조건 우월한가?

Fangraphs를 참고하면,
A-Rod의 2006-08 3년간의 UZR/150은 각각 -12.4, 2.3, -3.2이므로, 3년 평균 값은 -4.3이다.
반면 Pujols의 경우는 2006년부터 2008년까지 각각 4.5, 16.0, 8.5의 UZR/150 값을 나타내고 있다. 3년 평균 값은 9.7이다.

두 선수에게 Positional Adjustment를 적용하여 보자.
위에서 소개한 값은 162게임에 대한 값이었음을 다시 한번 상기하자. 여기서 우리는 150게임에 대한 수비 스탯인 UZR/150을 이용하고 있으므로, 150게임에 맞게 조정하여 주어야 한다. 이렇게 조정하면 3루수는 +2.3, 1루수는 -11.6이 된다.

A-Rod는 3루수이므로 -4.3에 2.3점을 더해 주어서 최종 결과는 -2 이다.
Pujols는 1루수이므로 9.7에서 11.6점을 빼 주어서 최종 결과는 -1.9 이다.

아주 근소한 차이로 Pujols의 승리이다. 하지만 그 차이는 150게임에서 0.1점에 불과하므로, 무시해도 좋을 수준일 것이다. 결국 수비 공헌도로 보자면, A-Rod와 Pujols는 같다고 보아도 무방하다. 이렇게 해서, A-Rod는 3루수이므로 1루수인 Pujols보다 무조건 뛰어나다는 식의 주장은 전혀 근거없는 억측임을 알 수 있다.


여기까지 해서, 우리는 타격에서의 공헌 정도, 수비에서의 공헌 정도, 그리고 포지션에 따른 조정 점수에 대해 알아보았다. 그리고 비교의 기준이 되는 Replacement Level에 대해서도 알아보았다. 이제 주루플레이 부분만 검토하고 나면, 특정 타자가 실제로 팀에 몇 점, 혹은 몇 승을 올릴 수 있도록 기여하는지 계량할 수 있을 것이다.
Posted by FreeRedbird
: