(주: 이 글의 내용 및 첨부된 계산 파일은 일부 오류를 포함하고 있으므로, 내용을 수정하여 다시 올린 새 글을 참고하시기 바란다.)

 


Chase Utley : 2008년 NL MVP 투표에서는 고작 15위에 머물렀지만, WAR로 보면 Pujols에 이어 메이저리그 전체 2위였다. 올 시즌 타자 WAR 리스트에서도 Pujols와 Hanley Ramirez에 이어 3위를 달리고 있지만, MVP 투표에서는 또 10위권 밖으로 밀려날 것이다. 항상 실력에 비해 충분한 인정을 받지 못하고 있는, 심각하게 저평가된 플레이어이다.


타자가 팀의 득점에 기여하는 방법은 크게 보아 공격(타격), 수비, 주루가 있을 것이다. 그래서 좋은 타자를 이야기할 때 "공, 수, 주 3박자를 두루 갖췄다"는 표현을 사용하기도 한다.

각각의 타자에 대해서 이러한 득점 기여의 정도가 어느 정도인지를 측정하기 위해, 지금까지 공격, 수비, 주루의 측면을 차례로 검토해 왔다. 또한 비교 대상으로서 절대적 기준이 되는 Replacement Level 및 수비 포지션에 따른 조정 수준에 대해서도 살펴본 바 있다. 이 글을 쓸 때까지 다소 시간 간격이 있었으므로... 다시 한번씩 훑어 보시면 이해에 도움이 되시리라고 생각하여 링크를 걸어 본다.

1. 타격 기여 수준 : wOBA 및 wRAA
2. 비교의 절대적 기준 : Replacement Level
3. 수비 기여 수준 : UZR, TZ
4. 포지션별 차이 : Positional Adjustment
5. 주루 기여 수준 : 도루 성공과 실패

이를 종합하면 특정 타자의 전체 기여 수준, 혹은 그의 가치(Value)를 계산할 수 있는데, 이것이 바로 RAR(Runs Above Replacement level) 및 WAR(Wins Above Replacement level) 이다.

먼저 RAR을 구해 보면... 위의 다섯 가지를 차례로 더해 주면 된다.

RAR = wRAA + Replacement Level + UZR + Positional Adjusment + SB/CS Runs

이제 RAR을 WAR로 환산해야 하는데... 원칙적으로는 팀 전체 득점과 실점에 대해 해당 플레이이어의 RAR이 미치는 점수 변화 정도를 가지고 Pythagorean Expectation의 식에 넣어서 계산하는 것이 맞지만... Pythagorean 관련 포스팅에서 언급한 바와 같이, "10점 득점 = 1승"의 단순한 계산 방법이 의외로 높은 정확도를 가지므로, 계산의 편의를 위해 이를 활용하는 것이 좋을 것이다. 즉, 아래와 같이 쉽게 계산할 수 있다.

WAR = RAR/10

이제부터 실제 예를 통해서 자세히 살펴보자.
계산에 필요한 Raw Data는 Retrosheet, Baseball-Reference, Fangraphs의 세 사이트에서 얻었으며, 이후의 모든 계산은 직접 하였다. 계산에 사용한 엑셀 sheet를 첨부하였으므로, 계산 결과를 쉽게 확인하실 수 있을 것이다.


아래는 Chase Utley의 2008년 성적이다.

공격 : 159 G, 607 AB, 707 PA, 99 1B, 41 2B, 4 3B, 33 HR, 50 NIBB, 14 IBB, 27 HBP, 5 RBOE
수비 : 20.2 UZR
주루 : 14 SB, 2 CS


(NIBB : 고의사구가 아닌 볼넷, IBB : 고의사구, RBOE : 에러로 인해 타자가 출루한 경우)

순서에 따라 차례차례 계산해 보면...

1-1. Park Adjust

먼저 wOBA를 계산하기에 앞서서, 구장으로 인한 효과를 보정해 주는 것이 계산의 신뢰도를 높이는 데 도움이 될 것이다. Park Factor를 계산하는 방법은 여러 가지가 있고, 개인적으로는 어떤 방법이 가장 좋은지 아직 결론을 내리지 못하고 있다. 일단 여기서는 Fantasy411의 2006-08년 Park Factor를 빌려와서 사용하도록 하겠다. (단, RBOE의 Park Factor는 어디에서도 얻을 수가 없었다. 어차피 Utley의 RBOE가 5에 불과하여 Park Factor가 있더라도 그다지 영향은 없었겠지만...)



정밀한 조정을 위해서는 Utley의 경기별 홈구장을 일일이 찾아서 계산해야겠지만... 너무 품이 많이 들므로, 다음과 같은 간단한 방법을 사용하였다. 1) 타석의 절반은 홈, 절반은 원정에서 기록한 것으로 본다. 2) 원정구장들의 평균 Park Factor는 100이다. (실제로는 홈구장을 뺀 15개 NL 구장의 평균이므로 100에 근접한 값일 것이나, 큰 오차는 없으리라고 본다) 3) 따라서, 홈 구장 Park Factor의 50%를 Raw Stat에 적용하여 보정한다.

이렇게 조정한 Utley의 성적은 아래와 같다.
707 PA, 98 1B, 41 2B, 4 3B, 29 HR, 51 NIBB, 13 IBB, 27 HBP, 5 RBOE

홈런이 줄어든 것이 눈에 띈다. 나머지 기록은 거의 변화 없음을 알 수 있다.

1-2. wOBA 및 wRAA 계산

이전의 포스팅에서 wOBA를 소개할 때에 비하여, 지금은 wOBA를 더욱 신뢰하게 되었다. 최근 THT의 Colin Wyers가 수행한 연구에 의하면, 90년대 및 2000년대의 메이저리그 기록을 가지고 분석할 경우 wOBA가 EqA보다도 정확도가 좀 더 높은 것으로 나타났기 때문이다. 현재 세이버메트릭스 진영에서 득점 기여 수준을 측정하는 가장 우수한 스탯으로 여겨지는 wOBA와 EqA의 승부(둘 다 실제 득점과의 correlation이 0.97로 매우 높으므로, 정말 뛰어난 스탯들이다)에서 wOBA가 근소하게나마 더 우수한 것으로 판명되었기 때문에, 타자의 공격 기여도를 측정함에 있어 wOBA를 근간으로 삼는 것은 현재로서는 최선의 방법이라고 생각된다. 또한, wOBA가 EqA보다 훨씬 계산식이 간단하고 이해하기 쉽다는 것도 큰 장점이다.

계산식 및 이론적 근거는 이전의 포스팅을 참고하시고... Park Factor를 적용한 기록을 가지고 Utley의 wOBA를 계산한 결과는 다음과 같다. (앞에 첨부한 엑셀 sheet 참조)

(Park Adjusted) wOBA = 0.382

한편, 2008년 NL 전체 타격 기록을 가지고 구한 리그 평균 wOBA는 0.330이므로, 이를 이용하여 Utley의 wRAA를 구하면 다음과 같다. (엑셀 sheet 참조)

wRAA = 32.05 Runs

즉, 2008년 시즌의 Chase Utley는 NL 평균 타자에 비해 팀 득점에 32.05점 더 기여했다는 의미가 된다.


2. wRAA를 Batting RAR로 : Replacement Level의 설정

wRAA는 Runs Above Average라는 단어의 의미에서도 알 수 있듯이 리그 평균과 비교하는 스탯이므로, 이를 Replacement Level과의 비교로 조정하여 RAR(Runs Above Replacement leve)로 만들 필요가 있다. 이전부터 한 시즌을 기준으로 리그 평균 수준의 주전 선수와 Replacement Level의 땜빵 선수 차이에는 20점 혹은 2승 정도의 차이가 난다는 경험적 분석 결과들이 있었는데, 작년 말에 THT에 게재된 Sean Smith의 뛰어난 연구는 이를 다시 한 번 확인시켜 주었다. 즉, 600 PA를 기준으로 리그 평균과 Replacement Level의 사이에는 20점(20 Runs)의 기여 수준 격차가 있다는 것이다. 이러한 격차를 wRAA 값에 더해주면, RAR로 쉽게 환산된다.

Utley의 경우로 돌아가면, Utley는 707 PA를 기록했으므로, 707 PA에서 평균과 Replacement Level의 격차를 계산해 보면...

600/20 x 707 = 23.57 Runs

이 값이 Utley의 Replacenemt Level 값이 된다.


3. 수비 기여 수준 : UZR

이전의 포스팅에서 ZR을 개선한 합리적인 스탯으로 UZR, TZ(TZR), +/-를 소개한 바 있다. 그 포스팅에서 언급한 바와 같이, +/-는 유료 정보이며 연말에 발표되고, TZ의 경우 현역 메이저리거들에 대한 데이터는 아직 작업중인 상태여서 조회가 되지 않으므로, 현재로서는 UZR이 거의 유일한 선택이라고 할 수 있다. UZR은 Fangraphs에 거의 실시간으로 계속 업데이트 되므로, 지난 시즌의 결과물 뿐 아니라 현재 진행중인 시즌에 대해서도 누구가 쉽고 빠르게 정보를 얻을 수 있다. 뿐만 아니라, TZ의 창시자인 Sean Smith조차 UZR이 가장 뛰어난 수비 스탯이라고 인정하고 있으므로, TZ나 +/- 대신 UZR을 쓰는 것이 그다지 나쁜 선택은 아닐 것 같다.

여담이지만, 2000년대 초중반에 Cardinals는 UZR의 창시자인 MGL(Mitchel Lichtman)에게 상당히 큰 돈을 주고 UZR 데이터를 독점한 바 있다. UZR이 Fangraphs에 공개될 수 있었던 것은 이러한 독점 계약이 종료되었기 때문이다. 이런 것으로 보면 Cardinals도 이전부터 세이버메트릭스에 상당한 관심과 이해가 있었던 것 같다.

다시 본론으로 돌아가서... Utley는 2루에서 20.2 Runs, 1루에서 0.4 Runs를 기록하였으므로, 이를 간단히 더해주면 된다.

UZR = 20.6 Runs

이는 Utley가 2008년 시즌에 수비를 통해 실점을 20.6점 방지하는 정도의 기여를 했음을 의미한다.


4. Positional Adjustment

이전의 포스팅에도 있지만, 다시 한 번 포지션별 조정 점수를 정리해 보면 아래와 같다.

포수 : +12.5 Runs
유격수 : +7.5 Runs
중견수, 2루수, 3루수 : +2.5 Runs
좌익수, 우익수 : -7.5 Runs
1루수 : -12.5 Runs
지명타자 : -17.5 Runs


이 조정 점수는 162게임의 풀 시즌을 기준으로 만들어진 것임에 유의해야 한다. 162게임을 이닝으로 환산하면 1,458 이닝이 되므로, 실제 수비에 참가한 이닝을 1458로 나눠서 위의 조정 점수를 곱해 주면 실제 해당 시즌의 조정 점수가 될 것이다.

Utley는 2008년에 2루에서 1395 2/3 이닝, 1루에서 14이닝을 뛰었다. 따라서...

((2.5x1392.67) + (-12.5x14)) / 1458 = 2.27 Runs

이 점수가 Utley의 수비 포지션에 따른 최종 조정 점수가 된다.


5. 주루플레이의 기여 수준: 도루 성공과 실패

이전의 포스팅에서 밝힌 바와 같이, 도루 성공은 0.175, 도루 실패는 -0.467점의 가치를 지닌다. 개인적으로 그 밖의 주루 스탯에 대해 아직 신뢰하지 않고 있는 관계로, 단지 도루 성공과 실패만을 계산할 것이다.

Utley는 2008년에 14 SB, 2 CS를 기록하였으므로...

14x0.175 - 2x0.467 = 1.52 Runs

도루를 통해 1.52점 만큼 팀 득점에 기여하였다는 결론을 얻을 수 있다.


6. RAR 및 WAR의 산출

이제 모든 구성 요소의 계산을 다 했으므로, 지금까지 나온 값을 모두 더하면 타자의 총 기여 수준, 혹은 그의 가치(Value)가 된다.

RAR = 32.05(타격) + 23.57(Replacement Level) + 20.6(수비) + 2.27(포지션 조정) + 1.52(도루)
      = 80.01


득점 10점은 1승과 동일하므로,

WAR = RAR/10 = 8.0

즉, 거칠게 표현하자면, 2008년 Chase Utley는 8승짜리 플레이어였다는 것이다.

2008년 Phillies는 92승 70패를 기록하였는데, 만약 Utley 대신 1년 내내 Tadahito Iguchi나 Eric Brunett과 같은 Replacement Level 플레이어들로 2루를 돌려막기 했다면, Phillies는 아마도 84승 78패를 기록했을 것이라는 이야기이다. 이런 성적으로는 플레이오프에 나갈 수 없었을 것이고, 따라서 월드시리즈 우승도 할 수 없었을 것이다. 이것이 바로 진정한 스타 플레이어 한 명의 위력이다.

Fangraphs의 Utley 페이지를 보면, 2008년 그의 WAR를 8.1로 계산하고 있다. Fangraphs의 로직은 이 글에서 내가 설명해 온 바와 동일하다고 보면 된다. 0.1의 오차는 타격 기여도 계산에서 생겨난 것인데, 아마도 wOBA 계산 방법이 약간 다르고, Park Factor의 적용에도 차이가 있을 것으로 추정된다. 또한, Fangraphs는 주루를 따로 표시하지 않고, 타격에 합산하여 놓고 있다.


한편, 첨부된 엑셀 파일에는 작년 AL MVP였던 Dustin Pedroia의 WAR도 계산되어 있다. 다만, 이쪽은 Fangraphs가 6.6 WAR로 계산했는데 반해 엑셀 sheet에서는 5.8이 되어서, 차이가 0.8로 제법 크게 나타나고 있다. 실제 계산된 값을 보시면 알 수 있듯이 타격 기여 수준을 빼고는 값이 완전히 동일하므로... 역시 Park Factor의 차이가 작용하고 있는 것으로 추정된다. (Fangraphs는 어떤 Park Factor를 적용하고 있는지 명시하지 않고 있다.) 또한, schedule의 차이를 고려한 플러스 점수가 있는 것 같기도 하다. AL 동부에 속해 있는 Red Sox는 아무래도 Phillies보다는 강한 팀들을 상대로 게임을 하게 되므로, 이를 보정해 주었을 가능성이 있다. 이러한 schedule에 의한 보정이 어떻게 이루어지는지 파악이 될 경우에는, 여기에 추가로 업데이트를 하고자 한다.

Posted by FreeRedbird

댓글을 달아 주세요

  1. BlogIcon 반바스틴 2009.09.16 10:01 Address Modify/Delete Reply

    저는 좌익과 1루중에 어느포지션이 더 쉬운포지션일까 고민해왔는데 세이버에서는 간단히도 1루수가 훨씬 쉬운(?)걸로 판단하는군요

    저는 좌익이 더 편하지않을까 생각이 되었는데... 좌익과 우익의 차이도 없는것도 좀 놀랍군요

    • BlogIcon FreeRedbird 2009.09.16 14:20 신고 Address Modify/Delete

      포지션에 의한 조정 점수는 통계적 연구 결과가 누적됨에 따라 조금씩 변경되어 왔으며, 현재는 위에 언급한 수치가 대세입니다. 물론 약간의 이견이 존재하여, Sean Smith 같은 경우는 위의 수치에서 포수가 +10, 1루수가 -10으로 조정되어야 한다고 주장하기도 합니다. 이렇게 되면 1루수와 좌익수의 차이가 줄어들죠. 하지만 여전히 좌익수가 1루수보다 조금 더 어려운 포지션이라고 보는 점은 변함없습니다.

      우익수와 좌익수는... 선수 개개인으로 보면 차이가 조금씩 존재합니다. 아무래도 특정 선수의 수비 범위(range)라는 것이 전후좌우가 모두 동일하지 않기 때문에, 어떤 외야수는 왼쪽으로 잘 움직이고, 어떤 외야수는 오른쪽으로 잘 움직이는 등의 차이가 존재하죠. 따라서 개개인을 놓고 보면 좌익수와 우익수 중에 좀 더 적합한 포지션이 존재합니다. 또한 3루로 뛰는 주자를 잡기 위해 강한 어깨를 가진 외야수가 우익수 자리에 선호되죠. 하지만.. 개개인이 아니라 집합적으로 놓고 보면, 좌익수와 우익수의 수비적 가치 혹은 수비 난이도는 거의 동일하다고 볼 수 있습니다.

  2. BlogIcon 박상혁 2012.07.23 11:08 신고 Address Modify/Delete Reply

    이런글을 이제서야 보게되었네요.
    WAR에 대한 궁금증이 많이 풀렸습니다.
    ^^ 감사합니다.

이전 포스팅에 이어서, WAR 계산하기 시리즈의 두 번째로, Replacement Level(대체 수준)을 소개하고자 한다. 정말이지... 쓰고 싶은 것은 많은데... 시간이 늘 부족하다.

오늘의 포스팅은, 여러 자료를 활용하였지만, 특히 Baseball Prospectus의 책인 <Baseball between the Numbers>를 많이 참고하여 작성하였음을 미리 밝혀 둔다. 이것은 Baseball Prospectus의 Keith Woolner가 Replacement Level 및 VORP의 원조이기 때문이다.


네이버나 다음 등의 포털에서 Replacement Level을 검색하면, Keith Woolner가 Replacement Level과 VORP를 처음 발표했을 때의 글을 우리말로 번역한 글 정도만 검색되어 나오는 것 같다. 이 포스팅이 가능한 한 좀 더 알기쉬운 우리말 설명이 될 수 있도록 최선을 다 해 보고자 한다.


- 타자의 Replacement Level 구하기 -

무엇이든 객관적으로 비교하고자 한다면 뭔가 절대적인 기준이 필요하다. 제일 먼저 떠오르는 기준은 리그 평균이다. 리그 평균은 쉽계 계산 가능하다는 장점이 있다. 하지만 "리그 평균 성적의 메이저리거"라는 것은 사실 무척 높은 기준이다. Low Minor에 있는 어린 유망주들은 그렇다 치더라도, 메이저리그와 마이너리그를 오가는 수많은 AAAA 플레이어와 저니맨들이 있기 때문이다. 아래의 출루율 그래프을 보자. 이 그림은 The Hardball Times에서 가져온 것이다.

image

이 그래프는 2008년에 110타석 이상을 기록한 선수들을 대상으로 출루율(OBP)을 조사하여 메이저리그와 마이너리그에서 출루율의 분포를 나타낸 것이다. Y축은 퍼센티지이며, 마이너리그는 AAA와 AA만을 대상으로 하였다. (싱글 A에 있는 유망주가 어느날 갑자기 메이저리그에 콜업되거나 할 일은 없으므로, 비교 대상으로 부적절하다.)

위의 그래프에서, 메이저리그의 평균 출루율은 .330~.340 사이에 위치하고 있다. (정확히는 .336 이다.) 그 밑으로 얼마나 많은 플레이어들이 있는지 쉽게 확인할 수 있을 것이다. (빨간색+파란색 하면 메이저리그 평균 이하이면서 현재 메이저리그에서 뛰고 있거나 혹은 AAA, AA에 있으면서 시즌 중 메이저리그에 합류할 가능성이 있는 플레이어들의 합이 된다.) 만약 리그 평균을 기준으로 플레이어를 평가한다면, 무수히 많은 마이너스 값을 얻게 될 것이다. 이것은 보기도 좋지 않거니와, 마이너스 값 때문에 추가적인 분석이나 계산을 수행하기에도 애로사항이 많다.


이러한 필요에 의해서, 소위 "Replacement Level"이라는 개념이 Baseball ProspectusKeith Woolner에 의해 발명되었다. 어쩌면 세이버메트릭스의 역사에서 가장 중요한 사건이라고 할 수도 있을만큼, Replacement Level의 영향력과 파급효과는 막대한 것이었다.

Replacement Level에 대한 Keith Woolner 본인의 정의를 들어 보자. 이하는 <Baseball between the Numbers> 161페이지에 나오는 정의 부분을 그대로 옮긴 것이다.

Replacement Level is the expected level of performance a major league team will receive from one or more of the best available players who can be obtained with minimal expenditure of team resources to substitute for a suddenly unavailable starting player at the same position.

이해를 돕기 위하여 예를 들어 보도록 하겠다.

Cardinals의 주전 우익수는 Ryan Ludwick이다. 어느 날 Ludwick이 수비를 하다가 외야에서 넘어지면서 어딘가 한 군데가 부러져서 1~2개월 정도 결장하게 되었다고 하자. (위의 정의에서 말하는 "suddenly unavailable starting player"이다) Mozeliak 단장은 그의 빈자리를 메꾸기 위해서 AAA에서 외야수 Nick Stavinoha를 메이저리그 로스터로 올려 보낸다. 마이너리그 선수가 메이저리그에 올라가게 되면 자동적으로 리그 최저 임금을 적용 받게 된다. (위의 정의에서 말하는 "obtained with minimal expenditure of team resources"이다) 이제 La Russa 감독은 주전 우익수를 잃어버렸으므로, 우익수 자리에 Ankiel과 Stavinoha, 심지어 Joe Thurston 등을 상황에 따라 적당히 돌려가며 기용할 것이다. (위의 정의에서 말하는 "one or more of the best available players"이다)

최저의 비용으로 대체 선수를 조달하는 방법은 꼭 AAA 선수의 콜업만 있는 것이 아니다. 외야 한 자리를 메꾸기 위해, 현재 집에서 놀고 있는 Jim Edmonds를 잘 꼬셔서 최저연봉 수준으로 계약하여 로스터에 합류시키는 방법도 있다. 혹은 다른 팀의 Waiver Wire를 살펴 보니 마침 Matt Murton 같은 땜빵용으로 적당한 외야수가 웨이버 공시 되어 있었다면, 그를 클레임 해서 데려오는 방법도 가능할 것이다. 몇 주 버티다 보면 부상에서 회복된 Ludwick이 돌아와서 다시 주전 우익수가 될 것이므로, Cardinals는 굳이 다른 구단에서 주전급 우익수를 또 트레이드 해 오지는 않을 것이다.

위에서 언급한 세 가지 방법, 즉 1) AAA 선수의 콜업, 2) 집에서 놀고 있거나 인디 리그에서 뛰고 있는 선수와 계약, 3) 웨이버 클레임 정도가 최저 비용으로 대체 선수를 조달하는 일반적인 방법이 되겠다. 이런 대체 선수는 대개의 경우 혼자서 주전을 맡을 만큼 기량이 뛰어나지 않으므로, 기존의 벤치 멤버들과 섞여서 돌려가며 기용되는 일이 많을 것이다. 이렇게 부상당한 주전 대신 돌아가며 해당 포지션에 기용되는 땜빵 선수들이 집합적으로 내 줄 것이라고 기대하는 퍼포먼스의 수준이 바로 Replacement Level인 것이다.


Keith Woolner와 그의 동료들은 지난 100 년간의 메이저리그 기록(오타가 아니다. 진짜 100년이다!!)을 바탕으로 각 팀에서 주전을 제외한 나머지 선수들이 공격에서 어떠한 성적을 내 왔는지 통계를 내 보았다. 공격의 기여 수준을 측정하는 지표로는 RC/27을 사용하였다. (RC에 대해서는 지난 번 포스팅에서 간략히 설명한 바 있다.) 그 결과... 다음과 같은 결론을 얻었다.

1) 주전 선수와 대체 선수의 타석 수 비율은 대체로 8:2 이다.
2) 평균적인 대체 선수들은 평균적인 주전 선수에 비해 80% 정도의 성적을 냈다. 단, 약간의 예외가 있는데, 포수를 맡은 대체 선수들은 주전의 85% 정도의 성적을 냈으며, 1루수를 맡은 대체 선수들은 75% 정도의 성적을 냈다.

예외 부분은 상식적으로도 어느 정도 납득이 가능하다. 포수의 공격력은 대체로 시원찮으므로 주전과 대체 사이의 공격력 갭이 상대적으로 작을 것이며, 반면 1루수들은 대개 팀의 주포를 맡고 있으므로 주전과 대체 사이의 갭이 클 것이다.


그럼 이러한 Replacement Level이 어느 정도인지를 어떻게 구할 수 있을까? 이에 대해서는 명확히 합의된 바가 없으며, 다양한 아이디어와 공식들이 개발되어 경합하고 있는 상황이다. 다만 여러 연구 결과에 따르면, 여러 방식으로 Replacement Level을 구해 보면 거의 비슷한 결과를 얻게 된다고 한다. 이 글에서는 Replacement Level을 만든 장본인인 Keith Woolner의 공식을 소개하고자 한다.

Keith Woolner와 그의 동료들은 소위 slash stat(AVG/OBP/SLG)을 가지고 Replacement Level을 계산하는 식을 고안하였는데, 그 식은 아래와 같다. 역시 <Baseball bewteen the Numbers>에 소개된 내용이다.


사용자 삽입 이미지

여기서 P는 우리가 구하고자 하는 포인트로 Replacement Level과 리그 평균과의 갭을 의미하며, R은 해당 포지션에서 Replacement Level과 리그 평균과의 퍼포먼스 비율이다. 예를 통해 설명하도록 하겠다.

책에서 사용한 예를 활용하자면, 어느 시즌의 리그 평균 좌익수의 타격 성적이 .270/.340/.430이라고 하자. Replacement Level LF는 주전들에 비해 80% 정도의 퍼포먼스를 낼 것으로 기대되므로, 위의 식에서 R값은 0.8이 된다. 여기에 AVG, OBP, SLG를 각각 대입하면, P=0.033을 얻게 된다. 이 P값을 AVG/OBP/SLG에서 각각 빼 주면, 그게 바로 우리가 찾고자 하는 Replacement Level의 퍼포먼스가 된다. 즉, 그 시즌의 Replacement Level 좌익수의 예상 타격 성적은 .237/.307/.397이다.

시즌과 리그에 따라 약간씩 변동이 있으나, 리그 평균 플레이어의 퍼포먼스와 Replacement Level 플레이어의 퍼포먼스를 비교하면 대략 20점(20 Runs) 차이가 난다. 20점의 차이는 팀의 승패에 어느 정도의 영향을 미칠까? 이전 포스팅 중 Pythagorean Record에 관한 글을 기억하시는지? 그 포스팅에서, 가장 간단한 방법인 10점=1승 으로 계산하여도 오차가 별로 없음을 엑셀 파일을 통해 보여 드린 바 있다. 따라서, 여기에서도 동일하게 10점을 1승으로 생각하면 큰 무리가 없다. 즉, 평균적인 메이저리거와 Replacement Level 플레이어의 차이는, 승 수로 환산하면 약 2승이 되는 것이다.

즉, 어떤 팀이 2루에 리그 평균 2루수를 1년 내내 기용했고, 그 시즌에서 82승 80패를 기록했다고 하자. 만약 그 2루수가 spring training에서 심각한 부상을 당해서 시즌 아웃 되었고, 구단이 금전적 여유가 없어 1년 내내 Replacement Level 2루수들로 돌려막기를 했다면, 그 팀은 아마도 그 시즌에서 80승 82패를 할 것이라는 의미이다.

참고로, 최근에는 리그 평균과 Replacement Level의 차이를 NL에서는 2승, AL에서는 2.5승으로 보는 견해가 어느 정도 지지를 얻고 있음을 밝혀 둔다. 메이저리그에서도 NL과 AL 간의 차이가 있다고 보는 것이다.


- 투수의 Replacement Level 구하기 -

현대 야구에서는 선발투수와 구원투수의 역할이 확실하게 나누어져 있으므로, Replacement Level을 계산할 때에도 둘을 분리하여 구하게 된다.

Keith Woolner는 5인 로테이션이 완성된 1960년대 후반부터 2000년대 초반까지의 실제 메이저리그 기록을 가지고 회귀분석을 하여 아래와 같은 회귀식을 얻었다.

Replacement Level Starter RA = 1.37 x League Average RA - 0.66
Replacement Level Reliever RA = 1.70 x League Average RA - 2.27


여기서 RA는 Run Average로, 평균 실점을 의미한다. ERA가 평균자책인 데 반해, RA는 자책점과 비자책점을 모두 합쳐서 계산한다는 점이 다르다. ERA와 RA 사이에는 경험적으로 ERA = 0.92 x RA 의 관계가 성립하므로, Replacement Level 투수들의 ERA도 예측 가능하다. 반대로 가지고 있는 정보가 ERA밖에 없는 경우에도 Replacement Level의 계산이 가능하다.

예를 들어, 어느 시즌의 선발 투수들의 평균 ERA가 4.5였다고 하자. RA = 4.5/0.92 = 4.89 가 된다. 이 값을 위의 Replacement Level Starter RA 식에 집어 넣으면...  1.37 x 4.89 - 0.66 = 6.04가 된다. 다시 ERA를 구해 보면... 6.04 x 0.92 = 5.56이 된다. 즉 선발 투수들의 평균 ERA가 4.5인 시즌의 Replacement Level 선발 투수는 대략 5.56의 ERA를 가질 것으로 예상할 수 있는 것이다. 물론 평균 RA를 알고 있다면, ERA대신 RA를 사용하는 쪽이 좀 더 정확한 예측이 가능하다.


만약 공격, 수비, 그리고 구원투수들이 모두 리그 평균인 어떤 가상의 팀이 Replacement Level Starter를 선발로 기용하여, 역시 리그 평균 선수들만으로 이루어진 다른 팀을 상대한다면 어떻게 될까? Tom Tango와 같은 세이버메트리션들의 연구 결과에 의하면 이 경우의 승률은 대략 38%로 낮아진다. 또한, 공격, 수비, 선발투수들이 모두 리그 평균이고 불펜이 Replacement Level Reliever들로 구성된 팀이 완전히 리그 평균인 다른 팀을 상대한다면, 이 경우의 기대 승률은 대략 47%가 된다. 선발투수가 구원투수에 비해 얼마나 비중이 큰지 알 수 있는 부분이다.


- VORP(Value Over Replacement Player) -

VORP는, Value Over Replacement Player의 약자로, 특정 플레이어가 Replacement Level 플레이어와 비교하여 얼마만큼의 가치(Value)를 소속팀에 제공해 왔는지를 나타내는 스탯이다. "Value"는 점수로 계산된다. 즉, Replacement Player에 비해 팀에 몇 점의 득점을 기여했는가(타자의 경우) 혹은 몇 점을 덜 실점하도록 기여했는가(투수의 경우) 이다. VORP는 수비에 대해서도 계산할 수가 있다. 어떤 플레이어가 Replacement Player에 비해 수비로 몇 점이나 기여했는지의 데이터를 얻을 수 있다면, 같은 요령으로 계산이 가능하다. 수비로 인한 득실에 대해서는 이 다음 포스팅에서 따로 다룰 예정이므로, 여기에서는 생략하기로 한다.

이 Value를 구하는 이론과 계산식도 여러 가지가 있다. 공격의 경우 RC, EqA 등을 이용하여 구하기도 하는데, 나는 Fangraphs와 Tom Tango의 방식을 따라 wOBA 및 wRAA를 이용하는 방법을 선호하고 있다. 이론적 배경이 간단명료하고 계산이 훨씬 쉽다는 장점이 있기 때문이다. 그러한 장점에도 불구하고 딱히 정확도가 다른 방법에 비해 떨어진다는 생각은 들지 않는다. 일단 wRAA를 구하고, park effect를 적용하여 보정한 다음, 앞에서 언급했듯이 리그 평균 플레이어와 Replacement Player의 공격력은 대략 20점 차이가 나므로 앞의 계산 결과에 20점을 더해주면 된다. 일단 수비까지 설명한 후, WAR 계산을 설명할 때 실제 적용 예와 함께 다시 설명 드리도록 하겠다.  (링크 -  타자의  VORP:WAR 구하기)

투수의 경우, 일반적인 계산식은 아래와 같다. 투수는 실점에 직접적으로 관여(?)하기 때문에, 타자에 비해 계산이 단순한 편이다.
VORP = ((Replacement Level - RA)/9)*Innings Pitched
여기에서는 FIP를 적용하여 RA를 구하게 되는데... 역시 글이 너무 길어지므로 투수에 대해서도 따로 다루도록 하겠다. 나중에 다루겠다고 한 부분이 많은데... 꼭! 하나씩 챙겨서 차례로 다룰 예정이므로, 관심 있으신 분들께서는 자주 들러 주시기 바란다. ^^


VORP의 일반적인 내용에 대해서는 아래 위키 페이지를 참고.
http://en.wikipedia.org/wiki/Value_over_replacement_player

아래는 Keith Woolner의 Replacement Level에 대한 기념비적인 오리지널 원조 글이다. 검색엔진에서 Replacement Level을 검색하면 나오는 글은 대부분 이 글을 한글로 번역한 것이다.
http://www.stathead.com/bbeng/woolner/vorpdescnew.htm

Posted by FreeRedbird

댓글을 달아 주세요

  1. Doors 2009.10.21 16:54 Address Modify/Delete Reply

    자세한 설명 감사드립니다.^^

  2. BlogIcon FreeRedbird 2009.10.27 15:44 신고 Address Modify/Delete Reply

    감사합니다. ^^;;

  3. Halladay 2015.05.04 10:35 Address Modify/Delete Reply

    WAR라는 스텟 계산과 산출을 배우는데 정말 많은 도움이 되네요! 짜임새있는 글에 감탄하고 갑니다!