[세이버메트릭스] Replacement Level(대체수준), VORP 란 무엇인가
오늘의 포스팅은, 여러 자료를 활용하였지만, 특히 Baseball Prospectus의 책인 <Baseball between the Numbers>를 많이 참고하여 작성하였음을 미리 밝혀 둔다. 이것은 Baseball Prospectus의 Keith Woolner가 Replacement Level 및 VORP의 원조이기 때문이다.
네이버나 다음 등의 포털에서 Replacement Level을 검색하면, Keith Woolner가 Replacement Level과 VORP를 처음 발표했을 때의 글을 우리말로 번역한 글 정도만 검색되어 나오는 것 같다. 이 포스팅이 가능한 한 좀 더 알기쉬운 우리말 설명이 될 수 있도록 최선을 다 해 보고자 한다.
- 타자의 Replacement Level 구하기 -
무엇이든 객관적으로 비교하고자 한다면 뭔가 절대적인 기준이 필요하다. 제일 먼저 떠오르는 기준은 리그 평균이다. 리그 평균은 쉽계 계산 가능하다는 장점이 있다. 하지만 "리그 평균 성적의 메이저리거"라는 것은 사실 무척 높은 기준이다. Low Minor에 있는 어린 유망주들은 그렇다 치더라도, 메이저리그와 마이너리그를 오가는 수많은 AAAA 플레이어와 저니맨들이 있기 때문이다. 아래의 출루율 그래프을 보자. 이 그림은 The Hardball Times에서 가져온 것이다.
이 그래프는 2008년에 110타석 이상을 기록한 선수들을 대상으로 출루율(OBP)을 조사하여 메이저리그와 마이너리그에서 출루율의 분포를 나타낸 것이다. Y축은 퍼센티지이며, 마이너리그는 AAA와 AA만을 대상으로 하였다. (싱글 A에 있는 유망주가 어느날 갑자기 메이저리그에 콜업되거나 할 일은 없으므로, 비교 대상으로 부적절하다.)
위의 그래프에서, 메이저리그의 평균 출루율은 .330~.340 사이에 위치하고 있다. (정확히는 .336 이다.) 그 밑으로 얼마나 많은 플레이어들이 있는지 쉽게 확인할 수 있을 것이다. (빨간색+파란색 하면 메이저리그 평균 이하이면서 현재 메이저리그에서 뛰고 있거나 혹은 AAA, AA에 있으면서 시즌 중 메이저리그에 합류할 가능성이 있는 플레이어들의 합이 된다.) 만약 리그 평균을 기준으로 플레이어를 평가한다면, 무수히 많은 마이너스 값을 얻게 될 것이다. 이것은 보기도 좋지 않거니와, 마이너스 값 때문에 추가적인 분석이나 계산을 수행하기에도 애로사항이 많다.
이러한 필요에 의해서, 소위 "Replacement Level"이라는 개념이 Baseball Prospectus의 Keith Woolner에 의해 발명되었다. 어쩌면 세이버메트릭스의 역사에서 가장 중요한 사건이라고 할 수도 있을만큼, Replacement Level의 영향력과 파급효과는 막대한 것이었다.
Replacement Level에 대한 Keith Woolner 본인의 정의를 들어 보자. 이하는 <Baseball between the Numbers> 161페이지에 나오는 정의 부분을 그대로 옮긴 것이다.
Replacement Level is the expected level of performance a major league team will receive from one or more of the best available players who can be obtained with minimal expenditure of team resources to substitute for a suddenly unavailable starting player at the same position.
이해를 돕기 위하여 예를 들어 보도록 하겠다.
Cardinals의 주전 우익수는 Ryan Ludwick이다. 어느 날 Ludwick이 수비를 하다가 외야에서 넘어지면서 어딘가 한 군데가 부러져서 1~2개월 정도 결장하게 되었다고 하자. (위의 정의에서 말하는 "suddenly unavailable starting player"이다) Mozeliak 단장은 그의 빈자리를 메꾸기 위해서 AAA에서 외야수 Nick Stavinoha를 메이저리그 로스터로 올려 보낸다. 마이너리그 선수가 메이저리그에 올라가게 되면 자동적으로 리그 최저 임금을 적용 받게 된다. (위의 정의에서 말하는 "obtained with minimal expenditure of team resources"이다) 이제 La Russa 감독은 주전 우익수를 잃어버렸으므로, 우익수 자리에 Ankiel과 Stavinoha, 심지어 Joe Thurston 등을 상황에 따라 적당히 돌려가며 기용할 것이다. (위의 정의에서 말하는 "one or more of the best available players"이다)
위에서 언급한 세 가지 방법, 즉 1) AAA 선수의 콜업, 2) 집에서 놀고 있거나 인디 리그에서 뛰고 있는 선수와 계약, 3) 웨이버 클레임 정도가 최저 비용으로 대체 선수를 조달하는 일반적인 방법이 되겠다. 이런 대체 선수는 대개의 경우 혼자서 주전을 맡을 만큼 기량이 뛰어나지 않으므로, 기존의 벤치 멤버들과 섞여서 돌려가며 기용되는 일이 많을 것이다. 이렇게 부상당한 주전 대신 돌아가며 해당 포지션에 기용되는 땜빵 선수들이 집합적으로 내 줄 것이라고 기대하는 퍼포먼스의 수준이 바로 Replacement Level인 것이다.
Keith Woolner와 그의 동료들은 지난 100 년간의 메이저리그 기록(오타가 아니다. 진짜 100년이다!!)을 바탕으로 각 팀에서 주전을 제외한 나머지 선수들이 공격에서 어떠한 성적을 내 왔는지 통계를 내 보았다. 공격의 기여 수준을 측정하는 지표로는 RC/27을 사용하였다. (RC에 대해서는 지난 번 포스팅에서 간략히 설명한 바 있다.) 그 결과... 다음과 같은 결론을 얻었다.
1) 주전 선수와 대체 선수의 타석 수 비율은 대체로 8:2 이다.
2) 평균적인 대체 선수들은 평균적인 주전 선수에 비해 80% 정도의 성적을 냈다. 단, 약간의 예외가 있는데, 포수를 맡은 대체 선수들은 주전의 85% 정도의 성적을 냈으며, 1루수를 맡은 대체 선수들은 75% 정도의 성적을 냈다.
예외 부분은 상식적으로도 어느 정도 납득이 가능하다. 포수의 공격력은 대체로 시원찮으므로 주전과 대체 사이의 공격력 갭이 상대적으로 작을 것이며, 반면 1루수들은 대개 팀의 주포를 맡고 있으므로 주전과 대체 사이의 갭이 클 것이다.
그럼 이러한 Replacement Level이 어느 정도인지를 어떻게 구할 수 있을까? 이에 대해서는 명확히 합의된 바가 없으며, 다양한 아이디어와 공식들이 개발되어 경합하고 있는 상황이다. 다만 여러 연구 결과에 따르면, 여러 방식으로 Replacement Level을 구해 보면 거의 비슷한 결과를 얻게 된다고 한다. 이 글에서는 Replacement Level을 만든 장본인인 Keith Woolner의 공식을 소개하고자 한다.
Keith Woolner와 그의 동료들은 소위 slash stat(AVG/OBP/SLG)을 가지고 Replacement Level을 계산하는 식을 고안하였는데, 그 식은 아래와 같다. 역시 <Baseball bewteen the Numbers>에 소개된 내용이다.
여기서 P는 우리가 구하고자 하는 포인트로 Replacement Level과 리그 평균과의 갭을 의미하며, R은 해당 포지션에서 Replacement Level과 리그 평균과의 퍼포먼스 비율이다. 예를 통해 설명하도록 하겠다.
책에서 사용한 예를 활용하자면, 어느 시즌의 리그 평균 좌익수의 타격 성적이 .270/.340/.430이라고 하자. Replacement Level LF는 주전들에 비해 80% 정도의 퍼포먼스를 낼 것으로 기대되므로, 위의 식에서 R값은 0.8이 된다. 여기에 AVG, OBP, SLG를 각각 대입하면, P=0.033을 얻게 된다. 이 P값을 AVG/OBP/SLG에서 각각 빼 주면, 그게 바로 우리가 찾고자 하는 Replacement Level의 퍼포먼스가 된다. 즉, 그 시즌의 Replacement Level 좌익수의 예상 타격 성적은 .237/.307/.397이다.
시즌과 리그에 따라 약간씩 변동이 있으나, 리그 평균 플레이어의 퍼포먼스와 Replacement Level 플레이어의 퍼포먼스를 비교하면 대략 20점(20 Runs) 차이가 난다. 20점의 차이는 팀의 승패에 어느 정도의 영향을 미칠까? 이전 포스팅 중 Pythagorean Record에 관한 글을 기억하시는지? 그 포스팅에서, 가장 간단한 방법인 10점=1승 으로 계산하여도 오차가 별로 없음을 엑셀 파일을 통해 보여 드린 바 있다. 따라서, 여기에서도 동일하게 10점을 1승으로 생각하면 큰 무리가 없다. 즉, 평균적인 메이저리거와 Replacement Level 플레이어의 차이는, 승 수로 환산하면 약 2승이 되는 것이다.
즉, 어떤 팀이 2루에 리그 평균 2루수를 1년 내내 기용했고, 그 시즌에서 82승 80패를 기록했다고 하자. 만약 그 2루수가 spring training에서 심각한 부상을 당해서 시즌 아웃 되었고, 구단이 금전적 여유가 없어 1년 내내 Replacement Level 2루수들로 돌려막기를 했다면, 그 팀은 아마도 그 시즌에서 80승 82패를 할 것이라는 의미이다.
참고로, 최근에는 리그 평균과 Replacement Level의 차이를 NL에서는 2승, AL에서는 2.5승으로 보는 견해가 어느 정도 지지를 얻고 있음을 밝혀 둔다. 메이저리그에서도 NL과 AL 간의 차이가 있다고 보는 것이다.
- 투수의 Replacement Level 구하기 -
현대 야구에서는 선발투수와 구원투수의 역할이 확실하게 나누어져 있으므로, Replacement Level을 계산할 때에도 둘을 분리하여 구하게 된다.
Keith Woolner는 5인 로테이션이 완성된 1960년대 후반부터 2000년대 초반까지의 실제 메이저리그 기록을 가지고 회귀분석을 하여 아래와 같은 회귀식을 얻었다.
Replacement Level Starter RA = 1.37 x League Average RA - 0.66
Replacement Level Reliever RA = 1.70 x League Average RA - 2.27
여기서 RA는 Run Average로, 평균 실점을 의미한다. ERA가 평균자책인 데 반해, RA는 자책점과 비자책점을 모두 합쳐서 계산한다는 점이 다르다. ERA와 RA 사이에는 경험적으로 ERA = 0.92 x RA 의 관계가 성립하므로, Replacement Level 투수들의 ERA도 예측 가능하다. 반대로 가지고 있는 정보가 ERA밖에 없는 경우에도 Replacement Level의 계산이 가능하다.
예를 들어, 어느 시즌의 선발 투수들의 평균 ERA가 4.5였다고 하자. RA = 4.5/0.92 = 4.89 가 된다. 이 값을 위의 Replacement Level Starter RA 식에 집어 넣으면... 1.37 x 4.89 - 0.66 = 6.04가 된다. 다시 ERA를 구해 보면... 6.04 x 0.92 = 5.56이 된다. 즉 선발 투수들의 평균 ERA가 4.5인 시즌의 Replacement Level 선발 투수는 대략 5.56의 ERA를 가질 것으로 예상할 수 있는 것이다. 물론 평균 RA를 알고 있다면, ERA대신 RA를 사용하는 쪽이 좀 더 정확한 예측이 가능하다.
만약 공격, 수비, 그리고 구원투수들이 모두 리그 평균인 어떤 가상의 팀이 Replacement Level Starter를 선발로 기용하여, 역시 리그 평균 선수들만으로 이루어진 다른 팀을 상대한다면 어떻게 될까? Tom Tango와 같은 세이버메트리션들의 연구 결과에 의하면 이 경우의 승률은 대략 38%로 낮아진다. 또한, 공격, 수비, 선발투수들이 모두 리그 평균이고 불펜이 Replacement Level Reliever들로 구성된 팀이 완전히 리그 평균인 다른 팀을 상대한다면, 이 경우의 기대 승률은 대략 47%가 된다. 선발투수가 구원투수에 비해 얼마나 비중이 큰지 알 수 있는 부분이다.
- VORP(Value Over Replacement Player) -
VORP는, Value Over Replacement Player의 약자로, 특정 플레이어가 Replacement Level 플레이어와 비교하여 얼마만큼의 가치(Value)를 소속팀에 제공해 왔는지를 나타내는 스탯이다. "Value"는 점수로 계산된다. 즉, Replacement Player에 비해 팀에 몇 점의 득점을 기여했는가(타자의 경우) 혹은 몇 점을 덜 실점하도록 기여했는가(투수의 경우) 이다. VORP는 수비에 대해서도 계산할 수가 있다. 어떤 플레이어가 Replacement Player에 비해 수비로 몇 점이나 기여했는지의 데이터를 얻을 수 있다면, 같은 요령으로 계산이 가능하다. 수비로 인한 득실에 대해서는 이 다음 포스팅에서 따로 다룰 예정이므로, 여기에서는 생략하기로 한다.
이 Value를 구하는 이론과 계산식도 여러 가지가 있다. 공격의 경우 RC, EqA 등을 이용하여 구하기도 하는데, 나는 Fangraphs와 Tom Tango의 방식을 따라 wOBA 및 wRAA를 이용하는 방법을 선호하고 있다. 이론적 배경이 간단명료하고 계산이 훨씬 쉽다는 장점이 있기 때문이다. 그러한 장점에도 불구하고 딱히 정확도가 다른 방법에 비해 떨어진다는 생각은 들지 않는다. 일단 wRAA를 구하고, park effect를 적용하여 보정한 다음, 앞에서 언급했듯이 리그 평균 플레이어와 Replacement Player의 공격력은 대략 20점 차이가 나므로 앞의 계산 결과에 20점을 더해주면 된다. 일단 수비까지 설명한 후, WAR 계산을 설명할 때 실제 적용 예와 함께 다시 설명 드리도록 하겠다. (링크 - 타자의 VORP:WAR 구하기)
투수의 경우, 일반적인 계산식은 아래와 같다. 투수는 실점에 직접적으로 관여(?)하기 때문에, 타자에 비해 계산이 단순한 편이다.
VORP = ((Replacement Level - RA)/9)*Innings Pitched
여기에서는 FIP를 적용하여 RA를 구하게 되는데... 역시 글이 너무 길어지므로 투수에 대해서도 따로 다루도록 하겠다. 나중에 다루겠다고 한 부분이 많은데... 꼭! 하나씩 챙겨서 차례로 다룰 예정이므로, 관심 있으신 분들께서는 자주 들러 주시기 바란다. ^^
VORP의 일반적인 내용에 대해서는 아래 위키 페이지를 참고.
http://en.wikipedia.org/wiki/Value_over_replacement_player
아래는 Keith Woolner의 Replacement Level에 대한 기념비적인 오리지널 원조 글이다. 검색엔진에서 Replacement Level을 검색하면 나오는 글은 대부분 이 글을 한글로 번역한 것이다.
http://www.stathead.com/bbeng/woolner/vorpdescnew.htm