드디어, 오랫동안 마음속에 무거운 짐(?)으로 남아 있던 구원투수의 WAR 계산에 대해 포스팅을 하게 되었다.

구원투수의 WAR 계산은 기본적으로 선발투수의 WAR 계산과 동일한 방법으로 수행한다. (선발투수의 WAR 계산은 이 글을 참고) 하지만, 불펜 특유의 독특한 운용 방식으로 인해, 계산시에 추가적으로 고려해야 할 사항이 생긴다. 예를 들어, 똑같이 ERA 3.0을 기록한 두 릴리버가 있는데, 투수 A는 클로저로 위기 상황에 주로 등판하였고 투수 B는 주로 패전처리용으로 기용되었다면, 비슷하게 실점을 허용했다고 해도 두 투수가 팀 승리에 기여한 바는 전혀 다른 것이다.


1. LI를 고려해야 하는 이유

우리는 앞의 글에서 LI(Leverage Index)에 대해 살펴보았다. 선발투수는 본인이 직접 게임을 시작하며, 게임이 흘러감에 따라 LI가 늘어나기도 하고 줄어들기도 한다. 일반적으로 선발투수들의 평균 LI는 1이다. 또한, 안타와 볼넷, 사사구를 연속으로 허용하여 주자 만루를 만들어서 LI가 올라갔다면, 그것은 전적으로 본인의 책임이므로, 본인이 위기를 자초한 뒤에 스스로 해결했다고 해서 특별히 그것을 칭찬할 이유도 없다.

하지만, 구원투수는 사정이 다르다. 감독이 어떤 투수를 LI 2.0 인 상황에서 마운드에 올렸다면, 이 투수가 잡아내는 아웃이나 이 투수가 허용하는 실점의 가치는 평균적인 상황의 2배에 달하는 것이다. 이러한 위기 상황을 무실점으로 잘 막아냈다면, 이 무실점 역투의 가치 역시 평균적인 상황의 2배이다. 구원투수는 본인의 의지나 희망과 상관없이 타의에 의해 특정 상황에 투입되어 역할을 수행하므로, 역할의 경중에 따라 가치를 조정 평가해 주는 것이 타당할 것이다.

여기에서 각각의 상황이 갖는 중요도는 LI로 평가할 수 있다. 예를 들어 메이저리그 클로저들의 평균 gmLI는 1.8 정도이므로, 이들은 평균적인 상황보다 1.8배 중요한 상황에 보통 등판한다는 의미가 된다.

그러면, 클로저들의 WAR을 선발투수와 같은 방식으로 구한 뒤에, 1.8배 해 주면 되는 것이 아닐까? 아쉽게도 현실은 그렇게 단순하지가 않다.


아래의 내용은 글만 읽어서는 이해하기가 쉽지 않을 수도 있다. 진지하게 접근하고자 하시는 분들은 첨부된 엑셀파일의 계산을 꼭 참고하시기 바란다. 또한, 나중에 다시 언급하겠지만, 2009년 MLB 클로저들에 대한 WAR 계산 결과도 포함되어 있다.




2. Bullpen Chaining Model

MLB 팀들은 보통 12인 투수진(선발 5명 + 구원 7명)을 운용한다. 예를 통해서 불펜이 어떻게 운용되는지를 살펴보자. 이 예는 Sky Kalkman의 글에서 퍼온 것이다. 참고로, Kalkman의 예는 Tom Tango의 오리지널 모델을 다듬은 것이다.

CASE 1

여기에 어떤 팀의 7명짜리 불펜이 있다. 감독은 이 7명에게 각각의 역할을 부여하고 있으며, 평균적으로 아래와 같은 상황에서 각각의 투수를 기용한다고 하자. 한 시즌 동안, 이 7명의 투수들은 각각 72이닝씩을 던졌다고 치자. 투수의 실점 방어 수준은 편의상 ERA를 사용한다.

ERA  LI
3.00  1.8  (CL)
3.75  1.3  (Setup #1)
4.00  1.0  (Setup #2)
4.25  0.9  (Middleman #1)
4.50  0.8  (Middleman #2)
4.70  0.7  (Middleman #3)
4.80  0.6  (Mop-up)

이들의 평균 LI는 1이고, 평균 ERA는 4.14이다. 이들이 72 x 7 = 504 이닝을 던지는 동안 내준 자책점(ER)은 총 232점이다. 그러나, 등판 상황의 중요도에 따라 실점의 가치가 달라지므로, 각 투수의 ERA에 LI를 곱해서 leveraged ERA를 구할 수 있을 것이다. 예를 들어 클로저의 3.00 ERA를 leveraged ERA로 바꾸면 1.8 x 3.00 = 5.40 이 된다. 이러한 방식으로 leveraged ERA를 구하고, 이를 바탕으로 leveraged ER을 구해 보면, 504 이닝동안 총 223점을 내준 것이 된다.


CASE 2

이번에는 위의 팀에서 클로저가 시즌 개막 직전에 교통사고로 시즌아웃 되었다고 가정하자. 이미 시즌 개막이 임박하여 FA시장에 좋은 릴리버는 남아있지 않고, 다른 구단들과의 트레이드도 잘 되지 않아서, 이 팀은 결국 AAA에서 Replacement Level 릴리버를 로스터에 포함시키게 된다. 그런데 여기서, Replacement Level 릴리버를 클로저로 대신 기용하는 팀은 어디에도 없을 것이다. 바로 이 부분이 문제가 된다.

대부분의 감독은 이런 경우에 ERA 3.75의 셋업맨 #1을 클로저로 돌리고, 나머지 릴리버들의 역할을 하나씩 올린 다음, 방금 AAA에서 올라온 신참 릴리버에게 Mop-up 역할을 맡길 것이다. 이 리그의 Replacement Level Reliever의 ERA가 4.85라고 하면, 이 팀의 새로 구성된 불펜은 아래와 같다.


ERA  LI
3.75  1.8 (CL)
4.00  1.3 (Setup #1)
4.25  1.0 (Setup #2)
4.50  0.9 (Middleman #1)
4.70  0.8 (Middleman #2)
4.80  0.7 (Middleman #3)
4.85  0.6 (Mop-up)  <-- AAA에서 올라온 신참

상황이 이해가 되시는지?

이 7명이 똑같이 72이닝씩 던졌다고 하고, 위에서와 같이 leveraged ERA 및 leveraged ER을 구해보면, 504 이닝 동안 이들이 내준 레버리지 자책점(leveraged ER)은 242.2점이 된다. 이제 ERA 3.00의 클로저가 전력에서 이탈하고 대신 Replacement Level 릴리버를 한 명 넣게 됨으로써 이 팀이 추가로 얼마나 실점하게 되는지 알 수 있다.

242.2 - 223.0 = 19.3   (반올림으로 인해 0.1점의 오차 발생)

이 팀은 19점을 더 실점하게 되었다. 즉, 이 팀의 불펜에 있어서 ERA 3.00의 클로저가 Replacement Level 투수에 비해 팀 실점을 막는데 기여하는 수준(RAR: Runs Above Replacement Level)은 19.3점이며, 대략 10점=1승이라고 치면 이 클로저의 WAR은 1.9 정도가 된다.

이렇게, 불펜에서 한 명이 빠질 경우 체인으로 연결된 것처럼 역할이 차례차례 변경된다는 의미에서, 위와 같은 불펜 설명 모델을 Bullpen Chaining 이라고 한다.


CASE 3

만약 이러한 체인 효과를 무시하고 계산하면 결과가 어떻게 달라지는지 살펴보자.

위의 예에서, 클로저가 시즌아웃된 뒤에, 감독이 다른 투수들의 역할은 그대로 둔 채 방금 AAA에서 올라온 신참 구원투수를 클로저로 기용하는 만용을 부렸다고 가정하자. 불펜 구성은 아래와 같이 바뀐다.

4.85  1.8  (CL) <-- AAA에서 올라온 신참
3.75  1.3  (Setup #1)
4.00  1.0  (Setup #2)
4.25  0.9  (Middleman #1)
4.50  0.8  (Middleman #2)
4.70  0.7  (Middleman #3)
4.80  0.6  (Mop-up)

이 7명이 똑같이 72이닝씩 던졌다고 하면, 504이닝에서 이 불펜의 leveraged ER 총합은 249.6점으로 나타난다. 이렇게 되면 CASE 1과 비교할 때, 클로저의 RAR이 26.6점이 되어 클로저의 WAR는 2.7로 계산된다.

CASE 2와 CASE 3 중에 어느 쪽이 현실에 가까운지는 명약관화하다고 본다. ERA 4.85의 Replacement Level 구원투수를 클로저로 기용하는 팀은 없을 것이므로, CASE 2와 같이 생각함이 더 타당하다. CASE 3의 계산법은 0.7~0.8 WAR 정도 클로저를 과대평가하게 되는 것이다.


3. WAR 계산시 LI의 조정 적용

클로저의 LI가 1.8이라고 해서, 1.8의 LI를 그대로 곱해 주면, 해당 선수가 맡았던 역할을 그대로 Replacement Level 선수에게 맡기는 모습이 되어 위의 CASE 3과 같은 결과가 되어 버린다. 불펜 운용을 이렇게 하는 팀은 별로 없으므로, 체인 효과를 고려하여 LI를 조정해 주어야 할 것이다.

구원투수의 WAR 계산을 위해 현재 Tom Tango나 Fangraphs 사이트가 사용하고 있는 조정 LI는 아래와 같다.

Effective LI = (1 + gmLI) / 2

(gmLI : 구원투수가 경기에 투입되는 순간의 LI)

이 식을 위의 Chaining Model 예에 적용해서 클로저의 WAR를 다시 구해보자.

클로저의 ERA는 3.00이었고, Replacement Level 구원투수의 ERA는 4.85였다.
클로저의 LI는 1.8이었으므로, Effective LI는 (1+1.8) / 2 = 1.4 이다.
이 클로저가 Replacement Level 투수에 비해 덜 실점하는 점수는 (4.85 - 3.00) * 72 / 9 = 14.8 이다.
클로저라는 역할 및 체인 효과를 감안해주기 위해 Effective LI를 곱해 주면,

14.8 * 1.4 = 20.7

이것이 클로저의 RAR이다.
따라서, WAR은 20.7 / 10 = 2.1이 된다.

앞의 예에서 직접 체인 효과를 돌려 보아서 얻은 클로저의 WAR은 1.9였다. 0.2의 오차가 생기고 있는데, 이는 체인 모델이 모든 투수가 72이닝씩 똑같이 던진다는 다소 비현실적 가정을 하고 있다는 점에 주로 기인하는 것이다. 하지만, 각 팀마다 동료 불펜투수들의 구성은 조금씩 다르고, 이에따라 체인 효과도 조금씩 다르게 나타나므로, 위와 같은 Effective LI 공식이 100% 맞는다고 볼 수도 없다. 이 클로저의 진정한 WAR은 아마도 1.9와 2.1 사이의 어딘가에 위치하고 있을 것이다. 아마도 2.1에 가까운 쪽이 되겠지만 말이다. 위에서 언급한 Sky Kalkman의 글에도 나와 있지만, Effective LI의 공식은 아직 조금 더 정교해질 수 있는 여지가 있으며, 그러한 연구도 계속 진행되고 있다.


4. 2009년 MLB 구원투수들의 WAR 계산

계산 방법은 기본적으로 선발투수 WAR 계산과 동일하지만, 두 가지를 고려해 주어야 한다.
1) Replacement Level 구원투수의 기대 승률은 .470 이다. (선발투수는 .380이었다.)
2) 구원투수의 역할에 따른 중요도를 Effective LI를 통해 감안해 준다.

또한, 선발투수 때 ERA/RA 비율을 그냥 0.92로 계산했던 것과는 달리, 실제 2009 시즌의 리그 총 ERA와 리그 총 RA로부터 비율을 계산하여 약간이나마 정확도를 높이려고 노력하였다.

위에서 보여 드린 첨부파일에는 Bullpen Chaining 모델 뿐 아니라 2009 시즌 메이저리그 클로저들의 WAR 계산 결과도 들어 있으므로, 받아서 확인해 보시기 바란다. 특히 누가 과대평가되고 있는지, 한 눈에 확인할 수 있을 것이다.


Today's Music : Chage & Aska - On Your Mark

Official MV (지브리 애니메이션)


Live


말이 필요 없는 명곡. 뮤직비디오도 너무 좋다.
Posted by FreeRedbird

댓글을 달아 주세요

  1. BlogIcon lecter 2010.01.21 19:33 Address Modify/Delete Reply

    바로 며칠 전에 데이브 카메론이 글을 올렸었죠.(http://www.fangraphs.com/blogs/index.php/war-and-relievers) 실제 수치로 설명해 주셔서 감사합니다 :)

    • BlogIcon FreeRedbird 2010.01.22 18:31 신고 Address Modify/Delete

      지금의 WAR 계산이 클로저를 과소평가한다고 주장하는 사람들이 있지요... 저는 Dave Cameron의 논리에 대체로 동의합니다. 워낙 던지는 이닝이 적으니 LI를 고려해 주더라도 여전히 좋은 포지션 플레이어들보다는 기여도가 낮을 수 밖에 없는 것이죠.

  2. 발전없는푸홀스 2010.01.22 22:48 Address Modify/Delete Reply

    안녕하세요 역시 세이버매트릭스의 세계는 놀랍네요~

    근데 위에 첨부하신 엑셀파일에 09년 클로저들의 war가 없는거 같은데 저만 그런건가요?

    그냥 case 1,2,3밖에없는거같은데..,

    • BlogIcon FreeRedbird 2010.01.25 09:30 신고 Address Modify/Delete

      안녕하세요... 주말 내내 아기와 시간을 보내다 보니 답이 늦었습니다. ^^

      엑셀 파일을 열어서 화면의 아래쪽을 보시면 "2009_Relievers"라는 탭이 있습니다. 그걸 누르시면 2009년 클로저 14명의 WAR 계산 결과를 보실 수 있습니다.

  3. 푸홀스처럼 2011.09.11 15:48 Address Modify/Delete Reply

    에릭 가니에의 WAR이 솔직히 4.3정도밖에 되지 않는다는 데 실망했습니다.
    WPA로 볼 경우 가니에는 세시즌 연속 2위안에 들정도로 엄청난 공헌도와 임팩트를 보여줬는데 WAR로 볼 경우 너무 박한 거 아닌가 싶을 정도로 허무하더라고요. 가니에의 2003년을 x2해줘도 00페드로만 못한 가치라는 건 좀 말이 안되는 거 같아요.

    • BlogIcon FreeRedbird 2012.02.17 18:04 신고 Address Modify/Delete

      너무 늦게 답변을 드리는 것 같네요. 구원투수는 이닝 수가 적다보니 아무래도 WAR과 같은 시스템에서 좋은 평가를 받기가 어렵습니다. high-leverage 상황에서의 등판에 대해 얼마나 가중치를 적용해 줄 것인가가 관건이 되겠네요. 현재의 구원투수 평가 시스템은 개선의 여지가 있는 게 사실입니다.

  4. 진흙 2012.02.15 21:56 Address Modify/Delete Reply

    좋은 글 잘 읽었습니다.
    다만 이해가 안 되는 점이,
    case 2에서
    ERA LI
    3.75 1.8 (CL)
    4.00 1.3 (Setup #1)
    4.25 1.0 (Setup #2)
    4.50 0.9 (Middleman #1)
    4.70 0.8 (Middleman #2)
    4.80 0.7 (Middleman #3)
    4.85 0.6 (Mop-up) <-- AAA에서 올라온 신참
    가 된 다음에 다시 보정을 해 줘야 하는 것 아닌가요?
    (제일 위의 선수만 보자면) LI 1.3의 상태에서 3.75를 던지던 선수가
    LI 1.8의 상황에서 이제 던지게 되었을때, 방어율을 그대로 3.75로 계산한다는 것이 저는 이해가 되질 않네요.
    실제 계산은 해보지 않았지만, 각 선수들이 체인으로 이동해서 각 상황에서의 보정 방어율이 적용된다면 결국 case 3쪽에 더 가까워 질 것 같아 보이는데요.
    이해를 위한 예이고, 이것까지 계산해서 보정한 것이 최종이란 것인가요? (물론 아직 완벽한 계산식은 나오지 않았겠지만요)

    • BlogIcon FreeRedbird 2012.02.17 18:07 신고 Address Modify/Delete

      죄송합니다만 제가 질문을 잘 이해하지 못하고 있는 것 같습니다. 본문에서 각 case의 비교는 leveraged ER로 하고 있으므로, 말씀하신대로 보정이 이루어지고 있는 것 아닐까요? case 2의 클로저의 경우에도 3.75를 그대로 사용하고 있지는 않고요. 계산과정에서 LI를 반영해 주고 있습니다.

  5. pa8055 2016.08.16 22:19 Address Modify/Delete Reply

    너무 오래된 글이라 답해주실지지는 모르겠는데 선발이랑 중계 둘다 나왔다면 선발 따로 중계 따로 구해서 더하면 되나요??

이 글은 "한국야구팬사이트"에서 승짱님의 한국 프로야구 투수 랭킹 계산을 돕기 위한 예로서 작성된 것이다.
단지 "예"일 뿐이므로 스탯에 대한 해석, 계산 방법에 대한 입장의 차이에 따라 얼마든지 변형과 조정이 가능하다.

계산 방법은 기본적으로 이전 포스팅에서 소개해 드린 것과 동일하다.

다만, FIP를 RA scale로 바꿔줄 때 0.92를 사용하는 대신 실제 KBO의 ERA와 RA 비율을 계산하여 사용하였다. 결과는 아래 첨부파일에서 볼 수 있듯이 0.91~0.92로 대동소이하게 나온다.

또한, FIP Constant 역시 KBO의 실제 데이터를 가지고 계산하였다. 2007년 시즌은 FIP Constant가 2.84에 불과한 충격적인 결과가 나왔으나, 2008년과 2009년은 그럭저럭 MLB와 유사한 숫자가 나왔다.

2009년과 2008년 KBO 시즌에서 각각 5명의 선발투수를 골라서 직접 계산을 해 보았다.

5명의 선발투수는 완전히 임의로 고른 것이다. (나는 KBO에 좋아하는 팀이 없으며, 8개 구단에 대해 완전히 중립이다...)


이 계산에는 다음과 같은, 근거가 부족한 가정들이 들어가 있다. 이런 부분들을 말끔하게 해결할 수 없는 것은 KBO의 데이터 부족, 개인적인 지식 부족, 그리고 개인적인 시간 부족에 기인한 것이다.

1. KBO에서 각 이벤트는 MLB와 비슷한 Run Value를 가지며, 따라서 FIP 계산식은 동일하다.

2. KBO에서 Run Scoring Environment는 MLB와 유사하여, Runs per Win을 MLB와 동일하게 [((상대 팀 이닝*상대 팀 실점수준)+(소속 팀 이닝*소속 팀 실점수준)/(상대 팀 이닝+소속 팀 이닝))+2] * 1.5 의 근사식으로 산출할 수 있다.

3. KBO에서 선발투수의 Replacement Level은 MLB와 동일하며, 따라서 Replacement Level 선발투수의 기대 승률은 .380이다.
--> 단, KBO의 Replacement Level이 실제로는 이와 다르다고 해도, 상대적 비교에는 지장이 없다. 이 계산에서 투수 A가 투수 B보다 WAR이 높게 나타났다면, Replacement Level을 바꾸더라도 A가 B보다 높게 나타나는 것은 변함이 없다. 단지 절대값이 바뀔 뿐이다.


다음은 중요한 참고 사항이다.

1. KBO 선수들의 모든 데이터는 스탯티즈에서 가져왔다. 스탯티즈는 보면 볼수록 놀랍고 대단한 사이트이다. (우리나라의 척박한 야구 기록 환경을 생각하면 더더욱 그렇다.) 단, FIP는 스탯티즈의 데이터를 쓰지 않고 직접 계산하였다. 이유는, 스탯티즈의 FIP가 Constant를 3.20으로 항상 동일하게 사용하고 있고, BB와 IBB의 구분이 이루어지고 있지 않기 때문이다.

2. 여기에서 계산한 선발투수의 WAR는 선발로 등판한 기록만을 대상으로 한 것이다. 한국 프로야구는 투수의 역할이 모호한 경우가 많아 시즌 내내 100% 선발 투수로만 등판하는 투수는 그다지 많지 않으며, 대부분의 선발투수가 구원 등판 기록을 가지고 있다. 따라서, 정확한 계산을 위해서는 해당 투수가 구원으로 등판한 기록을 가지고 구원투수의 WAR를 계산하여 합산해 주어야 할 것이다. (결국 내가 구원투수 WAR를 구하는 방법을 최대한 빨리 포스팅해야 할 것 같다... -_- )


다음은 이 계산을 하고 난 뒤의 소감.

1. 07, 08, 09년 3년간의 FIP Constant를 계산하면서 시즌 스탯을 확인한 결과 시즌과 시즌 사이의 득점 수준 변화가 매우 크게 나타났다. (3년 사이에 타고투저 현상이 심화됨) 팀 수도 적고 게임 수도 적다보니 샘플이 적어져서 데이터의 변동성이 MLB에 비해 훨씬 크게 나타나는 것 같다. (KBO 1시즌 = 1,056게임, MLB 1시즌 = 4,860게임)

2. 그럼에도 불구하고 ERA/RA 비율이 유사하게 나타나는 것을 보면 비슷한 규칙을 가지고 비슷하게 야구를 하니 비슷한 결과가 나온다는 느낌이어서... MLB의 메트릭을 KBO에 적용하는 것이 완전히 엉뚱한 결과를 도출하지는 않을 것이라는 생각이 든다.

3. 류현진은 정말 좋은 투수인 것 같다. 다른 선수들을 많이 계산해 본 적은 없으나 한국야구에서 5 WAR면 엄청나게 높은 수치일 것 같은데... 위의 계산 파일에는 들어있지 않으나, 08년 스탯으로 계산해도 윤석민과 동일하게 3.6 WAR로 나온다.

Posted by FreeRedbird

댓글을 달아 주세요

  1. 홈런강탈 2010.01.17 21:25 Address Modify/Delete Reply

    현수랑 현진이는 볼때마다 와... 대단하구나 라는 느낌을 들게하는 선수들인 것 같네요. 국내가 좁은 탑유망주들 ㅋ 블로그 첫 방문했어요~ 엑셀에 이렇게 친철한 포스팅을 해주시는 분도 드물듯^^ 앞으로 자주방문해서 배우고 갈게요~

    • BlogIcon FreeRedbird 2010.01.18 10:12 신고 Address Modify/Delete

      세이버메트릭스는 하나의 정해진 답이 없기 때문에... 취향대로 자유롭게 변형해서 계산을 직접 해 보실 수 있도록 파일을 제공해 드리고 있습니다. 자주 놀러 오세요~~!

  2. 홈런강탈 2010.02.07 14:59 Address Modify/Delete Reply

    엑셀에 보면 09년 리그자책점이 5048점으로 나와있는데 실제보다 13점이 높네요. 07,08년도 그렇고 혹시 다른계산이 있는건지 궁굼합니다. 그게 아니라면 ERA/RA가 약간 더 낮아지네요. FIP Constant도 살짝 달라지구요. 근데 재밌는게 이게 예전으로 갈수록 격차가 커집니다. 아무래도 수비 수준하고도 상관이 있겠죠^^

    • BlogIcon FreeRedbird 2010.02.08 09:27 신고 Address Modify/Delete

      음... 지금 다시 스탯티즈에 가서 확인해 보니 정말 5035점으로 13점이 차이나네요. 오류의 원인은 잘 모르겠습니다. 급하게 쓰다보니 뭔가 착오가 있었던 듯 하네요. ^^ 시간될 때 수정해 놓도록 하겠습니다. 좋은 지적 감사합니다.

      FIP constant는 저도 07년 시즌에서 2점대가 나오는 걸 보고 깜짝 놀랐습니다. 우리나라 야구는 시즌별 편차가 무척 큰 것 같습니다...

    • BlogIcon FreeRedbird 2010.02.16 18:46 신고 Address Modify/Delete

      리그 자책점을 수정하여 다시 업로드하였습니다. ^^

  3. haia 2010.02.16 08:56 Address Modify/Delete Reply

    그냥 사소한 의문인데 이 계산이 '선발투수의 WAR는 선발로 등판한 기록만을 대상으로 한 것'이라면, 2009년 시즌 류현진의 마지막 등판이 계산에 포함된 것인지 아닌지 궁금해집니다. 9월 25일 경기로 잘 알려진대로 송진우의 은퇴기념경기입니다. 송진우는 1회초 첫 타자를 출루시킨 후(아웃카운트를 잡지 못하고) 내려갔습니다. 이어 류현진이 올라와서 8과 1/3이닝간 11삼진 2실점을 기록했네요.

    • BlogIcon FreeRedbird 2010.02.16 18:48 신고 Address Modify/Delete

      스탯티즈는 해당 경기를 구원등판으로 분류하고 있습니다.
      http://www.statiz.co.kr/index.php?mid=player&name=%EB%A5%98%ED%98%84%EC%A7%84&birth=1987-03-25&opt=22&year=2009&sopt1=9

      따라서, 제 글에 첨부된 파일에서는 이 은퇴경기를 반영하지 않고 있습니다. 참고하세요...

  4. doosan 2011.05.21 20:11 Address Modify/Delete Reply

    2009년 류현진의 WAR가 5.0이라고 계산 하셨는데, 스탯티즈의 WAR는 7.11이라고 나와 있더군요. 왜 그런지 궁금합니다.

    • BlogIcon FreeRedbird 2011.05.24 17:04 신고 Address Modify/Delete

      답이 늦었네요.

      일단 replacement level에 대한 가정이 다르고요. 스탯티즈는 9이닝당 0.175승을 사용하고 있으니 189이닝이면 3.7승 정도 됩니다. 저는 MLB기준을 그대로 가져다 써서 .380의 승률을 가정했고요. 게다가 선발만 따졌기 때문에 181이닝만 반영되어 있습니다. 이를 환산하면 2.4승 정도 됩니다. 일단 여기서 1.3승 정도 차이가 나고 있지요. 이 비교는 어차피 상대 비교이기 때문에 절대값인 replecement level은 얼마로 가정하더라도 별 상관은 없을 것이라고 보았습니다.

      다음에.. 본문을 보시면 저는 선발등판 경기만을 계산했는데요. 스탯티즈는 구원등판한 경기도 포함하고 있습니다. 바로 위 댓글을 보시면 송진우 은퇴경기 같은 경우도 구원으로 분류되어 있는 것을 알 수 있습니다. 구원등판한 경기만 따지면 이것이 0.5승 정도 되는 것 같네요.

      그리고... 저는 FIP를 3.69로 계산했는데 스탯티즈는 3.57로 계산하고 있습니다. 이렇게 되면 대략 0.3승 정도 차이가 나는데요. 이 계산 차이에 대해서는 원인을 잘 모르겠습니다.

      위의 차이를 다 합치면 대략 질문 주신 부분에 대해 설명이 되는 것 같습니다. ^^

    • doosan 2011.06.06 12:24 Address Modify/Delete

      아 그런것이군요.
      명쾌한 답변에 감사드립니다.

  5. leehan508 2013.07.28 22:29 Address Modify/Delete Reply

    우리나라 구장의 Run PF와 Adjusted PF는 어떻게 계산한것인가요? 그리고 Adjusted PF계산할 때, ((Run PF)/100+1)2를 하셨는데 왜 이런 공식을 사용한건가요?

    • BlogIcon FreeRedbird 2013.07.29 15:14 신고 Address Modify/Delete

      Run PF는 정확히 기억나지는 않은데 아마 당시 스탯티즈에서 가져온 값인 것 같습니다. 조정 PF값을 그렇게 구하는 이유는 Run PF는 홈 경기의 PF값이기 때문입니다. 홈 경기 득점 PF가 Run PF/100 이고 원정 경기는 1로 가정하는 것이죠. 원정구장을 1로 보는 것은 구장 수가 많은 MLB에서는 괜찮지만 구장 수가 적은 KBO에서는 다소 오차를 발생시킬 소지가 있으므로, 정확히 계산하시려면 1 대신 원정경기들의 평균 Run PF를 넣어 주어야 합니다.

(주: 타자의 WAR를 구하는 글은 이미 이전에 포스팅한 바 있었으나, 일부 잘못된 계산을 바로잡고 내용을 보충하여 다시 포스팅 하기로 하였다. 또한, 이제 2009 시즌이 끝났으므로 계산에서 사용한 예도 2009년의 스탯들로 바꾸었다.)



Chase Utley : 항상 실력에 비해 충분한 인정을 받지 못하고 있는, 심각하게 저평가된 플레이어이다.


타자가 팀의 득점에 기여하는 방법은 크게 보아 공격(타격), 수비, 주루가 있을 것이다. 그래서 좋은 타자를 이야기할 때 "공, 수, 주 3박자를 두루 갖췄다"는 표현을 사용하기도 한다.

각각의 타자에 대해서 이러한 득점 기여의 정도가 어느 정도인지를 측정하기 위해, 이전의 글들을 통해 공격, 수비, 주루의 측면을 차례로 검토해 왔다. 또한 비교 대상으로서 절대적 기준이 되는 Replacement Level 및 수비 포지션에 따른 조정 수준에 대해서도 살펴본 바 있다. 각각의 항목에 대해 다시 한번씩 훑어 보시면 이해에 도움이 되시리라고 생각하여 링크를 걸어 본다.

1. 타격 기여 수준 : wOBA 및 wRAA
2. 비교의 절대적 기준 : Replacement Level
3. 수비 기여 수준 : UZR, TZ
4. 포지션별 차이 : Positional Adjustment
5. 주루 기여 수준 : 도루 성공/실패, EqBRR

이를 종합하면 특정 타자의 전체 기여 수준, 혹은 그의 가치(Value)를 계산할 수 있는데, 이것이 바로 RAR(Runs Above Replacement level) 및 WAR(Wins Above Replacement level) 이다.

여기에서는 우선 Fangraphs와 동일한 방식으로 WAR를 구해 볼 것이다. 원문에서는 여기까지만 시도했었지만, 이 글에서는 Fangraphs 방식의 한계와 그 보완 방법까지 생각해 보고자 한다.

먼저 RAR을 구해 보면... 위의 다섯 가지를 차례로 더해 주면 된다.

RAR = Batting + Replacement Level + Defense + Positional Adjusment + Running

이제 RAR을 WAR로 환산해야 하는데... 원칙적으로는 팀 전체 득점과 실점에 대해 해당 플레이이어의 RAR이 미치는 점수 변화 정도를 가지고 Pythagorean Expectation의 식에 넣어서 계산하는 것이 맞지만... Pythagorean 관련 포스팅에서 언급한 바와 같이, "10점 득점 = 1승"의 단순한 계산 방법이 의외로 높은 정확도를 가지므로, 계산의 편의를 위해 이를 활용하는 것이 좋을 것이다. 즉, 아래와 같이 쉽게 계산할 수 있다.

WAR = RAR/10

이제부터 실제 예를 통해서 자세히 살펴보자.
계산에 필요한 Raw Data는 Baseball-ReferenceFangraphs에서 얻었으며, 이후의 모든 계산은 직접 하였다. 계산에 사용한 엑셀 sheet를 첨부하였으므로, 계산 결과를 쉽게 확인하실 수 있을 것이다.



아래는 Chase Utley의 2009년 성적이다.

공격 : 687 PA, 98 1B, 28 2B, 4 3B, 31 HR, 85 NIBB, 3 IBB, 24 HBP, 4 RBOE
수비 : 10.8 UZR
주루 : 23 SB, 0 CS


(NIBB : 고의사구가 아닌 볼넷, IBB : 고의사구, RBOE : 에러로 인해 타자가 출루한 경우)

순서에 따라 차례차례 계산해 보면...


1-1. Park Adjust

먼저 wOBA를 계산하기에 앞서서, 구장으로 인한 효과를 보정해 주는 것이 계산의 신뢰도를 높이는 데 도움이 될 것이다. Park Factor를 계산하는 방법은 여러 가지가 있고, 개인적으로는 어떤 방법이 가장 좋은지 아직 결론을 내리지 못하고 있다. 일단 여기서는 Fantasy411의 2006-08년 Park Factor를 빌려와서 사용하도록 하겠다. 이 자료는 엑셀 파일에 포함되어 있다. (단, RBOE의 Park Factor는 어디에서도 얻을 수가 없었다. 어차피 Utley의 RBOE가 4에 불과하여 Park Factor가 있더라도 그다지 영향은 없었겠지만...)

정밀한 조정을 위해서는 Utley의 경기별 홈구장을 일일이 찾아서 계산해야겠지만... 너무 품이 많이 들므로, 다음과 같은 간단한 방법을 사용하였다. 1) 타석의 절반은 홈, 절반은 원정에서 기록한 것으로 본다. 2) 원정구장들의 평균 Park Factor는 100이다. (실제로는 홈구장을 뺀 15개 NL 구장의 평균이므로 100에 근접한 값일 것이나, 큰 오차는 없으리라고 본다) 3) 따라서, 조정된 Park Factor는 (100 + 홈구장 Park Factor) / 2 로 계산할 수 있다.

계산시 1B, 2B, 3B, HR에 대해 Park Factor를 적용하였으나, 볼넷이나 HBP, 도루 등의 경우는 구장별 차이가 있다고 인정하기가 어려운 관계로 반영하지 않았다. 이런 부분에도 구장으로 인한 차이가 존재한다고 생각한다면... 취향에 따라 해당 스탯의 Park Factor를 찾아서 추가적으로 적용해 주면 된다. 또한, 1루타에 대한 Park Factor가 따로 없으므로... 안타 총 합계(H)의 Park Factor와 장타(XBH)의 Park Factor, 그리고 실제 2009년 메이저리그 안타, 장타 기록으로부터 1루타의 Park Factor를 유추하였다.

이렇게 조정한 Utley의 09년 성적은 아래와 같다.
687 PA, 97 1B, 28 2B, 5 3B, 28 HR, 85 NIBB, 3 IBB, 24 HBP, 4 RBOE

역시 홈런이 많은 홈구장을 쓰다 보니, 조정 결과 홈런이 약간 줄어든 것을 확인할 수 있다.


1-2. wOBA 및 wRAA 계산

wOBA 및 wRAA의 계산식 및 이론적 근거는 위의 링크를 참고하시고... Park Factor를 적용한 기록을 가지고 Utley의 wOBA를 계산한 결과는 다음과 같다. (엑셀 sheet 참조)

(Park Adjusted) wOBA = 0.390

한편, 2008년 NL 전체 타격 기록을 가지고 구한 리그 평균 wOBA는 0.328이므로, 이를 이용하여 Utley의 wRAA를 구하면 다음과 같다. (엑셀 sheet 참조)

wRAA = 37.45 Runs

즉, 2009년 시즌의 Chase Utley는 NL 평균 타자에 비해 타격으로 팀 득점에 37.45점 더 기여했다는 의미가 된다.


2. wRAA를 Batting RAR로 : Replacement Level의 설정

wRAA는 Runs Above Average라는 단어의 의미에서도 알 수 있듯이 리그 평균과 비교하는 스탯이므로, 이를 Replacement Level과의 비교로 조정하여 RAR(Runs Above Replacement leve)로 만들 필요가 있다. 이전부터 한 시즌을 기준으로 리그 평균 수준의 주전 선수와 Replacement Level의 땜빵 선수 차이에는 20점 혹은 2승 정도의 차이가 난다는 경험적 분석 결과들이 있었는데, 작년 말에 THT에 게재된 Sean Smith의 뛰어난 연구는 이를 다시 한 번 확인시켜 주었다. 즉, 600 PA를 기준으로 리그 평균과 Replacement Level의 사이에는 20점(20 Runs)의 기여 수준 격차가 있다는 것이다. 이러한 격차를 wRAA 값에 더해주면, RAR로 쉽게 환산된다.

Utley의 경우로 돌아가면, Utley는 687 PA를 기록했으므로, 687 PA에서 평균과 Replacement Level의 격차를 계산해 보면...

600/20 x 687 = 22.90 Runs

이 값이 Utley의 Replacenemt Level 값이 된다. 즉, Utley 대신 Replacement Level 선수를 시즌 내내 기용했다면, 아마도 22.9점 만큼 덜 득점했을 것이라는 이야기이다.


3. 수비 기여 수준 : UZR

이전 포스팅에서 ZR을 개선한 합리적인 스탯으로 UZR, TZ(TZR), +/-를 소개한 바 있다. 그 포스팅에서 언급한 바와 같이, +/-는 유료 정보이며 연말에 발표되고, TZ의 경우 현역 메이저리거들에 대한 데이터는 아직 작업중인 상태여서 조회가 되지 않으므로, 현재로서는 UZR이 거의 유일한 선택이라고 할 수 있다. UZR은 Fangraphs에 거의 실시간으로 계속 업데이트 되므로, 지난 시즌의 결과물 뿐 아니라 현재 진행중인 시즌에 대해서도 누구가 쉽고 빠르게 정보를 얻을 수 있다. 뿐만 아니라, TZ의 창시자인 Sean Smith조차 UZR이 가장 뛰어난 수비 스탯이라고 인정하고 있으므로, UZR을 쓰는 것이 여러 모로 좋은 선택이라고 생각한다.


Utley는 2009년 1년 내내 2루수로만 출장했으며, 1년간의 누적 UZR 값은 10.8이다.

UZR = 10.8 Runs

이는 Utley가 2008년 시즌에 수비를 통해 실점을 평균 2루수보다 10.8점 더 방지하는 정도의 기여를 했음을 의미한다.


4. Positional Adjustment

다시 한 번 포지션별 조정 점수를 정리해 보면 아래와 같다.

포수 : +12.5 Runs
유격수 : +7.5 Runs
중견수, 2루수, 3루수 : +2.5 Runs
좌익수, 우익수 : -7.5 Runs
1루수 : -12.5 Runs
지명타자 : -17.5 Runs


이 조정 점수는 162게임의 풀 시즌을 기준으로 만들어진 것임에 유의해야 한다. 162게임을 이닝으로 환산하면 1,458 이닝이 되므로, 실제 수비에 참가한 이닝을 1458로 나눠서 위의 조정 점수를 곱해 주면 실제 해당 시즌의 조정 점수가 될 것이다.

Utley는 2008년에 2루에서 1357 이닝을 뛰었다. 따라서...

(2.5 x 1357) / 1458 = 2.33 Runs

이 점수가 Utley의 수비 포지션에 따른 최종 조정 점수가 된다.


5. 주루플레이의 기여 수준: 도루 성공과 실패

Fangraphs는 주루플레이에 대해 도루 성공/실패만을 반영하고 있는데, 이는 Fangraphs가 다른 주루 능력에 관심이 없어서라기보다는 무료로 이용 가능한 공개 주루 스탯이 존재하지 않기 때문일 것이다. 주루 스탯을 제공하는 곳이 BP와 Bill James Online 정도밖에 없는데, 둘 다 Fangraphs에 자료를 그냥 링크해 줄 생각은 없는 듯하다.

Fangraphs의 선수 페이지에서 맨 아래에 있는 Value를 보면, Running 항목이 따로 존재하지 않고 도루 성공/실패를 Batting에 합산하고 있다. 평균적으로 도루 성공은 0.175, 도루 실패는 -0.467점의 가치(Run Value)를 지니므로, 도루 및 도루 실패의 갯수에 Run Value를 곱해서 계산하는 것이다.

Utley는 2009년에 23 SB, 0 CS를 기록하였으므로...

23 x 0.175 - 0 x 0.467 = 4.03 Runs

도루를 통해 4.03점 만큼 팀 득점에 기여하였다는 결론을 얻을 수 있다.


6. RAR 및 WAR의 산출

이제 모든 구성 요소의 계산을 다 했으므로, 지금까지 나온 값을 모두 더하면 타자의 총 기여 수준, 혹은 그의 가치(Value)가 된다.

RAR = 37.45(타격) + 22.9(Replacement Level) + 10.8(수비) + 2.33(포지션 조정) + 4.03(도루)
      = 77.50


득점 10점은 1승과 동일하므로,

WAR = RAR/10 = 7.8

즉, 거칠게 표현하자면, 2009년 Chase Utley는 7.8승짜리 플레이어였다는 것이다.

2009년 Phillies는 93승 69패를 기록하였는데, 만약 Utley 대신 1년 내내 Miguel Cairo와 같은 Replacement Level 플레이어들로 2루를 돌려막기 했다면, Phillies는 아마도 85승 77패를 기록했을 것이라는 이야기이다. 이렇게 되면 Florida Marlins와 동률이 되므로, 플레이오프 진출을 장담할 수 없게 되어 버린다. 이것이 바로 진정한 스타 플레이어 한 명의 위력이다.

Fangraphs의 Utley 페이지를 보면, 2009년 그의 WAR를 7.6로 계산하고 있다. Fangraphs의 WAR 계산 로직은 이 글에서 내가 설명해 온 바와 동일하다. 0.2의 오차는 타격 기여도 계산에서 생겨난 것인데, 내가 타격에 37.45, 도루에 4.03으로 총 41.48점으로 계산한 데 비해 Fangraphs는 둘을 합쳐 39.4로 계산하고 있다. 오차의 원인으로 생각되는 것은 사용한 Park Factor 데이터의 차이 및 Park Factor 적용 방법의 차이가 가장 유력하다. 또한, 소숫점 반올림으로 인한 약간의 오차도 발생할 수 있다.


이번에는 Joe Mauer의 2009년 성적을 이용해서 WAR를 계산하여 보자.
(역시 첨부한 엑셀 sheet에 계산한 결과물이 들어 있다.)

다음은 Mauer의 2009년 타격 Raw Stat이다.
606 PA, 131 1B, 30 2B, 1 3B, 28 HR, 14 IBB, 62 NIBB, 2 HBP, 3 RBOE

Twins의 홈인 Metrodome의 Park Factor를 고려하여 위의 스탯을 조정해 주면 아래와 같다.
606 PA, 132 1B, 30 2B, 1 3B, 30 HR, 14 IBB, 62 NIBB, 2 HBP, 3 RBOE

이 기록으로부터 wOBA 및 wRAA를 계산하면,
wOBA = 0.449
wRAA = 57.50

Replacement Level = 20 / 600 * 608 = 20.2

수비 : UZR = 0 (포수는 UZR데이터가 없다.)

포지션 조정 : Mauer는 포수로 939 이닝을 뛰었으며, 지명타자로 28게임에 출장하였다. 따라서...
12.5 x 939 / 1458 - 17.5 x 28 / 162 = 5.03

도루성공/실패 : 4 SB, 1 CS이므로
4 x 0.175 - 1 x 0.467 = 0.23

이제 모두 더해주면,
RAR = 57.5(타격) + 20.2(Replacement) + 0(수비) + 5.03(포지션 조정) + 0.23(도루) = 82.96
WAR = RAR/10 = 8.3

즉, 2009년 Mauer는 8.3승짜리 플레이어였다는 것이다.

Fangraphs의 계산 결과는 8.2이다. 역시 0.1의 차이는 Park Factor 및 소수점 반올림 등으로 인한 오차로 생각된다.


여기까지가 Fangraphs의 WAR 계산 방법인데... 주루플레이가 도루 성공/실패만 단순히 계산되고 있고, 포수 UZR이 없어 포수 수비력의 차이가 반영되지 않는다는 문제점이 있음을 알 수 있다. 이제 이를 보완하는 방법을 찾아 보자.

주루플레이에 대해서는 이전에 소개한 바와 같이, Baseball Prospectus의 EqBRR을 대신 사용할 수 있다. Chase Utley의 경우 2009년 EqBRR이 8.80으로, 매우 뛰어난 주자임을 알 수 있다. 도루성공/실패로 계산한 숫자 대신 이 EqBRR을 대신 넣어서 계산하면 아래와 같다.

RAR = 37.45(타격) + 22.9(Replacement Level) + 10.8(수비) + 2.33(포지션 조정) + 8.8(주루) = 82.28
WAR = RAR/10 = 8.2

Fangraphs에서 저평가되었던 주루 능력을 제대로 평가해준 결과, Chase Utley는 이제 8.2승짜리 선수가 되었다. 워낙 주루능력이 좋은 선수이다 보니, 주루를 이렇게 반영해주지 않았더라면 억울할 뻔 했다.


이번에는 Joe Mauer를 재평가해 보자.

EqBRR에 의하면 Joe Mauer의 주루 능력은 -3.60으로 나온다. 포수들은 일반적으로 좋은 주자가 아니라는 상식과 일치하고 있다.

포수 수비력
은 아직 의견이 분분한 분야이나... 이 글을 참고하면 Mauer는 2009년 수비에서 4.4점 기여한 것으로 되어 있다. 역시 Mauer는 수비가 좋은 포수라는 상식과 일치하는 결과이다.

이 둘을 기존 계산식의 주루와 UZR 대신 넣어서 계산해 보면,

RAR = 57.5(타격) + 20.2(Replacement) + 4.4(수비) + 5.03(포지션 조정) - 3.6(도루) = 83.43
WAR = RAR/10 = 8.3

수비에서 플러스 된 대신 주루에서 마이너스가 되어 RAR은 0.5점 올라가는 데 그쳤다. 결국 8.3 WAR로 거의 같은 결과를 얻게 됨을 알 수 있다. 비록 결과값은 비슷하지만 이것은 주루와 수비를 제대로 반영해 준 값이다.


나로서는 위의 방법이 크게 어렵지 않으면서도 타자의 공/수/주를 모두 커버하고 있어서 현재로서는 가장 좋은 툴이라고 생각하고 소개한 것이지만, 이러한 방법이 타자를 평가하는 단 하나의 절대적인 기준이 될 수는 없다. 취향에 따라 특정 스탯을 넣을 수도, 뺄 수도 있다. 예를 들어 EqA를 선호한다면 위의 계산에서 wRAA와 EqBRR을 빼고 대신 EqA로부터 Batting+Running Runs를 유도하여 넣어 주면 될 것이다. 혹 수비 스탯은 아무 것도 믿을 수 없다는 매우 회의적인 시각을 가진 사람이라면, UZR를 빼 버리면 될 것이다. 어떻게 활용하느냐는 각자의 몫이다.

또한, 세이버메트릭스에 절대적으로 의존하기보다는 활용 가능한 모든 정보(스카우팅 등)를 총 동원하여 여러 가지 각도에서 선수를 평가하는 것이 더욱 좋을 것이다. 물론 전문적인 스카우팅 훈련을 받거나 직접 선수생활을 해보지 않은 보통의 팬들이 자기 스스로의 안목을 가질 수 있는 방법은 역시 세이버메트릭스 만한 것이 없다고 생각하지만...


(이 글은 한국야구팬사이트에서도 보실 수 있습니다.)


Today's Music : Phil Collins Playing Drums!!! (with Chester Thompson)




Phil Collins는 무수히 많은 히트곡을 만든 송라이터이자 보컬리스트로서 유명하지만, 사실은 그런 것 이전에 매우 탁월한 드러머였다. 특히 Genesis의 초기 앨범들을 들어보면 Collins의 드럼 실력에 정말 놀라게 될 것이다. Collins는 공연시에 주로 자신의 드럼 연주로 오프닝을 장식하곤 했는데, 위의 두 라이브 클립에서는 세션 드러머 Chester Thompson(역시 아주 뛰어난 드러머임)과 환상적인 호흡을 보여준다.

Collins는 올해 가을, 아쉽게도 드러머로서 은퇴를 발표했다. 척수 부위의 부상으로 인해 스틱을 잡을 수조차 없게 되었기에, 50년간 쳐 왔던 드럼을 더 이상 칠 수 없게 되었다는 것이다. 너무나도 안타까운 일이 아닐 수 없다.

Posted by FreeRedbird

댓글을 달아 주세요

  1. 홈런강탈 2010.02.03 23:15 Address Modify/Delete Reply

    EqBRR이 어떤 과정에서 계산되는지 궁굼하네요. 추가진루라던지 주루가 공격력에서 어느 정도 가치를 가지게 될지 애매하기도 하고 ㅎ

    • BlogIcon FreeRedbird 2010.02.04 13:45 신고 Address Modify/Delete

      EqBRR은 다음 다섯 가지의 component를 더해서 계산합니다: Equivalent Ground Advancement Runs (EqGAR), Equivalent Stolen Base Runs (EqSBR), Equivalent Air Advancement Runs (EqAAR), Equivalent Hit Advancement Runs (EqHAR) and Equivalent Other Advancement Runs (EqOAR)

      예를 들어 EqGAR의 경우는 타자가 그라운드볼을 친 경우에 해당 주자가 얼마나 진루에 성공했는지를 가지고 득점 기여 수준을 평가하고요, 다른 component의 경우도 각각의 상황에 대해 평가를 하는 것입니다. 추가진루 1개의 득점 기여 가치가 어떻게 계산되는지에 대한 구체적인 설명은 없으나, 아마도 RE(Runs Expectancy) 테이블과 각각의 상황에 대한 oppotunity를 가지고 가중평균을 구해서 나오지 않았을까 싶네요.(저라면 그렇게 계산했을 것이라는 이야기입니다...)

      Baseball Prospectus는 자신들의 스탯에 대해 디테일한 정보를 잘 주지 않습니다. 거의 모든 계산방법을 인터넷에 오픈하는 Tango나 Litchman, Sean Smith 등에 비하면 꽤 폐쇄적인 자세를 가지고 있죠.

  2. 오뎅 2010.10.20 21:42 Address Modify/Delete Reply

    어틀리 과소평가는 08년 정점에...

    하워드 48홈런 146타점 162경기 700타석 251.339.881
    331루타 H+BB+LBB 250회 WRC 106 WAR 3.1승 mvp 2위

    어틀리 33홈런 104타점 159경기 707타석 292.380.535.915
    325루타 H+BB+LBB 255회 WRC 121 WAR 8.1승 mvp 순위권없음...

    • BlogIcon FreeRedbird 2010.10.22 19:20 신고 Address Modify/Delete

      WAR나 여기 있는 여러 스탯들이 완전 절대적이라고는 할 수 없습니다만, MVP 투표를 하는 사람들이 지나치게 홈런과 타점 같은 타격 지표에만 매달리는 것은 편중된 결과를 가져올 수밖에 없습니다. 1루수의 수비는 중요하지 않다고 생각하는 인식도 문제이고요. 1루도 엄연히 수비 포지션입니다.

  3. BlogIcon HJ90 2011.01.26 15:18 Address Modify/Delete Reply

    잘봤습니다. 새로운 기록에 대해 배우고 갑니다. (좀 어렵네요)

  4. BlogIcon aslkjdqwe 2011.10.18 23:18 신고 Address Modify/Delete Reply

    리플레이스먼트 레벨은 연마다 다르게 적용하는데 이 경우 연간파크팩터처럼 경향성이 있을 거 같은데 과소평가, 과대평가 위험이 있지 않나요? 레드버드님은 WAR로 다른 포지션끼리의 비교, 다른 시즌끼리의 비교를 어떻게 보시나요? 요즘 세이버스탯이 보편화 되어서 좋은데 무슨 만능치트키인양 사용하는 사람들도 많고 참...

    • BlogIcon FreeRedbird 2011.10.19 13:17 신고 Address Modify/Delete

      서로 다른 시즌을 비교하는 것은 쉽지 않은 작업입니다. 타고투저와 같은 현상도 있고, 스테로이드와 같은 외적 요소의 영향을 받기도 하고.. 뭔가 기준이 있어야 겠지요. 예를들어 타율 .400인 타자는 타율 .300인 타자에 비해 1.3배 좋은 타격을 한 것일까요? 그렇지는 않지요. 타율 .000 인 타자는 존재하지도 않고, 그런 타자를 기준으로 비교하는 것도 무의미합니다.

      Replacement Level은 이러한 문제를 해결하기 위해 설정된 기준입니다. Replacement Level을 달리 표현하면 구단들이 메이저리그 로스터에 포함시킬 수 있는 최저수준의 선수이므로, 이를 기준으로 이보다 얼마나 더 많은 기여를 했는가를 놓고 비교를 하는 것은 합리적이라고 할 수 있습니다.

      현재와 1940년대를 비교하면 물론 많은 차이가 있을 수 있겠지만.. 예를 들어 2011년과 2007년을 비교할 때에는 큰 문제는 없습니다. 2011년의 replacement level과 2007년의 replacement level은 절대적으로 다를 수 있고, 아마도 조금 다를 것입니다. 비교를 위해서는, 단지 메이저리그 전체 수준(리그 평균) 대비 상대적인 위치만 동일하면 됩니다. 평균 대비 -2~2.5 WAR 이라는 값은 2011년이나 2007년이나 거의 동일합니다.

      다른 포지션끼리의 비교에 있어서도, 아시다시피 1루수에게 요구되는 공격력의 수준과 유격수에게 요구되는 공격력의 수준은 다르므로, 뭔가 기준이 필요한 것이고요. 마찬가지로 구단들이 어떻게 판단하느냐를 기준으로 삼은 것입니다. 최저 수준(메이저/마이너의 경계)의 1루수와 최저 수준의 유격수는 같은 Replacement Level인 것으로 보고, 이를 기준으로 선수의 기여 수준을 계산하여 비교하는 것입니다. 나름 합리적인 방법인 것 같습니다.

      저는 이러한 방법론은 올바르다고 생각하는데요. 관건은 WAR이 제대로 계산이 되었느냐 이겠지요. 여기에는 많은 이슈가 존재합니다. Linear Weights의 약점이라고도 할 수 있는 Context 무시(주자 유무 등에 따라 같은 타구도 value가 달라짐) 라든지, 각 이벤트의 value를 어떻게 설정할 것인가 라든지(홈런의 절대 가치, 1루타의 절대 가치 등은 사실 시즌별로 RE Matrix가 변화하면서 같이 바뀝니다. 본문에 소개해 드린 수치는 절대적이지 않습니다.), 타격에 비해 정확도가 다소 떨어지는 주루/수비 스탯의 신뢰도 문제라든지... 투수의 경우는 Run Estimator 선택의 문제(FIP? ERA? SIERA? ERC? 등)가 존재하고요. 또, 여러가지 계산방법이 존재하는 Park Factor를 어떤 식으로 반영하느냐의 차이도 있고요. 사실 우리가 보는 WAR의 결과값에는 이런 여러가지 이슈에 대한 가정 내지는 판단이 포함되어 있는 것입니다. 당장 같은 선수에 대해서 Fangraphs와 Baseball Reference의 WAR 값이 서로 다르지 않습니까? 이러한 한계를 인정한다는 전제 하에서, WAR 기준의 선수 비교는 우리가 지금 시도해볼 수 있는 가장 합리적인 선택이라고 봅니다.

      야구에 만능치트키 같은 것은 없습니다. 세이버메트릭스는 어떻게 하면 좀 더 현실을 잘 반영할 수 있을까... 끊임없이 고민하고 개선시켜 나가는 과정이죠. 10년 전에는 선수 평가의 가장 발전된 도구가 Win Share였고, 5년 전에는 BP의 VORP/WARP였다면, 지금은 WAR인 셈입니다. 계속해서 현실에 다가갔다고 생각되고요. 시간이 흐르면 또 좀 더 좋은 메트릭이 만들어질 수도 있겠지요. 꼭 혁명적인 새로운 지표가 나올 필요는 없고... 지금의 WAR을 보다 많은 사람들이 동의할 수 있도록 개량해 가는 정도로도 괜찮을 것 같습니다.

  5. 123 2012.08.11 14:13 Address Modify/Delete Reply

    war수치에 대해 알아보다 우연히 발견했는데 알차고 알기쉽게 되있네요. 감사합니다 좋은 글 읽고 갑니다.

  6. 한기범 2012.11.14 15:43 Address Modify/Delete Reply

    안녕하세요, 스탯 계산하면서 레드버드님의 포스팅 많은 참고 되었습니다. 엑셀 프로그램을 사용하면서 레드버드님의 포스팅으로 어려운 스탯도 기록 할 수 있게 되었습니다. ㅎㅎ
    KBO선수들의2013 스탯을 조금이나마 기록하는게 목표인데 잘 할 수 있을지 걱정이네요. ㅎㅎ
    특히 궁극적으로 WAR지수를 표현하고 싶어 UZR기록이 필요한데 전부 수작업으로 해야 해서..
    한편으로는 걱정입니다.ㅎㅎ;

    이것저것 알아보면서 BPF,PPF도 구할 수있게 되었는데요, 레드버드님의 포스팅에 첨부된 어틀리_
    마우어 엑셀을 봤는데 신기한 파크팩터가 있더군요. 홈런에 대한 파크팩터, 2루타,3루타등
    정말 다양했습니다.

    레드버드님의 엑셀을 보니 한가지 걱정?이 생겼는데요, 제가 구한 BPF,PPF는 WAR지수를 계산할때
    어떻게 적용해야하나요? WAR를 계산할 때, BPF,PPF가 신뢰할 만한 스탯인지 걱정입니다.

    • BlogIcon FreeRedbird 2012.11.16 10:59 신고 Address Modify/Delete

      개별 이벤트에 대한 파크팩터가 아닌 PF를 이용할 경우, 마지막 결과값에 적용해 주시면 됩니다. 예를 들어, PF가 110인 구장을 홈으로 사용하는 선수의 batting RAR이 20이라면, 20/1.1=18.2를 쓰시면 되겠지요. 개별 이벤트에 직접 적용하는 것이 더 정확하겠지만, 이것도 아쉬운대로 사용 가능합니다.

      BPF와 PPF가 다르게 나오나요? 득실점을 가지고 PF를 구하면 둘은 같아야 되는게 아닌가 싶은데요... 홈구장이 공격할 때 다르고 수비할 때 다른 것은 아니니까요.

      PF는 계산 방법이 여러가지가 있고, 각각의 방법에 대해 일장일단이 있습니다. 여기서 생각하셔야 할 것은 계산으로 나오는 PF 수치를 그대로 믿어도 되느냐 인데요. 구장에서 1년동안 열리는 경기 수는 그렇게 큰 모수라고 할 수가 없고요. 결과에는 random variation이 포함될 수밖에 없습니다. 그러니 일정부분 평균으로 회귀(regression to the mean)시켜 주시는 것이 안전합니다.

  7. 한기범 2012.11.17 01:45 Address Modify/Delete Reply

    답변 감사합니다. 코멘트를 보고 PF에 대한 의문이 생겨(혹시 잘못 설정 했나 해서요..;) 임의값을 부여하고 값을 확인했습니다.
    a. 득,실점과 게임에 의한 PF : 1.05225
    b. PF를 IPC,OPC에 의한 보정 : 1.04766
    c. b에 대한 TBR,TPR에 의한 BPF : 1.007824 PPF : 1.005759
    저는 c에서 얻은 값으로 ops+, era+ 등을 나타낼 생각입니다. 그런데 레드버드님의 엑셀 파일 보고 깜짝 놀랬어요.
    한눈에 신뢰 할 수 있는 자료임을 알 수 있었습니다. 신뢰도가 높은 자료가 부럽기도 하구요. ㅎ

    BPF=PPF 라고 하셨는데 계산이 틀린걸까요? ㅠㅜ

    조사기간이 짧은 PF에 대한 주의점 알려주셔서 감사합니다. 죄송합니다만, '일정부분으로 회귀'가 무엇인지 알려 주셨으면 합니다.
    야구를 좋아하기만 하지. 세이버매트릭스, 수학에 대해서는 문외한이여서요 ㅠㅠ

    언제나 레드버드님의 양질의 포스팅을 유익하게 보고 있습니다. 앞으로도 세이버 매트릭스에 대한 좋은 포스팅 부탁드려요.^^

    • BlogIcon FreeRedbird 2012.11.19 14:25 신고 Address Modify/Delete

      블로그 왼쪽 위에 보시면 "Mail to FreeRedbird"라는 링크가 있는데요. 눌러보시면 제 메일 주소가 나옵니다. 메일로 지금 계산하신 방법을 참고하신 출처를 알려 주시면 제가 살펴보고 조언을 드리겠습니다.

  8. RJ 2013.01.11 13:59 Address Modify/Delete Reply

    옛날부터 세이버매트릭스에 대해 자세히 알기 위해 블로그 자주 들렸었습니다ㅎㅎ
    이 글도 몇 번째 다시 보는건진 모르겠는데,
    다시 보다 보니 지금 Fangrahs 사이트에선 2009년 마우어의 WAR을 7.9, wRAA를 54.8로 계산하고 있습니다.
    주인장님께서 엑셀 파일로 올려 주신 계산과정엔 마우어의 wRAA가 57.50(park adjusted)로 계산되어 있더라구요. 7.9와 8.3의 차이가 여기서 난 것 같은데..
    왜 이런 차이가 나게 되었는가가 궁금하네요^^ 댓글 주시면 감사하겠습니다ㅎㅎ

    • BlogIcon FreeRedbird 2013.01.12 02:43 신고 Address Modify/Delete

      안녕하세요.
      이 글은 쓰여진지가 좀 오래되어서 지금 다시 보면 업데이트가 필요해 보입니다. 제가 바빠서(게을러서?) 새로 글을 쓰지 못하고 있네요.

      그 당시와 비교해 보면, Fangraphs에 BsR과 포수 수비 스탯이 추가되었습니다. 09년 Mauer는 BsR에서 -1.6이고 Fld에서 -0.4이니 여기서 -0.2승의 차이가 생깁니다.

      나머지 -0.2승은 솔직히 잘 모르겠는데요. 이 글을 쓸 당시에도 -0.1 정도의 차이는 있었습니다. 파크팩터 적용시 소숫점 처리 등의 차이가 아닌가 생각됩니다. 아 그리고... wOBA 구할때 사용되는 각 이벤트(1루타, 2루타 등)의 1개당 가치와 마지막에 곱해주는 scale(1.15)은 사실 매년 리그평균에 따라 조금씩 변동이 됩니다. 제가 여기서 보여드린 식은 The Book 책에 나온 수치들인데요. 이 책은 2000-2004년 리그 평균을 기준으로 하고 있습니다. 2009년의 계산식은 계수들이 조금씩 다릅니다. 별도 포스팅으로 설명 드리겠다고 약속(?)한 게 너무 많이 밀려있어서 이건 몇 번째 포스팅이 될지 모르겠네요. ㅎㅎ

      암튼, WAR을 계산하는 기본적인 골격은 여전히 동일합니다만, 그 사이에 포수 수비도 측정을 하게 되었고, 주루 스탯도 추가로 반영된 것이(둘 다 Mauer에게는 불리한 변화) 차이를 더 크게 만든 가장 중요한 요인이라고 생각됩니다.

  9. KP 2013.09.07 04:07 Address Modify/Delete Reply

    안녕하세요,, 죄송하지만 war에 대해 여쭤볼게 있는데 물어볼 곳이 여기밖에 없네요
    죄송합니다

    Baseball Prospectus랑 Baseball Reference에서 oWAR는 Replacement Level에 포지션 차이를 두는걸로 알고있는데요

    프리레드버드님께서 다른 포지션끼리의 비교에 있어서도, 아시다시피 1루수에게 요구되는 공격력의 수준과 유격수에게 요구되는 공격력의 수준은 다르므로, 뭔가 기준이 필요한 것이고요. 마찬가지로 구단들이 어떻게 판단하느냐를 기준으로 삼은 것입니다. 최저 수준(메이저/마이너의 경계)의 1루수와 최저 수준의 유격수는 같은 Replacement Level인 것으로 보고, 이를 기준으로 선수의 기여 수준을 계산하여 비교하는 것입니다. 나름 합리적인 방법인 것 같습니다.

    이렇게 말씀하셨는데 Fangraphs에서는 Replacement Level에서 포지션 차이를 않두는 건가요?

    • BlogIcon FreeRedbird 2013.09.07 05:15 신고 Address Modify/Delete

      안두는 건 아니죠. 위의 본문을 보시면 "Positional Adjustment"라고 해서 포지션 조정을 해 주는 부분이 있습니다. 거기서 차이를 두는 거죠. 포지션 조정에 의해 1루수와 유격수의 Replacement Level은 풀타임 기준으로 20점의 차이가 나게 됩니다.

    • KP 2013.09.08 01:46 Address Modify/Delete

      결혼식 갔다와서 이제서야 봤네요 죄송합니다,,,,

      최저 수준의 1루수와 유격수의 Replacement Level이 같다고 하셨는데 이게 공격war에서 Replacement Level을 포지션 상관없이 다 같게 둔다는거 아닌가요,, woba에서 wraa 계산할때 사용하는 woba도 포지션 상관 않하고 모두 같은 리그 평균 woba이를 쓰구요,,, Baseball Prospectus랑 Baseball References는 oWAR 자체에 Replacement Level을 포지션별로 계산하구요,,

      Fangraphs의 Positional Adjustment는 제가 보기에는 dWAR에 대한 조정으로 보는게 맞을꺼 같은데요,,

      제가 궁금한거는 dWAR가 아닌 oWAR에서만 Fangraphs에서는 Replacement Level 자체에 포지션 차이를 두는지 않두는지 이게 궁금한겁니다. 엠팍에서 스탯티즈WAR랑 비교하면서 메이저리그 WAR는 oWAR에도 포지션 차이를 둔다고했는데 제가 보기에는 Fangraphs에서 oWAR는 포지션 차이가 없어보이거든요. Fangraphs에서는 포지션 차이 않두는거 맞는거죠?

    • KP 2013.09.08 01:46 Address Modify/Delete

      제가 글솜씨가 없어서 따지는 투로 글을 썼는데요,, 전혀 그렇게 생각하는건 아니구요,, 글솜씨가 없어서 그런거일뿐 오히려 답변 달아주셔서 감사하게 생각합니다,, 정말 감사합니다

    • BlogIcon FreeRedbird 2013.09.08 02:19 신고 Address Modify/Delete

      그것은 단지 계산순서의 차이일 뿐 별로 중요한 부분은 아니라고 봅니다만... 개념상 dWAR에 가깝다고 할 수는 있겠는데요. 어쨌든 Fangraphs 사이트는 실제로 oWAR 산출 도중에 이 포지션 조정 계산을 수행하고 있고요. 그러니 oWAR에서 이미 차이가 나고 있다고 보는게 맞습니다. dWAR는 같은 포지션의 수비수들끼리 리그 평균을 기준으로 수비력을 비교한 결과입니다.

    • KP 2013.09.08 03:41 Address Modify/Delete

      죄송한데 Fangraphs oWAR 계산에서 포지션 조정 계산이 어디 들어가있는지 알수 있을까요,,, 저는 이게 정말 궁금해서요

    • BlogIcon FreeRedbird 2013.09.12 14:13 신고 Address Modify/Delete

      지금 다시 확인해보니 oWAR에 합치지 않고 다 따로 계산하고 있네요. 아무 선수 페이지나 들어가 보시면 맨 마지막에 Value가 있는데요. Batting, Baserunning, Fielding, Replacement, Positional을 다 따로 표기해 놓았군요. Positional이 포지션 조정입니다.

      본문을 썼던 무렵에는 batting runs에 합쳐서 표기했던 것 같은데... 제 기억이 잘못된 것일지도 모르겠습니다.

  10. ㅇㅇ 2017.03.18 21:28 Address Modify/Delete Reply

    Replacement level 설정에 600/20 이라 적혀 있는데 20/600 아닌가요?

  11. 보트영섭 2018.12.07 04:44 Address Modify/Delete Reply

    한국 야구 팬사이트는 폐쇄됐나요?


Jon Lester의 2009년 시즌 기록을 예로 하여 WAR을 구해 보자.


투수에 대한 이전 포스팅
에서 우리는 투수의 퍼포먼스를 평가하는 여러 가지 스탯을 살펴본 바 있다. 이 스탯들은 모두 해당 투수가 얼마나 실점을 하는지를 9이닝당 비율로 표시한 것이다. 댓글을 통해 ERA와 FIP, BABIP에 대해 camomile님과 매우 유익한 토론이 진행되었으므로 투수의 평가에 대해 관심이 있으신 분들은 꼭 위의 링크를 눌러 댓글을 읽어보시기 바란다. 원래 세이버메트릭스는 열린 개념이므로 정해진 결론은 없으며, 선택은 물론 여러분 각자의 몫이다...

어쨌거나, ERA나 FIP, tRA 등과 같은 스탯은 9이닝당 실점 수준을 보여 주지만, 여기에는 실제로 해당 투수가 그 시즌에 몇 이닝을 던졌는지는 반영되지 않는다. 9이닝당 1실점을 하는 압도적인 선발투수라고 해도, 50이닝만을 던지고 부상으로 시즌아웃 되었다면, 결코 좋은 평가를 하기는 어려울 것이다. 즉, 투수의 가치(Value)를 평가하기 위해서는 그가 얼마나 많은 이닝을 책임져 주었는지가 반드시 고려되어야 한다.

여기에서는, Fangraphs의 투수 WAR(Wins Above Replacement Level)를 계산하는 방식을 모델로 하여 투수의 가치를 구하는 방법을 살펴볼 것이다. 늘 강조하듯이 이것은 절대적인 단 하나의 방법은 아니며, 현재 나와 있는 여러 가지 방법 중 (내가 보기에) 가장 그럴 듯하여 소개하는 것이다. 또한 Fangraphs가 꽤 양질의 데이터를 모두 공짜로 보여주고 있어서 누구나 쉽게 찾아볼 수 있다는 장점도 있다.

(참고: 타자의 WAR 계산은 이전 포스팅을 참고.)

이 글에서는 우선 선발투수만을 대상으로 하고자 하며, 구원투수는 다음 포스팅에서 다루게 될 것이다. 구원투수를 따로 다루는 이유는 구원투수의 WAR 계산시 LI를 반영하는 단계가 중간에 포함되므로 별도의 설명이 필요하기 때문이다. 안그래도 항상 글이 긴 편인데, 구원투수의 LI 이야기까지 하면 아무도 읽고싶지 않은 엄청난 길이가 되어버릴 듯하여 글을 분리하기로 하였다.

이제부터 2009년 Jon Lester의 기록을 가지고, 투수의 WAR를 구하는 방법을 차례차례 살펴보도록 하겠다.
Fangraphs는 이 과정을 무려 일곱 개의 글에 걸쳐 설명하고 있는데, 내가 이걸 이해하는 데에는 무척 오랜 시간이 걸렸다. 나는 어떻게든 이 포스팅 하나로 몽땅 설명을 해 보고자 한다. 그것도 일곱 개의 원문보다 더 쉽게 말이다. 이게 가능한 목표일지는 모르겠지만... -_-;;;;


1. 투수가 속해 있는 리그의 평균 RA를 산출

우선 구하고자 하는 것이 ERA가 아니라 RA임에 유의해야 한다. 모든 종류의 실점을 아우르는 것이다.

Lester는 AL에서 뛰고 있다. 2009년 AL 전체 기록을 보면, 20173 1/3 이닝에서 10793점을 득점 혹은 실점하였음을 알 수 있다. (이런 기록은 Baseball-Reference에서 쉽게 얻을 수 있다.) 우리가 원하는 것은 경기당 평균 실점, 좀 더 정확히 이야기하면 9이닝당 평균 실점이다. 아래와 같이 간단히 계산할 수 있다.

AL avg RA = 10793 / 20173.333333 * 9 = 4.82


2. 투수의 조정 RA 산출

먼저 투수의 평균 실점 수준을 나타내는 스탯을 하나 골라서 가져온다. Fangraphs는 FIP를 이용하고 있고, 나도 FIP를 선호하므로, 여기에서는 FIP를 사용하도록 하겠다. (ERA나 tRA 등을 이용하고자 하는 경우에 대해서는 조금 아래에서 설명을 따로 드리도록 하겠다.) Lester의 2009년 FIP는 3.15이다.

FIP는 ERA Scale의 스탯이므로, 이를 RA Scale로 바꾸어 주어야 한다. ERA와 RA 사이에는 0.92:1의 관계가 경험적으로 존재하므로, 3.15를 0.92로 나눠 주면 RA Scale이 된다.

다음은 구장 효과인데... 구장 효과는 계산 방법이 여러가지이고 계산 방법에 따라 결과도 조금씩 다르다. 일단은 Fangraphs에서 제시하는 2004-2008년 5년간의 득점 Park Factor를 이용하도록 하겠다. Red Sox의 경우는 1.03으로 되어 있다. (이것은 홈에서 절반을 플레이하고 원정에서 절반을 플레이한다는 것을 이미 반영한 Adjusted Park Factor이다.) 즉, Lester는 Red Sox에서 뛰게 됨으로 인해 1.03배 더 실점하는 페널티를 가지고 있는 것이므로, 이를 보정해 주기 위해 다시 1.03으로 나눠 주어야 한다.

이 두가지 단계를 계산해 주면...

Adjusted RA = 3.15 / 0.92 / 1.03 = 3.32

이 3.32라는 숫자의 의미는... 중립적인 구장에서 평균 수준의 팀 동료들이 수비를 하고 있고, 상대 타선 역시 평균 수준의 선수들로 채워져 있을 경우, Lester가 9이닝을 던지면 3.32점 실점할 것이라는 뜻이다.

* 주 : FIP보다 ERA를 더 선호하는 경우, 위의 계산에서 FIP 대신 ERA를 사용하여 동일한 방법으로 Adjusted RA를 얻으면 된다. tRA를 사용하고자 하는 경우, tRA는 이미 RA Scale의 스탯이므로 0.92로 나눠 줄 필요가 없다. tRA에 구장 효과만 반영해 주면 된다.


3. 게임 당 평균 투구 이닝 계산

Lester는 32게임에 나와 203 1/3 이닝을 던졌으므로, 게임당 평균 투구 이닝은 다음과 같다.

IP/G = 203.333333 / 32 = 6.35


4. Runs per Win 계산

이 부분이 가장 어려운 부분일 것 같은데... 보통의 상황에서는 10점 = 1승으로 대충 계산하면 별로 오차가 발생하지 않는다. 하지만, 투수는 팀의 실점에 미치는 영향이 워낙 크기 때문에, 어떤 투수가 마운드에 있는지에 따라 Run Scoring Environment가 바뀌고, 이에 따라 점수와 승수의 관계도 바뀌게 된다.

조금 더 쉽게 생각하면... Lester와 같은 좋은 투수는 실점을 덜 하게 되므로, 보통 투수가 마운드에 있을 때에 비해 득점을 덜 해도 승리를 할 수 있게 되는 것이다. 반대로 3류 투수가 마운드에 있다면, 소속팀이 승리를 하기 위해서는 더욱 많은 득점을 해야 할 것이다. 이러한 변화를 반영하는 것이다.

투수의 퍼포먼스에 따른 점수와 승수의 관계를 계산하는 방법은 역시 여러가지가 있으며, 대부분은 Pythagenpat과 같은 득점/실점과 승률의 관계로부터 계산식을 이끌어내게 된다. 그러나, Pythagenpat을 직접 사용할 경우 제곱근을 구해야 하는 등 계산식이 복잡해지므로, 다음과 같은 근사식을 사용한다.

[((상대 팀 이닝*상대 팀 실점수준)+(소속 팀 이닝*소속 팀 실점수준)/(상대 팀 이닝+소속 팀 이닝))+2] * 1.5

근사식도 너무 복잡해 보이지만... 예를 통해 보면 조금 쉬울 것이다. 이닝 및 실점수준은 모두 9이닝을 기준으로 한다는 것을 기억하자.

상대 팀의 수준은 천차만별이겠지만... 162게임의 긴 시즌을 치르다 보면 여러 상대를 만나게 되므로, 결국 리그 평균에 가까워질 것이라고 볼 수 있다. 따라서, 상대 팀은 9이닝 당 리그 평균인 4.82점을 실점할 것으로 볼 수 있다. 한편 소속 팀의 경우... Lester가 선발로 나온 경기에서 9이닝 중 Lester가 책임져 주는 이닝은 평균 6.35이닝이었다. 나머지 2.65이닝은 리그 평균 수준으로 실점한다고 보고 계산한다. (분석 대상인 투수를 제외하고는 모두 리그 평균을 가정한다. 이렇게 해서 팀 동료들의 활약으로 인해 이득이나 손해를 보는 부분을 제거하고자 하는 것이다.)

이렇게 하면, 상대 팀 9이닝 + Lester 6.35 이닝 + Lester의 동료 구원투수들 2.65이닝 = 총 18이닝이 분모가 된다. 계산을 해 보자.

Runs per Win = [(((9 * 4.82) + (6.35 * 3.32 + 2.65 * 4.82)) / 18) + 2] * 1.5 = 9.43

즉, Lester가 마운드에 있음으로 해서 9.43점 = 1승으로 바뀌는 것이다.


5. RAA/9 및 WAA/9, 기대 승률 계산

2번에서의 계산 결과 Lester는 9이닝 당 평균 3.32점을 실점하는 것으로 계산되었다. 한편, 리그 평균 투수들은 4.82점을 실점하므로, Lester는 리그 평균 투수에 비해 9이닝당 1.49점을 덜 내주는 것이 된다. (1.50이 아닌 이유는 소숫점 반올림 때문이다. 아래에 첨부한 엑셀파일 참고.) 이를 4번에서 계산한 9.43점 = 1승의 관계를 이용하여 환산하면, Lester는 리그 평균 투수에 비해 9이닝당 0.158승 소속팀에 더 기여하는 것이 된다. 리그 평균 투수는 이론적으로 승률이 5할일 것이므로, 팀 동료와 상대팀 선수들이 모두 평균 수준일 때 Lester 등판 시의 9이닝 당 기대 승률은 0.500 + 0.158 = 0.658이다.


6. Replacement Level

Replacement Level 팀은 .300 정도의 승률을 가지는 것으로 생각된다. 팀 승률이 .300이라고 해서 선수들이 모두 평균이 50%일 때 각각 30% 정도의 능력을 가지고 있는 것은 아니다. 실제로는 .300 타자, .300 투수, .300 수비의 팀은 승수효과에 의해 .300보다 훨씬 낮은 승률을 기록하게 되어 버리는 것이다.

.300의 팀 승률을 얻기 위해, 선발투수는 .380, 구원투수는 .470 정도의 능력이 요구된다. 이는 어느 정도 통계적으로도 검증된 수치이고... 이론적인 설명을 위해서는 Odds Ratio Method에 대한 배경지식이 필요한데... 이 이야기를 여기서 하게 되면 글이 완전히 산으로 가게 되므로... 이 부분은 추후 별도로 포스팅하도록 하겠다.

여기서는 일단 Tom Tango와 Fangraphs의 주장을 받아들여 Replacement Level의 투수의 승률이 .380인 것을 인정하고 넘어가도록 하자. 이것은, 소속 팀의 다른 동료들이 모두 리그 평균 수준이고, 상대 팀도 전부 리그 평균 수준의 선수들로 구성되어 있을 경우, Replacement Level 투수(예를 들어 AAAA 투수)가 선발 등판하여 9이닝을 던지면 .380의 승률을 기대할 수 있다는 의미이다.


7. WAR/9

9이닝당 Jon Lester의 기대 승률은 0.658이었다. 그리고 Replacement Level 선발투수의 기대 승률은 0.380이었다. 따라서, 9이닝을 기준으로 Lester는 Replacement Level 투수보다 0.658 - 0.380 = 0.278 더 기대 승률이 높다고 할 수 있다.


8. WAR

드디어 마지막 단계까지 왔다. 7번에서 얻은 9이닝 당 숫자를 Jon Lester가 던진 실제 이닝으로 환산하여 주면 되는 것이다. Lester는 203 1/3 이닝을 던졌으므로...

WAR = 0.278 * 203.333333 / 9 = 6.3

결국 2009년 시즌에, Jon Lester는 Replacement Level 투수에 비해 6.3승 더 팀에 기여한 것이다.


- NL 투수 계산하기 -

NL 투수는 AL 투수와 비교하여, 매 경기마다 타석에 들어선다는 중요한 특징이 있다. 거의 대부분의 경우, 투수들은 형편없는 타자들이므로, 타석에서는 팀에 오히려 피해를 입히게 된다. 이를 반영해 주어야 제대로 된 선수 가치의 계산이 가능할 것이다.

2009년 Tim Lincecum의 경우, 투구 내용만 가지고 보면 8.9 WAR의 시즌을 보냈지만, 타석에서 0.7승 만큼 오히려 팀에 해를 끼쳤으므로, 결국 최종 WAR는 8.9 - 0.7 = 8.2 가 되는 것이다.

첨부파일을 통하여 이를 확인하시기 바란다.


- 투수의 수비 -

투수의 수비력은 이 글을 쓰는 현재 WAR에 반영되고 있지 않고 있다. 투수의 UZR 데이터가 없기 때문이다. 수비가 좋은 투수와 좋지 않은 투수의 경우 이를 적절히 감안하여 주어야 할 것이다. 특별한 근거는 없으나 투수 수비의 영향은 가장 극단적인 경우 한 시즌에 최대 +/- 5 Runs 정도 되지 않을까 싶다.


첨부: 선발투수 WAR 계산의 예 (AL, NL 각 5명)


Today's Music : Pearl Jam - Given to Fly (Live)


위대한 밴드의, 위대한 곡의, 위대한 공연.
Posted by FreeRedbird

댓글을 달아 주세요

  1. BlogIcon aslkjdqwe 2011.10.06 20:29 신고 Address Modify/Delete Reply

    WAR 관련해서 궁금한 게 하나 있어요.
    선발투수 WAR을 구할 때 가령 A란 선발이 240이닝을 소화했을 때, WAR을 구하는 과정을 생각해보면
    빠지는 240이닝을 대체선수레벨선발로 대체하는 식으로 계산하는 것 같던데
    실제로 A란 선수가 빠졌을 때 빠지는 240이닝을 대체선수선발이 모두 메꿀 리는 없을테니 불펜소화 이닝이 늘어나게 되어 위의 계산과는 좀 다르지 않을까요? 제가 뭔가 잘못알고 있는 것 같기도 하고..;
    (표현이 잘 안되네요;)

    • BlogIcon FreeRedbird 2011.10.07 09:39 신고 Address Modify/Delete

      말씀하신 대로 한 시즌에 240이닝을 넘게 던지는 에이스 급 선발투수가 replacement level 투수로 대체된다면, 일부 이닝은 아마도 불펜이 소화하게 되겠죠. 감독이 대체선발에게 240이닝이나 던지도록 내버려 두지 않을 듯 합니다.

      다만, 이것을 반영할 수 있는 계산방법이 마땅치 않습니다. 240이닝 중에 얼만큼을 불펜이 가져갈 지도 알 수 없고, 불펜 안에서도 다시 그 이닝이 어떻게 배분되는지도 알 수 없기 때문이죠.

      딱히 방법도 없을 뿐 아니라, 그냥 계산 하시더라도 오차가 그닥 클 것 같지는 않습니다. Replacement level 선발이 상대적으로 조금 일찍 마운드에서 내려간다고 하면 아무래도 미들 릴리프 내지는 롱맨 등이 이어받게 되겠는데요. 얘네들은 보통 불펜에서 가장 못 던지는 애들이고, LI가 낮은 상황에 주로 등판하는 관계로 연간 WAR이 0에 가깝습니다. (즉, 얘네들도 어차피 거의 replacement level 투수들입니다.)

      Replacement Level은 일종의 동일한 비교 척도 라고 보시면 될 것 같습니다. 해당 선수가 던진 만큼을 대체 시켰을 때와의 차이를 서로 비교해 보고자 하는 것이지요. 일부 이닝이 불펜으로 가는 효과는 팀마다, 감독마다 다르게 나타나므로 비교가 어려울 듯 합니다.

  2. doosan 2012.05.07 20:43 Address Modify/Delete Reply

    Runs per win이란 것이 팀이 그만큼 득점을 해야 1승을 딴다. 이런 의미인건가요?
    10점 = 1승에서 그런것 같아 보이지는 않는데... 어렵네요

    • BlogIcon FreeRedbird 2012.05.08 13:17 신고 Address Modify/Delete

      투수의 퍼포먼스를 평가할 때 Runs per Win을 반영하는 이유는... 투수의 실력에 따라 Run Environment가 바뀌고, 이에 따라 승패가 갈리는 데 필요한 점수도 바뀌기 때문입니다. 에이스가 마운드에 있다면 4점만 내도 이길 확률이 높지만, 허접한 투수가 마운드에 있다면 6점을 내도 확신이 서지 않겠지요. 그런 차이를 반영해 주는 것입니다. 즉, RA9 3.5의 투수와 RA9 4.0의 투수는 단순히 9이닝당 0.5점의 차이가 나는 것이 아니라, 그보다 더 큰 차이가 나게 됩니다. 3.5 짜리 투수가 팀에게 이길 기회를 더 많이 주기 때문이죠.

  3. pitch 2012.07.23 11:22 Address Modify/Delete Reply

    수비나 운에 의해 이닝수도 달라질텐데 그런 건 어떻게 보정하고 있나요?

    • BlogIcon FreeRedbird 2012.07.23 13:12 신고 Address Modify/Delete

      수비에 의한 차이를 정확히 보정할 방법은 없습니다. 그래서 FIP와 같이 수비의 영향을 받지 않는 스탯을 베이스로 사용하는 것입니다.

      운에 의한 차이는 어떻게 할 방법이 없고요. 얼마만큼이 운에 의한 것인지 정확히 말할 수가 없습니다. 단지 투수의 입장에서는 "운"이나 마찬가지인 구장에 따른 차이를 Park Factor를 써서 보정하는 것입니다.

      이닝 수 자체를 조정하는 일은 없습니다. 특정 타구를 수비수가 처리해 줬다면 이닝이 더 빨리 종료되었을 것이라든지 하는 등의 경우가 있을 수 있지만, 이것을 계산에 반영하기는 어렵습니다.

      이닝 보다는 상대한 타자 수를 기준으로 삼는 쪽이 더 정확한 비교가 됩니다. 예를 들어 K/9 보다는 K/PA가 좀 더 좋은 스탯 입니다.

  4. yoon9298 2013.10.04 01:30 Address Modify/Delete Reply

    내셔널리그 투수들의 타격이 war에 감안되는 부분에 관해 질문이 있습니다. NL에서는 사실상 특수한 경우를 제외하면 모든 투수들이 반드시 타격에 들어서야되는데, 그렇다면 투수들의 타격 war는 대체선수 기준을 일반적인 야수의 타격이 아니라 같은 투수들의 타격에 비교하는것이 맞지 않은가 궁금합니다.

    구체적으로 예시를 들자면, 평균적인 대체선수급 NL투수들의 타석에서의 평균 득점 생산력이 1이고(산출기준은 중요치 않겠지요), 대체선수 수준의 야수들의 생산력이 2라고 가정하면 타석에서 1.5의 생산력을 가진 투수는 대체선수급 야수의 생산력보다 -0.5가 아닌 대체선수급 투수의 생산력보다 0.5가 +되므로 오히려 타격에서 평균적인 투수들보다 팀에 기여하고 있는 것이 아닌가 의문이 드네요.

  5. RENAK 2015.08.13 17:23 Address Modify/Delete Reply

    투수의 WAR 계산법을 찾던 중 이글을 우연히 보게되었습니다.

    그런데 WAA/9은 어떻게 구하는지 알수있을까요? 다른건 다 이해가 되는데 그건 이해가 난해하네요

  6. 삼팬 2015.10.14 21:02 Address Modify/Delete Reply

    스탯티즈 축하드립니다. http://www.statiz.co.kr/glossary.php

(주: 이 글의 내용 및 첨부된 계산 파일은 일부 오류를 포함하고 있으므로, 내용을 수정하여 다시 올린 새 글을 참고하시기 바란다.)

 


Chase Utley : 2008년 NL MVP 투표에서는 고작 15위에 머물렀지만, WAR로 보면 Pujols에 이어 메이저리그 전체 2위였다. 올 시즌 타자 WAR 리스트에서도 Pujols와 Hanley Ramirez에 이어 3위를 달리고 있지만, MVP 투표에서는 또 10위권 밖으로 밀려날 것이다. 항상 실력에 비해 충분한 인정을 받지 못하고 있는, 심각하게 저평가된 플레이어이다.


타자가 팀의 득점에 기여하는 방법은 크게 보아 공격(타격), 수비, 주루가 있을 것이다. 그래서 좋은 타자를 이야기할 때 "공, 수, 주 3박자를 두루 갖췄다"는 표현을 사용하기도 한다.

각각의 타자에 대해서 이러한 득점 기여의 정도가 어느 정도인지를 측정하기 위해, 지금까지 공격, 수비, 주루의 측면을 차례로 검토해 왔다. 또한 비교 대상으로서 절대적 기준이 되는 Replacement Level 및 수비 포지션에 따른 조정 수준에 대해서도 살펴본 바 있다. 이 글을 쓸 때까지 다소 시간 간격이 있었으므로... 다시 한번씩 훑어 보시면 이해에 도움이 되시리라고 생각하여 링크를 걸어 본다.

1. 타격 기여 수준 : wOBA 및 wRAA
2. 비교의 절대적 기준 : Replacement Level
3. 수비 기여 수준 : UZR, TZ
4. 포지션별 차이 : Positional Adjustment
5. 주루 기여 수준 : 도루 성공과 실패

이를 종합하면 특정 타자의 전체 기여 수준, 혹은 그의 가치(Value)를 계산할 수 있는데, 이것이 바로 RAR(Runs Above Replacement level) 및 WAR(Wins Above Replacement level) 이다.

먼저 RAR을 구해 보면... 위의 다섯 가지를 차례로 더해 주면 된다.

RAR = wRAA + Replacement Level + UZR + Positional Adjusment + SB/CS Runs

이제 RAR을 WAR로 환산해야 하는데... 원칙적으로는 팀 전체 득점과 실점에 대해 해당 플레이이어의 RAR이 미치는 점수 변화 정도를 가지고 Pythagorean Expectation의 식에 넣어서 계산하는 것이 맞지만... Pythagorean 관련 포스팅에서 언급한 바와 같이, "10점 득점 = 1승"의 단순한 계산 방법이 의외로 높은 정확도를 가지므로, 계산의 편의를 위해 이를 활용하는 것이 좋을 것이다. 즉, 아래와 같이 쉽게 계산할 수 있다.

WAR = RAR/10

이제부터 실제 예를 통해서 자세히 살펴보자.
계산에 필요한 Raw Data는 Retrosheet, Baseball-Reference, Fangraphs의 세 사이트에서 얻었으며, 이후의 모든 계산은 직접 하였다. 계산에 사용한 엑셀 sheet를 첨부하였으므로, 계산 결과를 쉽게 확인하실 수 있을 것이다.


아래는 Chase Utley의 2008년 성적이다.

공격 : 159 G, 607 AB, 707 PA, 99 1B, 41 2B, 4 3B, 33 HR, 50 NIBB, 14 IBB, 27 HBP, 5 RBOE
수비 : 20.2 UZR
주루 : 14 SB, 2 CS


(NIBB : 고의사구가 아닌 볼넷, IBB : 고의사구, RBOE : 에러로 인해 타자가 출루한 경우)

순서에 따라 차례차례 계산해 보면...

1-1. Park Adjust

먼저 wOBA를 계산하기에 앞서서, 구장으로 인한 효과를 보정해 주는 것이 계산의 신뢰도를 높이는 데 도움이 될 것이다. Park Factor를 계산하는 방법은 여러 가지가 있고, 개인적으로는 어떤 방법이 가장 좋은지 아직 결론을 내리지 못하고 있다. 일단 여기서는 Fantasy411의 2006-08년 Park Factor를 빌려와서 사용하도록 하겠다. (단, RBOE의 Park Factor는 어디에서도 얻을 수가 없었다. 어차피 Utley의 RBOE가 5에 불과하여 Park Factor가 있더라도 그다지 영향은 없었겠지만...)



정밀한 조정을 위해서는 Utley의 경기별 홈구장을 일일이 찾아서 계산해야겠지만... 너무 품이 많이 들므로, 다음과 같은 간단한 방법을 사용하였다. 1) 타석의 절반은 홈, 절반은 원정에서 기록한 것으로 본다. 2) 원정구장들의 평균 Park Factor는 100이다. (실제로는 홈구장을 뺀 15개 NL 구장의 평균이므로 100에 근접한 값일 것이나, 큰 오차는 없으리라고 본다) 3) 따라서, 홈 구장 Park Factor의 50%를 Raw Stat에 적용하여 보정한다.

이렇게 조정한 Utley의 성적은 아래와 같다.
707 PA, 98 1B, 41 2B, 4 3B, 29 HR, 51 NIBB, 13 IBB, 27 HBP, 5 RBOE

홈런이 줄어든 것이 눈에 띈다. 나머지 기록은 거의 변화 없음을 알 수 있다.

1-2. wOBA 및 wRAA 계산

이전의 포스팅에서 wOBA를 소개할 때에 비하여, 지금은 wOBA를 더욱 신뢰하게 되었다. 최근 THT의 Colin Wyers가 수행한 연구에 의하면, 90년대 및 2000년대의 메이저리그 기록을 가지고 분석할 경우 wOBA가 EqA보다도 정확도가 좀 더 높은 것으로 나타났기 때문이다. 현재 세이버메트릭스 진영에서 득점 기여 수준을 측정하는 가장 우수한 스탯으로 여겨지는 wOBA와 EqA의 승부(둘 다 실제 득점과의 correlation이 0.97로 매우 높으므로, 정말 뛰어난 스탯들이다)에서 wOBA가 근소하게나마 더 우수한 것으로 판명되었기 때문에, 타자의 공격 기여도를 측정함에 있어 wOBA를 근간으로 삼는 것은 현재로서는 최선의 방법이라고 생각된다. 또한, wOBA가 EqA보다 훨씬 계산식이 간단하고 이해하기 쉽다는 것도 큰 장점이다.

계산식 및 이론적 근거는 이전의 포스팅을 참고하시고... Park Factor를 적용한 기록을 가지고 Utley의 wOBA를 계산한 결과는 다음과 같다. (앞에 첨부한 엑셀 sheet 참조)

(Park Adjusted) wOBA = 0.382

한편, 2008년 NL 전체 타격 기록을 가지고 구한 리그 평균 wOBA는 0.330이므로, 이를 이용하여 Utley의 wRAA를 구하면 다음과 같다. (엑셀 sheet 참조)

wRAA = 32.05 Runs

즉, 2008년 시즌의 Chase Utley는 NL 평균 타자에 비해 팀 득점에 32.05점 더 기여했다는 의미가 된다.


2. wRAA를 Batting RAR로 : Replacement Level의 설정

wRAA는 Runs Above Average라는 단어의 의미에서도 알 수 있듯이 리그 평균과 비교하는 스탯이므로, 이를 Replacement Level과의 비교로 조정하여 RAR(Runs Above Replacement leve)로 만들 필요가 있다. 이전부터 한 시즌을 기준으로 리그 평균 수준의 주전 선수와 Replacement Level의 땜빵 선수 차이에는 20점 혹은 2승 정도의 차이가 난다는 경험적 분석 결과들이 있었는데, 작년 말에 THT에 게재된 Sean Smith의 뛰어난 연구는 이를 다시 한 번 확인시켜 주었다. 즉, 600 PA를 기준으로 리그 평균과 Replacement Level의 사이에는 20점(20 Runs)의 기여 수준 격차가 있다는 것이다. 이러한 격차를 wRAA 값에 더해주면, RAR로 쉽게 환산된다.

Utley의 경우로 돌아가면, Utley는 707 PA를 기록했으므로, 707 PA에서 평균과 Replacement Level의 격차를 계산해 보면...

600/20 x 707 = 23.57 Runs

이 값이 Utley의 Replacenemt Level 값이 된다.


3. 수비 기여 수준 : UZR

이전의 포스팅에서 ZR을 개선한 합리적인 스탯으로 UZR, TZ(TZR), +/-를 소개한 바 있다. 그 포스팅에서 언급한 바와 같이, +/-는 유료 정보이며 연말에 발표되고, TZ의 경우 현역 메이저리거들에 대한 데이터는 아직 작업중인 상태여서 조회가 되지 않으므로, 현재로서는 UZR이 거의 유일한 선택이라고 할 수 있다. UZR은 Fangraphs에 거의 실시간으로 계속 업데이트 되므로, 지난 시즌의 결과물 뿐 아니라 현재 진행중인 시즌에 대해서도 누구가 쉽고 빠르게 정보를 얻을 수 있다. 뿐만 아니라, TZ의 창시자인 Sean Smith조차 UZR이 가장 뛰어난 수비 스탯이라고 인정하고 있으므로, TZ나 +/- 대신 UZR을 쓰는 것이 그다지 나쁜 선택은 아닐 것 같다.

여담이지만, 2000년대 초중반에 Cardinals는 UZR의 창시자인 MGL(Mitchel Lichtman)에게 상당히 큰 돈을 주고 UZR 데이터를 독점한 바 있다. UZR이 Fangraphs에 공개될 수 있었던 것은 이러한 독점 계약이 종료되었기 때문이다. 이런 것으로 보면 Cardinals도 이전부터 세이버메트릭스에 상당한 관심과 이해가 있었던 것 같다.

다시 본론으로 돌아가서... Utley는 2루에서 20.2 Runs, 1루에서 0.4 Runs를 기록하였으므로, 이를 간단히 더해주면 된다.

UZR = 20.6 Runs

이는 Utley가 2008년 시즌에 수비를 통해 실점을 20.6점 방지하는 정도의 기여를 했음을 의미한다.


4. Positional Adjustment

이전의 포스팅에도 있지만, 다시 한 번 포지션별 조정 점수를 정리해 보면 아래와 같다.

포수 : +12.5 Runs
유격수 : +7.5 Runs
중견수, 2루수, 3루수 : +2.5 Runs
좌익수, 우익수 : -7.5 Runs
1루수 : -12.5 Runs
지명타자 : -17.5 Runs


이 조정 점수는 162게임의 풀 시즌을 기준으로 만들어진 것임에 유의해야 한다. 162게임을 이닝으로 환산하면 1,458 이닝이 되므로, 실제 수비에 참가한 이닝을 1458로 나눠서 위의 조정 점수를 곱해 주면 실제 해당 시즌의 조정 점수가 될 것이다.

Utley는 2008년에 2루에서 1395 2/3 이닝, 1루에서 14이닝을 뛰었다. 따라서...

((2.5x1392.67) + (-12.5x14)) / 1458 = 2.27 Runs

이 점수가 Utley의 수비 포지션에 따른 최종 조정 점수가 된다.


5. 주루플레이의 기여 수준: 도루 성공과 실패

이전의 포스팅에서 밝힌 바와 같이, 도루 성공은 0.175, 도루 실패는 -0.467점의 가치를 지닌다. 개인적으로 그 밖의 주루 스탯에 대해 아직 신뢰하지 않고 있는 관계로, 단지 도루 성공과 실패만을 계산할 것이다.

Utley는 2008년에 14 SB, 2 CS를 기록하였으므로...

14x0.175 - 2x0.467 = 1.52 Runs

도루를 통해 1.52점 만큼 팀 득점에 기여하였다는 결론을 얻을 수 있다.


6. RAR 및 WAR의 산출

이제 모든 구성 요소의 계산을 다 했으므로, 지금까지 나온 값을 모두 더하면 타자의 총 기여 수준, 혹은 그의 가치(Value)가 된다.

RAR = 32.05(타격) + 23.57(Replacement Level) + 20.6(수비) + 2.27(포지션 조정) + 1.52(도루)
      = 80.01


득점 10점은 1승과 동일하므로,

WAR = RAR/10 = 8.0

즉, 거칠게 표현하자면, 2008년 Chase Utley는 8승짜리 플레이어였다는 것이다.

2008년 Phillies는 92승 70패를 기록하였는데, 만약 Utley 대신 1년 내내 Tadahito Iguchi나 Eric Brunett과 같은 Replacement Level 플레이어들로 2루를 돌려막기 했다면, Phillies는 아마도 84승 78패를 기록했을 것이라는 이야기이다. 이런 성적으로는 플레이오프에 나갈 수 없었을 것이고, 따라서 월드시리즈 우승도 할 수 없었을 것이다. 이것이 바로 진정한 스타 플레이어 한 명의 위력이다.

Fangraphs의 Utley 페이지를 보면, 2008년 그의 WAR를 8.1로 계산하고 있다. Fangraphs의 로직은 이 글에서 내가 설명해 온 바와 동일하다고 보면 된다. 0.1의 오차는 타격 기여도 계산에서 생겨난 것인데, 아마도 wOBA 계산 방법이 약간 다르고, Park Factor의 적용에도 차이가 있을 것으로 추정된다. 또한, Fangraphs는 주루를 따로 표시하지 않고, 타격에 합산하여 놓고 있다.


한편, 첨부된 엑셀 파일에는 작년 AL MVP였던 Dustin Pedroia의 WAR도 계산되어 있다. 다만, 이쪽은 Fangraphs가 6.6 WAR로 계산했는데 반해 엑셀 sheet에서는 5.8이 되어서, 차이가 0.8로 제법 크게 나타나고 있다. 실제 계산된 값을 보시면 알 수 있듯이 타격 기여 수준을 빼고는 값이 완전히 동일하므로... 역시 Park Factor의 차이가 작용하고 있는 것으로 추정된다. (Fangraphs는 어떤 Park Factor를 적용하고 있는지 명시하지 않고 있다.) 또한, schedule의 차이를 고려한 플러스 점수가 있는 것 같기도 하다. AL 동부에 속해 있는 Red Sox는 아무래도 Phillies보다는 강한 팀들을 상대로 게임을 하게 되므로, 이를 보정해 주었을 가능성이 있다. 이러한 schedule에 의한 보정이 어떻게 이루어지는지 파악이 될 경우에는, 여기에 추가로 업데이트를 하고자 한다.

Posted by FreeRedbird

댓글을 달아 주세요

  1. BlogIcon 반바스틴 2009.09.16 10:01 Address Modify/Delete Reply

    저는 좌익과 1루중에 어느포지션이 더 쉬운포지션일까 고민해왔는데 세이버에서는 간단히도 1루수가 훨씬 쉬운(?)걸로 판단하는군요

    저는 좌익이 더 편하지않을까 생각이 되었는데... 좌익과 우익의 차이도 없는것도 좀 놀랍군요

    • BlogIcon FreeRedbird 2009.09.16 14:20 신고 Address Modify/Delete

      포지션에 의한 조정 점수는 통계적 연구 결과가 누적됨에 따라 조금씩 변경되어 왔으며, 현재는 위에 언급한 수치가 대세입니다. 물론 약간의 이견이 존재하여, Sean Smith 같은 경우는 위의 수치에서 포수가 +10, 1루수가 -10으로 조정되어야 한다고 주장하기도 합니다. 이렇게 되면 1루수와 좌익수의 차이가 줄어들죠. 하지만 여전히 좌익수가 1루수보다 조금 더 어려운 포지션이라고 보는 점은 변함없습니다.

      우익수와 좌익수는... 선수 개개인으로 보면 차이가 조금씩 존재합니다. 아무래도 특정 선수의 수비 범위(range)라는 것이 전후좌우가 모두 동일하지 않기 때문에, 어떤 외야수는 왼쪽으로 잘 움직이고, 어떤 외야수는 오른쪽으로 잘 움직이는 등의 차이가 존재하죠. 따라서 개개인을 놓고 보면 좌익수와 우익수 중에 좀 더 적합한 포지션이 존재합니다. 또한 3루로 뛰는 주자를 잡기 위해 강한 어깨를 가진 외야수가 우익수 자리에 선호되죠. 하지만.. 개개인이 아니라 집합적으로 놓고 보면, 좌익수와 우익수의 수비적 가치 혹은 수비 난이도는 거의 동일하다고 볼 수 있습니다.

  2. BlogIcon 박상혁 2012.07.23 11:08 신고 Address Modify/Delete Reply

    이런글을 이제서야 보게되었네요.
    WAR에 대한 궁금증이 많이 풀렸습니다.
    ^^ 감사합니다.

이 블로그에서 트레이드의 이해득실을 계산할 때나 특정 플레이어의 기여도를 비교할 때에 주로 사용한 비교 툴은 WAR(Wins Above Replacement) 였다. 그런데, 생각해보면 세이버메트릭스의 개념에 대해서 자세히 설명한 것은 FIP와 BABIP 정도밖에 없었던 것 같다. 이래가지고서야 WAR를 가지고 아무리 이야기해봤자 결국 잘난척에 불과하지 않을까...라는 생각이 들었다.

그래서 WAR의 개념과 계산 방법을 설명하기로 결심했지만... 문제는 도대체 어디까지 거슬러 올라가야 하는가였다. 이 블로그를 방문하시는 분들께서 스탯에 대해 얼만큼의 지식을 가지고 있는지 알 수도 없고... 결국 이런저런 고민 끝에, OPS와 그 변종들로부터 출발하기로 했다. 나는 Fangraphs와 같이 wRAA를 WAR 계산시 공격력의 척도로 삼고 있으므로, 이 글에서는 wRAA의 계산 방법까지 다뤄 보고자 한다.


요즘도 야구 중계를 보면 사실 타자에 대해 주로 언급되는 스탯은 타율(AVG), 홈런(HR), 타점(RBI)이 고작이다. 우리나라 중계는 물론이거니와 메이저리그 중계라고 해서 크게 다르지는 않은 것 같다. 그나마 OPS가 널리 퍼진 덕에, 출루율(OBP)과 장타율(SLG) 정도를 덤으로 들을 수 있는 정도이다.

타율이나 타점과 같은 석기시대의 스탯들로 타자를 평가하면 문제가 많다는 이유에 대해서는 자세한 설명을 생략하고자 한다. 이전의 FIP나 BABIP에 대한 글 뿐 아니라, 기회가 있을 때마다 같은 말을 반복해왔기 때문이다. 타율은 타자 본인의 능력과 상관없는 많은 요소들, 이를테면 상대팀의 수비 능력과 같은 외부 요인들이 많은 영향을 끼치므로, 타자의 능력을 평가하는 잣대로 쓰기에는 불완전한 부분이 많다는 정도로만 정리하고 넘어 가겠다. 타점은 팀 동료들이 해당 타자 앞에서 얼마나 출루를 해 주느냐에 더욱 크게 좌우되므로, 개인 스탯이라기보다는 팀 스탯에 가까운 숫자라고 할 수 있다. 타자의 생산성을 평가하는 지표로는 역시 낙제점을 면키 어렵다.


1. OPS

세이버메트릭스 최초의 히트작이라고도 할 수 있는 OPS 부터 살펴보자.

OPS는 On base percentage(OBP, 출루율) Plus Slugging percentage(SLG, 장타율)의 약어이다. 따라서 OBP와 SLG만 구할 수 있다면 쉽계 계산된다. 이 둘을 구하는 식은 아래와 같다.

OBP = (H + BB + HBP) / (AB + BB + SF + HBP)
SLG = TB / AB = (1B + 2*2B + 3*3B + 4*HR) / AB


이 둘을 그대로 더한 것이 OPS이다. 즉,

OPS = OBP + SLG

이렇게 된다. OPS가 히트하게 된 데에는 타자의 출루 능력과 장타력을 골고루 평가한다는 내용상의 우수함 뿐 아니라, 계산식이 단순하여 누구나 쉽게 이해하고 계산할 수 있다는 장점도 크게 작용하였다. 이후 보다 정밀한 스탯이 무수히 많이 개발되었지만, 한 눈에 타자의 생산성을 훑어보는 데에는 여전히 요긴하게 쓰이고 있다.


2. OPS+

이후 구장마다 타자에게 유리한 구장이 있고 불리한 구장이 있다는 것을 감안하여, 조정 OPS(OPS+, Adjusted OPS)가 등장하게 된다. OPS+는 구장 효과(Park Factor)를 반영할 뿐 아니라, 100을 평균으로 하여 스케일도 조정되기 때문에, 특정 시즌에 특정 타자가 리그 평균에 비해 얼마나 좋은 활약을 펼쳤는지 알 수 있다. (100보다 큰 숫자는 리그 평균보다 좋은 활약을 했음을 의미하며, 100보다 작으면 그 반대이다. 또한 100에서 멀어질수록 평균과의 차이가 크다.)

계산식은 다음과 같다.

OPS+ = 100 * ((OBP/lgOBP + SLG/lgSLG) - 1)

혹은 구장 효과를 적용하였음을 나타내기 위해 아래와 같이 표현하기도 한다.

OPS+ = 100 * ((OBP/lgOBP + SLG/lgSLG) - 1) / BPF

여기서 BPF는 타자의 Park Factor를 의미한다.


이렇게 되면 꽤 많이 발전한 것 같지만... OPS의 개념 자체에 대한 비판이 이어졌다. OPS이든 OPS+이든 기본적으로 가중치 없이 OBP와 SLG를 더해서 만들어지는 식이라는 점에서는 동일하다. 즉 출루율과 장타율을 동일한 가치로 취급하고 있는 것이다.

이러한 접근에 문제가 있음은 쉽게 알 수 있는데... 리그 평균 OBP와 리그 평균 SLG가 거의 1할 가까이 차이가 나는 데다가, 그 분포도 다른 것이다. 세이버메트리션들은 여기서 좀 더 나아가서, 득점과의 상관 관계를 통계적으로 구해 보았다. (타자가 타격을 하는 목적은 결국 팀이 득점하는 것이며, 그 외의 것은 모두 부수적인 것일 뿐이라는 사실을 기억할 필요가 있다.) 그 결과, 어떤 연구에서도 출루율과 득점과의 상관 관계(correlation)가 장타율과 득점과의 상관 관계보다 높게 나왔다. 이는 OPS와 같은 스탯을 계산할 때 출루율에 대해 얼마간의 가중치를 부여해야 한다는 의미가 된다.


3. GPA

이에 따라, GPA(Gross Production Average)가 발명되었다. 이 스탯은 출루율에 1.8의 가중치를 부여한 것이다.

GPA = (1.8*OBP + SLG) / 4

물론 이 식을 그대로 쓰지 않고 Park Factor를 적용, 조정하여 사용한다. 4로 나누는 이유는 AVG와 비슷한 정도의 scale을 얻도록 하기 위해서이다. 마치 타율과 비슷하게, GPA가 2할대 초반이 나오면 형편없는 타자이고, 3할이 나오면 아주 뛰어난 공격력을 지닌 타자라고 볼 수 있는 것이다.

GPA는 OPS보다 실제 득점과의 상관관계가 더 높으면서도 여전히 계산하기가 쉽다는 장점을 가지고 있다. GPA를 Runs, 즉 점수를 내는 데 기여한 수준으로 변환하는 공식들도 개발되어 있는데, 대표적인 것은 PA*1.356*(GPA^1.77) 이다.

여담이지만, "Moneyball"에서 Paul DePodesta는 OBP가 SLG보다 3배나 중요한 스탯이라고 주장한 바 있다. OBP가 중요하긴 하지만 그정도로 극단적인 OBP 우선주의는 좀 문제가 있다. DePodesta가 LA Dodgers에서 실패한 데에는 다 이유가 있는 것 같다...


4. RC, RC/27

이번에는 세이버 진영에서 내놓은 좀 더 복잡한 스탯들을 알아보자.

Bill James의 유명한 발명품들 중 하나인 RC(Runs Created)는 일단 아래와 같은 기본 형태를 가진다. (사실 이 스탯은 위의 GPA보다 훨씬 더 오래된 것이다.)

RC = (A*B) / C

A는 출루율을 반영한 어떤 값(On Base Factor)이며, B는 앞서 출루한 주자를 진루시키는 능력을 반영한 어떤 값(Advancement Factor)이다. C는 타자가 출루 내지는 진루를 시킬 수 있는 기회(Opportunity Factor)를 의미한다.

Bill James가 처음 RC를 고안한 이래로, 이 공식은 무려 14차례나 변형되어 왔다. 이를테면... 가장 기본적인 형태의 공식은 다음과 같다.

RC = ((H + BB) * TB) / (AB + BB)
      = OBP * SLG * AB


보다 널리 쓰이는 개량 버전 중 하나는 아래와 같다.

RC = ((H + BB - CS + HBP - GIDP) * (TB + 0.26 * (BB - IBB + HBP)) + (0.52 * SH + SF + SB)) / (AB + BB + HBP + SH + SF)

어이없다는 생각이 들 지도 모르겠으나... 이건 그나마 2002년 버전에 비하면 쉬운 공식이다. 필요한 숫자들이 많긴 하지만 모두 쉽게 얻을 수 있는 기본적인 스탯들이기 때문이다.

2002년 버전은 Wikipedia를 그냥 링크하도록 하겠다. 일일이 적자니 너무 길다... -_-;;;
클릭

링크에서... 위에 소개한 버전들을 쭉 지나면 2002 version이라는 것이 나온다. 읽을 수록 한숨만 나올 것이다. 통계적인 수치와 계산식을 통한 예측치를 일치시키려는 노력이 이렇게 계속되고 있지만... 그러면 그럴수록 식은 복잡해지고... 일반 팬들이 집에서 계산하기에는 무리가 많이 따르는 식이 되어 버리고 만다. 이 식을 바탕으로 한 득점 예상치의 오차가 5% 이내일 만큼 많이 정밀해진 것도 사실이지만... 그러면 그럴수록 오히려 활용하기는 더욱 어려워지고 있다.


[주: RC/27의 설명이 필요한 듯 하여 아래 paragraph를 나중에 추가하였다. 09/11/18]

한편, 공격력 측정 지표로 빈번히 이용되는 RC/27은 무엇일까?

RC/27은 단순히 RC를 27로 나눈 값이 아님에 유의하시길...!!!

RC/27 = 27 * RC / (AB - H + CS + GIDP + SH + SF)

계산하는 사람의 이론적인 이해 또는 입장에 따라 SH와 SF를 넣기도 하고 빼기도 한다. 개인적으로는 "SF는 넣고 SH는 제외해야 하지 않을까" 라는 생각을 하고 있다.

RC 대신 RC/27을 쓰는 이유는... RC가 누적 스탯이기 때문에, 절대적인 출장 기회가 많을수록 유리하기 때문이다. 예를 들어 어떤 플레이어가 부상으로 인해 시즌의 반 밖에 소화하지 못했다면, 그를 RC로 평가하는 것은 정당하지 못하다. RC/27의 개념은, 해당 타자 아홉 명으로 1번부터 9번까지 타순을 짠 다음, 9회까지 27아웃을 뛰는 동안 그 팀이 몇 점이나 득점할 수 있을지의 예상치를 산출하는 것이다. 따라서, 타석 수에 상관없이 절대적인 비교가 가능하다.

RC는 Bill James와 그의 동료들에 의해, 지금도 계속해서 개량 중인 스탯이다. "(출루능력 * 진루능력) / 기회"라는 이론적 기반 위에서, 실제 메이저리그 게임에서 통계적으로 관측되는 결과에 맞추기 위해 계속 식을 변형해 가는 것이다. Tom Tango는 이 이론적 기반 자체에 대해 의문을 제기한 바 있으며, 또한 RC가 홈런의 가치를 정확히 반영하지 못하고 있음을 보여주었다. Tom Tango의 비판에 대해서는 그의 홈페이지를 참고.

이러한 약점에도 불구하고, RC 특히 RC/27은 오랜 기간동안 타자의 공격력을 측정하는 지표로 매우 널리 이용되었다. 적어도 아래의 EqA나 wOBA가 나오기 전까지는 말이다.

5. EqA

이번에는 Baseball Prospectus의 야심작인 EqA를 살펴보자.

EqA는 Equivalent Average의 약자이다.
단어의 의미에서 알 수 있듯이, 역시 친숙한 AVG와 비슷한 숫자를 얻을 수 있도록 scale 조정을 한 스탯이다. 게다가 Equivalent는 리그에 대한 조정도 가능함을 의미한다. 즉 AA 레벨인 Texas League에서 뛰고 있는 어떤 유망주가 있을 때, 그의 활약 정도를 메이저리그로 옮겨 보면 어느 정도가 되는지 등의 분석이 가능하게 되는 것이다.

꽤 파워풀한 스탯 같지만... 역시 이런 스탯을 만들기 위해서는 엄청난 작업이 필요하다.

일단 아무 조정도 되지 않은 Raw EqA를 구해보면,

RawEqA = (H + TB + 1.5 * (BB + HBP + SB) + SH + SF - IBB/2) / ( AB + BB + HBP + SH + SF + CS + SB)

벌써 질렸는가? 이것은 단지 시작일 뿐이다.
이제부터 10번 이상의 변환을 거쳐야 한다. 하나하나가 결코 만만한 작업이 아니다.
이걸 일일이 설명하다가는 밤을 새야 할 것 같으므로, 그냥 Baseball Prospectus 사이트의 링크를 걸도록 하겠다.
클릭

이건 Runs Created 2002 버전보다도 몇 배나 어이없는 공식이다. RC의 경우는 엑셀을 이용하면 그럭저럭 노가다로 구할 수는 있지만... EqA는 솔직히 엄두조차 나질 않는다. 기껏해야 링크된 글을 몇 번 읽어보고 각각의 변환이 갖는 의미를 이해하는 정도가 고작이다.

주루플레이까지 포함하고 있고, 정교한 계산을 통하여 조정 작업을 거치게 되어 있으므로, 꽤 잘 만든 스탯인 것은 사실이지만 역시 일반 팬들이 활용하기는 너무 무리한 스탯이다.


이 밖에도 여러 OPS 대체 스탯이 만들어졌으나 일단 이 정도만 소개하고 넘어가고자 한다.


6. wOBA, wRAA

사실 진짜 소개하고 싶은 스탯은 바로 이 wOBAwRAA이다.

wOBA는 weighted On Base Average의 약자로, Tom Tango 외 2인이 쓴 책인 "The Book"에 잘 소개되어 있다. 앞으로 기회가 있을 때마다 이 책의 내용을 많이 소개할 예정인데... 2007년에 출판된 책으로, 세이버메트릭스의 새로운 교과서라고 해도 과언이 아닐 만큼 알찬 내용으로 잘 쓰여진 책이다.

세이버메트리션들은 이미 타자가 타석에 들어서서 발생한 어떤 "사건(Event)"이 득점에 미치는 영향을 오랜 기간에 걸쳐 조사해 왔다. 예를 하나 들어보자.

1999년부터 2002년간의 모든 메이저리그 게임을 이닝별, 상황별로 분석한 결과... 2사 만루 상황에서의 득점 기대값(Run Expectancy)은 0.815였다. 즉 이런 상황을 1000번쯤 맞게 된다면 815점 정도 득점할 확률이라는 것이다. 그런데... 타자가 여기서 만루홈런을 쳤다고 하자. 팀은 4점을 득점하고, 상황은 2사 주자 없음으로 바뀐다. 2사 주자 없음에서의 득점 기대값은 0.117로 나타나고 있다. 그렇다면, 앞의 만루홈런의 득점 가치(Run Value)를 구해 보자.

이 홈런으로 인해 득점 기대값은 0.815에서 0.117로 떨어졌다. 하지만 그 사이에 홈런으로 인해 팀은 4점을 득점하였으므로, 실제로는 0.117이 아니라 4.117이 된 셈이다. 따라서, 아래와 같이 식을 세울 수 있을 것이다.

0.815 + 만루홈런의 Run Value = 4.117

따라서, 2사 만루에서 홈런의 가치는 득점으로 환산하면 3.302 Runs가 됨을 알 수 있다.

이런 계산을 각 사건에 대하여 아웃카운트와 주자를 변화시켜 가며 모든 상황에 대해 해 보는 것이다. 이렇게 해서 사건별로 가중평균을 얻은 값은 아래와 같다.

홈런 : 1.397 Runs
3루타 : 1.070
2루타 : 0.776
1루타 : 0.475
에러 : 0.508
몸에 맞는 공 : 0.352
볼넷(고의사구제외) : 0.323
고의사구 : 0.179
폭투 : 0.266
아웃 : -0.299
(이하 생략 : 그 밖의 상황에 대한 데이터는 책을 참조하시기 바람... -_-;;; )

그렇다면 타자의 생산성을 어떻게 평가할 수 있을까? 홈런이나 안타 등이 가지는 가치는 아웃에 대비하여 구해야 할 것이다. "아무 것도 아닌 경우"란 존재하지 않기 때문이다. 타자는 아웃 당하거나, 아니면 어떤 방법으로든 살아서 나갈 것이다. 안타가 되었든, 에러가 되었든 간에 말이다. 따라서... 아웃으로 인한 가치의 손실을 빼 주면 해당 이벤트의 진정한 가치가 된다고 말할 수 있겠다. 예를 들면...

홈런 : 1.397 + 0.299 = 1.698

이런 식으로 구하는 것이다.

그 다음, 결과값을 OBP와 비슷한 scale로 나타내기 위해서, 각각의 value에 다시 1.15를 곱해 준다. 홈런의 경우는 1.698 * 1.15 = 1.95가 된다.

위에서 본 다른 스탯들은 주로 타율(AVG)과 비슷한 scale로 나타내기 위해서 조정을 했는데, wOBA의 경우는 출루율과 비슷한 scale로 조정을 해 주고 있다. 이렇게 조정해 주는 이유는 간단하다. 타자의 생산성을 한 눈에 알게 하기 위해서이다. .400의 출루율이 아주 좋은 것처럼, .400의 wOBA도 아주 좋은 것이다. .335 정도의 출루율이 리그 보통인 것처럼, .335 정도의 wOBA도 리그 보통이라고 생각하면 되는 것이다. 편리하지 않은가??

어쨌거나... 각 이벤트에 발생 횟수에 각각의 value를 곱하고, 여기에 다시 1.15를 곱하여 모두 더한다. 이를 PA(타석)로 나눠주면 그 타자가 한 번 타석에 들어설 때 팀의 득점 기대값(Run Expectancy) 상승에 얼마나 기여하는지를 알 수 있게 되는 것이다. 이것이 바로 wOBA이다. 식으로 나타내면 아래와 같다.

wOBA = (0.72*NIBB + 0.75*HBP + 0.90*1B + 0.92*RBOE + 1.24*2B + 1.56*3B + 1.95*HR) / PA

여기서 NIBB는 고의사구를 제외한 볼넷을 의미하며, RBOE는 Reached Base on Error, 즉 에러로 인해 타자가 출루에 성공하는 것을 의미한다. 타자의 능력과는 전혀 상관이 없는 폭투와 같은 이벤트는 아예 제외되어 있음에 유의하자.  (** 이 식은 이 글을 쓴 뒤에 약간 수정을 하게 되었다. 글 맨 마지막 부분 참고.)


이제 다음 단계는 그 타자가 실제로 메이저리그 평균보다 얼마나 뛰어난지를 점수로 계량하는 것이다. wRAA는 weighted Runs Above Average의 약자로, 단어 그대로의 의미를 지닌다. 즉 평균 타자에 비해 얼마나 득점에 기여하느냐를 점수(Runs)로 나타내는 것이다.

일단 리그 평균 wOBA를 구한다. 위의 모든 변수(홈런 등)에 리그 평균 값을 대입하면 된다. 그 다음, 해당 타자의 wOBA에서 리그 평균 wOBA를 빼 준다. 그리고 1.15로 나눠준다. (아까 OBP와 유사한 scale을 얻기 위해 1.15를 인위적으로 곱했으므로, 다시 나눠줘야 한다.) 마지막으로 해당 타자의 PA(타석)를 곱해주면, 그 타자가 해당 시즌에서 메이저리그 평균 타자에 비해 팀 득점에 기여한 정도가 점수로 나타나게 된다. 이를 식으로 나타내면...

wRAA = ((wOBA - lgwOBA) / 1.15) * PA

예를 들어서... Ryan Ludwick이 작년에 타석에서 어느 정도로 훌륭한 활약을 했었는지 계산을 해 보자.

2008년 NL의 리그 평균 wOBA는 대략 .331이었다. 한편, 2008년 Ryan Ludwick의 wOBA는 .406이었으며, 그는 617번 타석에 들어섰다. 이제 그의 wRAA를 계산해 보면...

wRAA = ((0.406 - 0.331) / 1.15) * 617 = 40.24

즉 Ryan Ludwick은 평균적인 NL 타자들에 비해 2008 시즌 팀 득점에 타격을 통해 40.24점 정도 더 많이 기여했다는 뜻이 된다. (참고 : Fangraphs에서는 그의 wRAA가 39.5로 나타나고 있다. 아마도 리그 평균 wOBA를 구하는 과정에서의 오차로 인한 차이가 아닐까 생각된다.)


다른 스탯에 비해 wOBA가 가지는 매력은 분명하다. 우선 실제 메이저리그에서 발생했던 사건들의 기대값을 구하여 계산한 결과이므로... 계산한 이론치와 실제 발생하는 득점 사이의 상관 관계가 우수하게 나타난다. 그리고 OPS만큼은 아니더라도, 다른 세이버 스탯들에 비하면 계산이 무척 쉬운 편이다. 마지막으로, wRAA로의 환산이 아주 편리하여, 해당 플레이어가 타석에서 점수로 몇 점 만큼 팀에 기여해 주었는지를 아주 쉽고 빠르게 계산할 수가 있다. 이것은 특히 여러 플레이어를 비교할 때에 그 진가를 발휘한다.

다만 약간 아쉬운 부분이라면, wOBA는 타석에서 타자에게 벌어지는 이벤트만을 반영하므로, 도루와 같은 주루플레이가 제외되어 있다. 이 부분은 앞으로 보완이 필요하다고 본다.



나름 쉽게 설명해 보려고 애써 보았는데 잘 된 것인지 모르겠다. 다음 번 세이버메트릭스 포스팅에서는 Replacement Level과 Positional Adjustment에 대해 다루고자 한다. 거기까지 다루고 나면 타자들의 WAR에 대해서도 설명이 가능할 것 같다.



** 추가 수정 사항

이 글을 쓴 이후, WAR를 계산하기 위해 직접 wOBA를 산출하던 중, 여러 타자들의 wOBA를 계산한 결과 모두 Fangraphs나 Stat Corner 등의 사이트에 비해 계산 결과가 다소 낮게 나오는 문제점을 발견하였다. 원인이 무엇일까 고민하던 중... wOBA를 창안한 Tom Tango의 글에서 다음과 같은 부분을 발견했다.

Note: Depending on the specific analysis, the PA term (plate appearances) may exclude bunts, IBB, and a few of the more obscure plays.

빙고!
wOBA 계산시 분모에서도 IBB(고의사구)를 제외하면 되는 것이다. 논리적으로 생각해도 분자에서 NIBB, 즉 고의가 아닌 보통 볼넷만을 계산 대상으로 하였으므로, 분모에서도 NIBB만을 계산에 넣는 것이 타당하다고 본다. 따라서, 수정된 식은 아래와 같다.

wOBA = (0.72*NIBB + 0.75*HBP + 0.90*1B + 0.92*RBOE + 1.24*2B + 1.56*3B + 1.95*HR) / (PA - IBB)

이렇게 계산하면 Fangraphs 사이트에 올라와 있는 결과들과 상당히 유사한 값을 얻을 수 있다. 물론 위의 인용문에서도 알 수 있듯이 각자의 논리에 따라 계산식이 조금씩 달라지므로, 소수점 세째 자리에서 나타나는 약간의 오차는 어쩔 수 없는 것일지도 모른다. Fangraphs나 Stat Corner 모두, 자신들이 어떤 특정 스탯을 더하고 뺐는지 상세히 밝히지 않고 있다. Tom Tango의 오리지널 계산식과는 값이 다르게 나오는 것으로 보아 뭔가 변화를 줬음은 확실한데 말이다...
Posted by FreeRedbird

댓글을 달아 주세요

  1. camomile 2009.10.27 14:53 Address Modify/Delete Reply

    흥미로운 스탯이군요. 그런데 RBOE가 나와있는 사이트는 어디인가요?

    • BlogIcon FreeRedbird 2009.10.27 16:17 신고 Address Modify/Delete

      2008년까지의 데이터는 Retrosheet에서 찾아보실 수 있습니다.

      http://www.retrosheet.org/boxesetc/P/Ppujoa001.htm

      이것은 Pujols의 스탯인데요. ROE 라고 적혀 있는 것이 바로 RBOE 입니다.

      Retrosheet의 선수별 데이터는 실시간 업데이트가 안되고 연간 단위로만 업데이트된다는 문제가 있는데요.. 실시간으로 RBOE를 표시해 주는 사이트는 저도 찾지 못했습니다.

    • BlogIcon FreeRedbird 2009.11.21 19:30 신고 Address Modify/Delete

      좀 더 뒤져보니 Baseball-Reference에서 RBOE를 발견할 수 있었습니다.

      http://www.baseball-reference.com/players/b/beltrad01-bat.shtml

      위 링크는 Beltre의 스탯인데요... 쭉 내려가시면 "Baserunning & Misc."라는 항목에서 "ROE"를 발견할 수 있습니다.

  2. camomile 2009.11.21 15:08 Address Modify/Delete Reply

    wRAA라는 스탯에 대해서 살펴보다가 느낀건데요. 시대적 조정이 전혀 되어있지 않은데다 포지션별 조정도 안되어있는 스탯이더라구요. 물론 WAR을 구할 때 포지션조정을 한다지만 VORP나 RARP처럼 애초에 타격스탯 산출부터 포지션을 고려해서 산출하는 것이 더 맞지 않나 싶네요. 이에 대해서 어떻게 생각하시는지 궁금합니다.

    • BlogIcon FreeRedbird 2009.11.21 19:37 신고 Address Modify/Delete

      wOBA나 wRAA는 순수하게 공격력만을 보기 위한 스탯이므로 선수의 포지션과는 그다지 상관이 없습니다. wRAA가 +15라는 것은 해당 포지션의 평균 타자의 공격력 수준보다 15점 높은 것이 아니라 "메이저리그 전체 평균 타자"보다 15점 높은 것이죠. 스탯의 원래 개념상 포지션 조정은 안하는 쪽이 맞다고 생각합니다. WAR계산시 수비력을 합치게 되므로, 이 단계에 가서 포지션 조정을 해 주는 것이 더 합리적이지요.

      wRAA는 시대 조정도 안 하는 쪽이 맞습니다. 왜냐하면... wRAA가 해당 시즌의 리그 평균을 기준으로 하기 때문입니다. 리그 평균은 매 해마다 달라지므로... 일정하게 표시할 수 없는 것이죠. 다른 연도를 비교하시려면 아쉬운대로 wOBA+를 이용하실 수 있겠습니다. Stat Corner(statcorner.com)에서 wOBA+를 제공합니다.

  3. camomile 2009.11.22 00:48 Address Modify/Delete Reply

    근데 매년 포지션의 리그 평균이나 Replacement Level이 변하는데 Fangraph의 방식처럼 wRAA에 UZR을 더해서 일률적으로 포지션에 대해 점수를 더하거나 빼는 것 보다는 BP의 WARP처럼 타격,수비스탯 산출시 각해의 Replacement Level과 비교해서 산출한다음 더하는 것이 보다 합리적인 것 아닌가요? 그리고 어차피 선수의 가치는 포지션대비 성적으로 봐야하는데, wRAA나 wOBA가 얼마만큼 의미가 있는지가 관건이네요. 또한 단순 타격능력만 본다고 하더라도 과연 주루능력이 전혀 반영되지 않는 wOBA, wRAA이 EqA, EqR보다 선수의 능력을 잘 보여줄 수 있을지도 의문이구요. EqA,EqR은 시대별조정된 스탯조차 쉽게 찾아볼 수 있죠.

    • BlogIcon FreeRedbird 2009.11.22 22:48 신고 Address Modify/Delete

      이거 굉장히 많은 내용의 질문이신데요... ^^ 이 내용은 원래 별도의 긴 포스팅을 염두에 두고 있었는데.. 답변으로 먼저 쓰게 되네요. 밑천 다 드러나겠습니다. ㅎㅎ 아마도 무척 긴 답글이 될 것 같습니다.

      우선... wRAA의 Average는 매년 변하는 해당 시즌의 평균에 대한 상대적인 값입니다. UZR의 기준값(리그 평균수비는 UZR=0 입니다.)도 매년 변한다고 봐야겠죠. 작년의 0과 올해의 0은 동일하지 않은 것입니다. BP에서 매년 변하는 Replacement Level을 기준으로 한 상대적인 값을 산출하고 있다고 하면, 방법론적으로는 별 차이가 없다고 봅니다. 저는 BP가 특별히 더 합리적이라고 생각되지는 않네요.

      다음, wRAA나 wOBA는 선수의 가치를 측정하는 스탯이 아닙니다. 공격력을 측정하는 스탯이죠. 포지션과 상관이 없습니다. 포지션을 고려한 종합적인 가치를 비교하시려면 wRAA가 아니라 WAR를 이용하셔야 합니다. BP로 따지면 EqA 단독으로 선수의 가치를 측정할 수 없으며, WARP를 이용해야 하는 것과 마찬가지입니다. WAR계산시 중복 계산을 피하기 위해 조정은 한 곳에서만 해 주는 것이 맞고요, 그 한 곳으로 가장 적절한 곳은 역시 수비 스탯을 더해줄 때라고 봅니다. 포지션이 다르다고 타석에서 다른 규칙을 적용받지는 않으니까요... 하지만 수비는 분명히 포지션에 따라 다르죠. wRAA의 의미와 선수의 포지션대비 가치는 그다지 상관이 없습니다.

      wOBA는 주루능력을 반영하지 않습니다. 애초에 컨셉이 다르기 때문이죠. EqA는 BP에서 공격력의 올인원 스탯을 만들기 위해 발명한 스탯입니다. 이거 하나로 타자의 타격과 주루를 한 번에 평가하고자 시도한 거죠. 반면 wOBA는 계산식에서 알 수 있듯이 타자가 타석에 들어섰을 때 벌어지는 이벤트에 대해서만 계산을 하는 것입니다. wOBA는 단순히 타격 능력을 보여줄 뿐입니다. 님께서 EqA를 선호하신다면 EqA를 쓰시면 됩니다. 저는 타격은 wOBA 및 wRAA를 쓰고 주루는 BP의 EqBRR을 참고하는 쪽을 더 선호합니다. 분리해서 보는 쪽이 더 정확히 볼 수 있다고 생각하기도 하고... 스탯으로서 wOBA의 접근 방식이 EqA에 비해 훨씬 sound하다고 보기 때문입니다. 이런 것은 관점의 차이라고 생각합니다. 세이버메트릭스에 단 하나의 정답은 없다고 봅니다.

      wOBA와 EqA의 대결을 다룬 연구는 여러 차례 시도되었고... 여기에서 wOBA가 진 적은 없었던 걸로 기억합니다. 아래의 최근 연구를 확인하세요. 둘 다 correlation이 0.97로 매우 우수한 스탯입니다만... 현대 야구에 대해서는 근소한 차이로 wOBA가 이기고 있습니다.

      http://www.hardballtimes.com/main/content/blog_article/is-eqa-better-than-woba

      제가 EqA를 좋아하지 않는 이유는 EqA의 계산이 지나치게 복잡하다는 점 이외에도... EqA 자체가 결함을 안고 있기 때문입니다. 약간 technical한 이야기가 되겠는데요... EqA는 개념적으로 Average 즉 타율과 비슷한 Scale을 갖도록 숫자를 맞춘 것입니다만, 투수와 같이 타격능력이 형편없는 경우 마이너스 값을 가지게 됩니다. 마이너스 타율은 있을 수 없는 일이지만, 그와 같은 Scale을 갖는다는 EqA에서는 마이너스가 나옵니다. 즉 너무 낮은 쪽으로 내려가게 되면 EqA의 계산식은 무너집니다. wOBA에서는 이런 일이 일어나지 않습니다. 또한, EqA가 타율과 비슷한 Scale을 갖기 위해서 온갖 보정과 추가계산을 하는 과정에서, 스탯으로서 갖는 자체적인 Scale이 붕괴합니다. .400 EqA는 .200 EqA에 비해 동일한 아웃 수 대비 득점 기여 수준이 2배가 되지 않습니다.
      이 논의에 대해서는 아래 링크를 참고하세요.
      http://www.insidethebook.com/ee/index.php/site/comments/why_is_eqa_so_complicated/

      저는 EqA가 갖는 "올인원 스탯"으로서의 매력을 인정합니다. 게다가 실제 득점과의 상관관계도 매우 우수하게 나옵니다. (correlation 값이 0.97이면 거의 더 바랄 게 없는 수준이죠) 다만 이렇게 복잡한 변형 과정을 거쳐서 결국은 Scale Distortion으로 귀결되는 것이 맘에 들지 않을 뿐입니다. 훨씬 간단하여 누구나 계산할 수 있으면서도 정확도 면에서 전혀 뒤떨어지지 않는 wOBA라는 좋은 대안이 있으니까요. wOBA가 주루를 고려하지 않는데도 이미 EqA와 동일한 수준의 correlation을 갖는다면... wOBA에 EqBRR을 참고하여 주루 부분을 보완하는 정도로도 EqA보다 충분히 더 정확한 결과를 얻을 수 있을 것입니다.

      마지막으로... WARP는 BP의 여러 스탯 중에서도 결함이 좀 많은 스탯입니다. 하나하나를 댓글에 쓰기는 너무 긴데요... 일단 같은 BP의 스탯임에도 불구하고... VORP와 WARP의 Replacement Level은 서로 다릅니다. WARP의 Replacement Level이 너무 낮게 설정되어 있는 것이죠. Keith Woolner나 Tom Tango 등 다른 사람들이 계산하는 Replacement Level 선수들로 이루어진 팀은 대략 .300이나 그 이상의 승률을 가집니다. (162게임에서 49승 정도) 하지만, Clay Davenport가 WARP를 계산할 때 사용하는 Replacement Level 선수들로 구성된 팀의 예상 승률은 .150 정도입니다. 대략 162게임 시즌에서 24승 정도밖에 못하는 쓰레기 팀이죠. Davenport가 설정하는 Replacement Level 선수는 솔직히 메이저리그는 커녕 웬만한 AAA 선수만도 못한 선수로, 메이저리그의 25번째 로스터 자리를 차지할 가능성이 0%에 가까운 커리어 마이너리거 입니다. 이런 선수를 Replacement Level로 잡아서 계산하면 계산이 맞을 수가 없습니다. 또한 투수의 경우 Pythagorean Expectation의 승수를 2로 잡아서 계산하여 계산이 안맞는 문제가 있고요... WARP 계산시 수비력의 척도로 사용되는 FRAR 혹은 FRAA는 PbP데이터가 아니라 PutOut, Error, 병살 등을 가지고 계산하는 관계로... 여러 세이버메트릭스 커뮤니티들에서 믿을 수 없는 스탯으로 이미 공인되어 있습니다. (다시 말하면 FRAR은 그냥 좀 더 잘 계산한 Range Factor라는 이야기 입니다.) 즉.. WARP는 BP가 군데군데 가지고 있는 이런저런 문제점을 한 곳에다 합쳐놓은... 신뢰도가 상당히 의심스러운 스탯이라고 볼 수 있습니다. EqA의 경우는 "공격 올인원 스탯"이라는 확실한 장점이 있습니다만, WARP의 경우는 결함투성이여서 도무지 좋은 점이 무엇인지 모르겠습니다.

  4. camomile 2009.11.23 14:04 Address Modify/Delete Reply

    허접한 질문에 장문의 답글 정말 감사드립니다.^^

    우선 wRAA는 변화하는 리그평균값에 대한 상대적 값이 맞습니다. 하지만, 제가 문제삼는 것은 전체 리그평균이 아니라 포지션 리그평균 혹은 Replacement Level이 매년 변화한다는 것입니다. 전체 리그평균이 불변이라도, 포지션 리그평균은 매년 바뀔수 있지 않습니까? 즉, 작년과 올해의 리그평균 wOBA가 .320으로 동일하다하더라도, 작년 포수 리그평균wOBA가 .290이고 올해 포수 리그평균wOBA가 .320이라면, 작년에 wOBA .380을 친 포수와 올해 wOBA .380을 친 선수의 공격력을 과연 동일하게 볼 수 있느냐는 것이죠. 결국 wOBA와 wRAA가 WAR을 산출하기 위한 공격력 스탯이라는 것을 놓고 본다면, wRAA로 공격력을 산출하고 추후에 상수를 더하거나 빼서 포지션 조정을 하는 것보다 BP처럼 RARP나 VORP로 공격력을 산출하는 것이 더 합리적이지 않나 싶어서 질문을 드린 것입니다.

    두번째로 의문이 드는 것은 과연 WARP와 VORP의 Replacement Level이 얼마나 차이가 나는가입니다. 올해 시대별조정을 거치지 않은 Albert Pujols의 VORP는 98.3, WARP의 산정에 기초가 되는 RARP는 93.2입니다. Joe Mauer의 VORP는 91.0이고 RARP는 77.7이군요. RARP의 Replacement Level이 VORP의 Replacement Level보다 낮다면, 두명의 RARP가 VORP보다 높게 나와야 하는데, 오히려 낮게 나오고 있죠. 지금은 BP의 Replacement Level이 약간 바뀐게 아닐까요?(저도 잘은 모르겠군요^^ 포지션별 리그평균 EqR을 구해서 RARP를 직접 도출하자니 엄두가 안나서ㅎㅎ 타자의 VORP는 정확한 산출방법을 잘 모르겠구요)

    세번째, Fielding Runs같은 경우 물론 결함이 엄청난 수비 스탯입니다만, 적어도 저희가 직접 구할 수 있는 스탯이라는데서 의미를 찾고 싶습니다. UZR이나 RZR같은 스탯이 물론 더 좋겠지만, 2002년 이전의 자료를 볼 수 없으며 포수의 수비에 대한 자료 역시 찾을 수 없고, 단순히 숫자 집어넣어서 나오는 스탯이 아닌데다가 시대별 조정도 안되어있다는 점에서 역시 한계가 있다고 생각합니다. 물론, 저역시도 UZR이나 RZR이 더 우월한 필딩 스탯이라는 점을 인정하며, 사실상 선수의 종합적 가치를 평가할 때 자료만 모두 구할 수 있다면 조정된RARP+조정된UZR(이제 시대조정뿐만 아니라 포지션난이도 조정도 해야겠지요)이 더 타당하다고 봅니다. 시대가 다른 선수들의 비교시, UZR과 wRAA로는 한계가 있죠. 작년 푸홀스가 WAR 8.9이고, 올해 푸홀스가 WAR 8.4라고 해도, 올해 푸홀스가 작년 푸홀스에 비해 못하다고 할 수 없는 점, 즉, 단년도 그리고 리그가 같은 선수간 비교만 허용되는 WAR보다는 오히려 시대가 다른선수 및 리그가 다른 선수간 일관된 비교를 가능하게 해주는 WARP가 많은 한계에도 불구하고 좀 더 범용적으로 사용될 수 있지 않나 생각됩니다. 다만, MGL이 창시한 Super-Lwts가 일반에 공개된다면, 이제 WAR 및 WARP를 사용할 필요조차 없게 되겠죠.

    댓글이 길어져서 일단 이정도로 댓글을 마치고, EqA와 wOBA 두 스탯 중 어떤 것이 더 좋은 스탯인지에 대해선 다음에 다시 토론 부탁드리고 싶네요. 아 그리고 저도 카디널스 팬입니다. ㅎㅎ 세이버매트릭스에 대해 궁금한 것도 많고 이야기할 것도 많은데 Freebird님 블로그때문에 많은 것을 알아가게되어 감사하다는 말도 덧붙이고싶네요.

    • BlogIcon FreeRedbird 2009.11.23 23:31 신고 Address Modify/Delete

      Replacement Level이 매년 변하는 것은 분명합니다. 어쩌면 작년의 8.9 WAR보다 올해의 8.4 WAR가 절대적으로는 높은 수준의 퍼포먼스일 수도 있습니다. (실제로 그런 일은 없겠지만) 1년 사이에 리그의 수준이 크게 높아져서 Replacement Level이 5 Runs 정도 올라갔다면 말입니다.

      이런 관점에서 보면 camomile님께서 말씀하시는 것처럼, 혹은 BP가 WARP2나 WARP3에서 하는 것처럼 긴 기간을 모집단으로 하여 리그의 수준을 반영한 조정 내지는 표준화가 일리 있습니다. 다만, 이렇게 조정함으로써 오히려 잃어버리게 되는 것은... 해당 선수가 해당 시즌에서 기록한 결과물이 갖는 시공간적인 context 입니다. 2009 시즌의 WAR 8.4는 2009 시즌이라는 고유의 context 안에서 8.4라는 고유의 값을 갖는 거죠. 이것은 이것대로 의미가 있습니다. context(혹은 Tom Tango의 표현대로 그 시즌 고유의 Run Scoring Environment라고 해도 좋겠습니다)를 잃어버리고 표준화되는 것은 그 나름대로 아쉬움이 있다고 생각합니다. 즉 2009년에 그 선수가 Replacement Level보다 8.4승만큼 더 기여했다는 것은 그것 그대로 객관적인 사실인데... 표준화로 8.4가 변하게 되면 이러한 맥락을 잃어버리게 되는 거죠.

      결국 자료를 활용하는 목적에 따라 갈리게 될 것 같습니다. 예를들어 Stan Musial의 어떤 시즌과 Albert Pujols의 어떤 시즌을 비교하여 어느 쪽이 더 대단한지 보고 싶다면... 절대적인 척도로 환산하여 비교하는 것은 그 나름의 장점과 의미가 있을 것입니다. 하지만, 조정을 하지 않고 Replacement Level을 그대로 둔다면, 각각의 플레이어가 비교 대상이 되는 그 특정한 시즌에 바로 그 해의 Replacement Level에 비해 어느 정도 우수한 퍼포먼스를 냈는지... 그 context 안에서 비교 되는 것이죠. 1960년대의 Replacement Level과 2000년대의 Replacement Level이 완전히 똑같지는 않을 것입니다. 하지만, 각자 속한 시대 안에서 상대적으로 어느 정도였는가 하는 것 또한 그 나름의 충분한 의미가 있을 것 같습니다.

      WARP의 Replacement Level은 Clay Davenport 자신이 BP의 Glossary 페이지에 "162게임에서 20-25승 하는 수준"이라고 적어 놓았습니다.
      http://www.baseballprospectus.com/glossary/index.php?mode=viewstat&stat=193

      이런 낮은 Replacement Level 설정으로 인해 Tom Tango와 Dave Cameron 등으로부터 뭇매를 맞아 왔죠. 아마도 2009년이 되어서야 Clay Davenport가 자신의 Replacement Level이 잘못되었음을 시인하고 Replacement Level 및 WARP를 수정한 것 같습니다. 아래 링크를 보시죠.
      http://www.insidethebook.com/ee/index.php/site/comments/the_new_warp/

      그리고 수비 스탯에 대해서는... 2002년 이전의 자료가 필요한 경우 저는 Sean Smith의 TotalZone을 이용합니다. 이것은 PbP데이터를 이용하는 스탯이므로, FRAR보다는 훨씬 낫다고 생각합니다.

      계속 답을 달다 보니 마치 BP의 안티가 된 것 같은 느낌인데요... BP에 대해 특별히 나쁜 감정은 없습니다. 저는 단지 제가 생각하기에 가장 신뢰할 만하고 사용이 용이한 스탯들을 선택해서 쓸 뿐입니다. 예를들어 주루 스탯 같은 경우는 여전히 BP의 EqBRR을 참고하고 있고요... 그리고 BP에는 스탯 말고도 볼 거리가 많죠. Kevin Goldstein 같은 뛰어난 필진을 보유하고 있기도 하고요.

      자주 놀러오셔서 많은 말씀 나누셨으면 합니다. ^^

  5. camomile 2009.11.24 23:49 Address Modify/Delete Reply

    아 그렇군요. 좋은 말씀 잘 들었습니다. 생각의 차이라고 볼 수 있는데, 저는 기본적으로 다른 리그 혹은 다른 연도간 일률적인 비교가 힘든 스탯은 1시즌만을 볼 때는 모르겠지만 그 이상에서는 아무런 쓸모가 없다고 보는지라 Fangraph가 제공하는 wOBA,wRAA 및 WAR은 기본적으로 한계가 있다고 생각했습니다. 저는 그래서 홈런,볼넷 등 누적스탯자체도 별로 중요치 않게 생각하거든요. 리그 수준에 따라 홈런 5~10개는 충분히 차이난다고 보기 때문이죠. 이를테면 작년 홈런이 30이었던 선수가 올해 홈런이 36이 되었다 하더라도 리그 홈런 자료가 제공되지 않는한 올해 그 선수의 파워가 작년에 비해 상승했다고 판단할 수 없으니까요. 담에 혹시 괜찮으시다면 EqA vs wOBA, 그리고 Fangraph의 Pitching WAR에 대해서 이야기 나눠보고 싶네요.

    • BlogIcon FreeRedbird 2009.11.25 10:43 신고 Address Modify/Delete

      네.. 언제든지 괜찮습니다. EqA vs wOBA 같은 경우는 여기에 계속 댓글 남기셔도 좋고요... 앞으로 다른 곳을 이용하셔도 괜찮습니다. 어차피 제가 타자의 스탯을 이야기할 때 wOBA를 메인으로 이용하는 한 계속 등장하게 될 테니까요. Fangraphs에서 투수의 WAR를 계산하는 법에 대해서는... 조만간 포스팅을 계획 중입니다.

      지금 포스팅을 생각하고 있는 것들이... MVP 및 사이영상에 대한 것, AFL 정리, Dave Duncan에 대한 생각, Rule 5 Draft, Non-Tender FA, Moneyball 그후 6년, 희생번트의 유용성 검토 part 2 등이 있고요... (적어놓고 보니 써야 할 것들이 엄청 밀려 있군요 ㅎㅎ) 이 사이의 적당한 시점에서 투수 WAR를 다루려고 합니다. 지금 예상으로는 아마 Dave Duncan 글 전후가 될 것 같은데... 거기에서 다시 말씀 나누시죠. ^^

  6. 홈런강탈 2010.02.06 23:43 Address Modify/Delete Reply

    WOBA는 출루율 스케일인데 처음에 공식 개념잡기는 출루율 만큼이나 가벼운듯. 삼진이나 진루에대한 아웃을 세분화시키면 가감을 통해서 해보는 것도 괜찮을 것 같구요.
    국내선수들에게 적용할때 회기분석공식들과 비교해서 차이는 비슷할것 같기는 한데 WAR에서 포지션 적용은 또 어떨지 모르겠고...^^

    • BlogIcon FreeRedbird 2010.02.08 09:20 신고 Address Modify/Delete

      실제로는 홈런이나 각 이벤트에 대한 가중치가 매년 조금씩 변합니다. 1.15라는 숫자 역시 OBP와 유사한 스케일이 될 수 있도록 약간씩 변하고요... 물론 큰 차이가 없으므로 일반적으로 위의 숫자를 그냥 사용하셔도 괜찮습니다.

      가중치의 변화에 대해서는 연구중입니다. "어떻게"는 알 것 같은데 아직 "왜"를 모르겠네요. 이해가 다 되면 따로 포스팅하도록 하겠습니다. ㅎㅎ

    • 홈런강탈 2010.02.08 21:38 Address Modify/Delete

      글쿤요. 답글도 글도 감사합니다. 포스팅기대되요 ㅋ

  7. 오뎅 2010.10.19 00:55 Address Modify/Delete Reply

    WAR 시대별로 평가하기 힘든가요.
    일반적인 팬으로

    04년 AL경우 이치로 7.2승으로 WAR 야수 1위입니다.
    그런데 홈런왕 매니 .308.397.613 WRC+ 154 기록하고 4.1 승 기록 했습니다.
    MVP 게레로 337.391.598 WRC+ 159 6.2 승
    두선수 모두 타격에서 뛰어난 점수를 획득 했지만
    수비에서 역전이 되죠.
    계산으로 알겠는데 일반적인 야구팬들은 납득이 되지 않습니다.
    포지션점수도 동일수준의 선수들이 수비력 때문에 그정도 타격에서 역전된다는 것이 이해하기 힘들죠.
    왜 그런가는 알고있지만 신뢰하지 못하는 이유라고 해야할까
    수비에대한 가중치가 지금까지 팬들의 생각보다 너무커서 괴리감이 있다고 해야할까
    WAR 직접으로 시대 다른 가령 04 이치로가 06 모어노 06 하워드 07 롤린스 08 페드로이야
    등보다 뛰어나다고 해서 뛰어난 시즌이라고 이야기 할수 없다면...
    음 어려워서요.
    타격에 대한 이야기인데 WAR 궁금한점을 질문을...

    • BlogIcon FreeRedbird 2010.10.20 18:31 신고 Address Modify/Delete

      먼저, WAR는 replacement level에 비해 얼마나 활약을 했는지를 나타내는 스탯이므로, 엄밀히 말해 04년의 8 WAR와 06년의 8 WAR가 완전히 똑같다고 할 수는 없습니다. 다만, 2년 사이에 replacement level이 그다지 많이 변했을 리도 없으므로, 오차는 얼마 되지 않을 듯 합니다.

      질문하신 부분과 관련하여, 예를 들어 보지요. 타자가 2루타 하나를 치면 위의 글에서 0.776점의 가치가 있다고 되어 있습니다. 아웃 당하면 -0.299이니까 실제로 2루타의 평균적 가치는 아웃 대비 1.075점의 가치가 있는 셈입니다.

      그런데, 만약 같은 타구인데도 Manny는 잡지 못해서 2루타가 되고, 수비가 좋은 Crawford는 그걸 잡아서 아웃으로 만들었다면, 역시 1.075점의 차이가 생기는 셈이죠. 우리 팀의 득점에 기여하는 것과, 상대 팀의 득점을 막는 것은, 똑같이 가치가 있는 일입니다. (사실 피타고리언 승률 공식으로 보면, 득점을 높이는 것보다는 오히려 실점을 줄이는 쪽이 아주 약간 더 유리하게 나옵니다.)

      문제는 수비 스탯을 얼마나 믿을 수 있느냐가 관건인데.. 공격이나 투수 스탯보다는 오차가 크다는 것이 정설입니다. UZR의 경우 3년 수치를 보는 것이 일반적이이죠. 약간의 오차가 있는 것은 어쩔 수 없다고 생각되고요. 단지 지금으로서는 이정도가 최선이다... 라는 정도입니다. 세이버메트릭스는 단 하나의 정답을 도출하지는 않습니다. 현재의 기술적 수준에서 논리적으로 가장 정답에 가깝다고 생각되는 결과물을 내주는 것이죠. Fangraphs의 WAR는 그것대로 결점을 가지고 있습니다만, 그래도 현재 발표된 메트릭 중에서는 가장 합리적이라고 생각되기에 이렇게 소개를 드리는 것입니다. 이제는 스탯티즈의 스탯도 과거의 BP쪽 스탯(EqA 등)에서 WAR 등의 Linear Weights 중심으로 바뀌어 있지요.

      사족으로... 외야수의 어깨는 과대평가되는 경향이 있고요.. 레인지가 가장 중요합니다. 일단 공을 잡아야 던지든 말든 하는 것이니까요.

  8. 오뎅 2010.10.20 19:23 Address Modify/Delete Reply

    외야수중 이치로 126점 특히 앤보살이 278점 ㅎㄷㄷ
    앤보살은 타격의 공헌을 넘는것 같네요.
    수비스탯은 그렇다고 치더라고 안타 하나 막는것이 생각해보니 엄청나군요.
    외야수 홈런스틸 계산해보니 기본적으로 1.397 아웃 0.299 ...

  9. 모노 2012.07.20 22:31 Address Modify/Delete Reply

    (질문) 숫자에 약해서 헷갈리네요;; wOBA에 사용되는 각각의 가중치를 wOBA상수(1.15?)로 나누면 그것이 득점기대값이 아닌가요??? 처음 단순히 생각해 여기에 타석수를 곱하면 wRC가 될 줄 알았는데 아니더군요.

    • BlogIcon FreeRedbird 2012.07.22 00:47 신고 Address Modify/Delete

      그렇지 않습니다. 1.15로 나눈 다음 아웃의 run value를 차감해 주어야 해당 이벤트의 run value를 얻을 수 있습니다. 홈런의 경우 공식에서 계수가 1.95 인데, 이를 1.15로 나눈 다음 다시 아웃의 run value인 0.299를 빼 주면 홈런의 원래 run value인 1.397을 얻게 되는 것이죠.

  10. gooodchoy 2017.04.09 12:55 Address Modify/Delete Reply

    좋은정보 고맙습니다.

  11. 질문자1 2018.10.11 01:07 Address Modify/Delete Reply

    6번 항목에 0.815 + 만루홈런의 Run Value = 4.117 라고 되어 있습니다. 그런데 0.815에 만루홈런의 가치가 어느 정도 포함되어 있지 않나요? 질문과는 별개로 블로그 글이 굉장히 흥미롭네요. 시험기간임에 불구하고 계속 보게 됩니다.

  12. 으라차 2019.05.21 23:47 Address Modify/Delete Reply

    팬그래프에서 나온 woba와 오차가 생기는 이유는 woba스케일이1.15고정이 아니라 매년 변화하기 때문인거 같아요
    물론 볼넷 사구 단타 등등의 가중치도 매년 변화하고요

  13. Raccoon 2019.05.29 13:44 Address Modify/Delete Reply

    좋은 정보 감사합니다

오늘 Padres를 상대로 7-0 승리를 거두면서, NL 중부지구에서 Cardinals와 2위 Cubs와의 승차는 무려 8게임으로 벌어졌다. 이로써 MLB 전체를 통틀어 1위와 2위의 격차가 가장 많이 벌어진 지구가 되었다.

Cardinals가 이렇게 "잘 나가게" 된 것은 누구의 공일까? 말할 것도 없이 팀 공헌도 1위는 Pujols이겠지만... 그 다음은 누구일까? 여러 가지 방법이 있겠지만 여기에서는 WAR(Wins Above Replacement)를 이용하도록 하겠다. 물론 실제로는 "클러치 상황"이라는 게 존재하므로(10-0에서 솔로 홈런을 쳐서 11-0을 만드는 것과 2-2에서 솔로 홈런을 쳐서 3-2로 이기게 하는 것은 정말 많이 다르다. 소위 말하는 "영양가"의 차이가 있는 것이다.), 특히 타자들의 경우 WPA/LI를 이용하는 것도 방법이지만... 이것은 이것대로 수비가 포함되지 않는다는 단점이 있으므로, 공/수 모두를 포괄할 수 있고 투수도 적용 가능한 WAR를 이용하도록 하겠다.

아래는 오늘까지의 성적을 바탕으로 올 시즌 Cardinals 플레이어들의 WAR를 나타낸 것이다.
항상 그렇듯이 자료는 Fangraphs에서 가져왔다.

Name Pos Batting Fielding Replacement Positional Starting Start-IP Relieving Relief-IP RAR WAR Dollars
Albert Pujols 1B 53.2 -0.6 17.9 -9.5         61 6.1 $27.40
Chris Carpenter P         38.9 145.2     38.9 4.3 $19.50
Joel Pineiro P         38.8 162.2     38.8 4.2 $19.10
Adam Wainwright P         35.5 179     35.5 3.8 $17.00
Yadier Molina C 2.4 0.5 14.6 7.9         25.4 2.5 $11.40
Colby Rasmus OF -1.8 12.2 13.1 0.8         24.2 2.4 $10.90
Brendan Ryan SS -1.6 10 10.3 3.8         22.6 2.3 $10.10
Matt Holliday OF 15 -2.4 4.1 -1.3         15.4 1.5 $6.90
Ryan Ludwick OF 3.7 -0.3 13.7 -4.8         12.3 1.2 $5.50
Ryan Franklin P             9.2 47.2 9.2 0.9 $4.30
Kyle Lohse P         8.2 96.1     8.2 0.8 $3.70
Mitchell Boggs P         5.5 35.1 0.8 2 6.3 0.7 $3.00
Skip Schumaker 2B/OF 3 -13.6 15.1 -0.4         4.2 0.4 $1.90
Julio Lugo 2B/SS 3.4 -3.1 2.8 0.7         3.9 0.4 $1.80
Mark DeRosa 3B -0.6 -0.7 4.7 0.2         3.6 0.4 $1.60
Joe Thurston 2B/3B -7.5 0.3 9.4 1.4         3.6 0.4 $1.60
Trever Miller P             4.1 33.2 4.1 0.4 $1.90
Brian Barden 3B -3.2 1.8 3.8 0.9         3.3 0.3 $1.50
Jarrett Hoffpauir 2B 0.8 0.7 0.5 0.1         2.2 0.2 $1.00
Jason LaRue C -2.9   2.6 2.4         2.1 0.2 $0.90
Rick Ankiel OF -8.9 0.6 10.9 -1         1.6 0.2 $0.70
Dennys Reyes P             1.5 29.1 1.5 0.2 $0.70
Kyle McClellan P             1.4 51.1 1.4 0.1 $0.70
Blake Hawksworth P             1.4 25.2 1.4 0.1 $0.60
Brad Thompson P         -1 43 2 27.2 1 0.1 $0.50
Blaine Boyer P             0.7 16.1 0.7 0.1 $0.30
Todd Wellemeyer P         1.2 110 -1.5 2.2 -0.3 0 ($0.10)
Chris Perez P             -0.4 23.2 -0.4 0 ($0.20)
David Freese 3B -2 0.4 0.7 0.2         -0.6 -0.1 ($0.30)
Jesse Todd P             -0.8 1.2 -0.8 -0.1 ($0.30)
Clayton Mortensen P             -0.8 3 -0.8 -0.1 ($0.30)
Shane Robinson OF -2.1 -1.3 0.9 -0.4         -2.9 -0.3 ($1.30)
Chris Duncan OF -5 -3.8 10.1 -4.5         -3.2 -0.3 ($1.40)
Tyler Greene 3B/SS -5.5 -2.9 3.7 1.3         -3.4 -0.3 ($1.50)
P.J. Walters P         1.8 4 -5.7 12 -3.9 -0.3 ($1.50)
Josh Kinney P             -3.7 12.1 -3.7 -0.4 ($1.70)
Khalil Greene 3B/SS -6.2 -7.2 5.7 2.1         -5.6 -0.6 ($2.50)
Jason Motte P             -6.1 43.2 -6.1 -0.6 ($2.80)
Nick Stavinoha OF -4.5 -3.7 3 -1.9         -7.1 -0.7 ($3.20)

Pujols가 1위인 것은 굳이 말할 필요도 없겠지만...
Carpenter, Pineiro, Wainwright가 각각 4.3, 4.2, 3.8 WAR로 2, 3, 4위를 달리고 있음이 눈에 띈다.
역시 이들 세 명의 선발 투수들이 아주 잘 해주고 있다는 점이 팀 성적의 든든한 밑바탕이 되고 있다.
아주 간단히 말하면, Pujols와 선발 투수 세 명이 Cardinals의 올 시즌을 이끌어오고 있는 것이다.

이어서 Yadier Molina가 2.5 WAR로 5위인데, 포수의 수비 능력이 WAR 계산에 제대로 반영되지 않고 있음을 감안하면... 실제로는 이보다도 팀 기여도가 더 높을 것으로 생각 된다. 다음은 Colby Rasmus와 Brendan Ryan인데,  Batting에서는 오히려 마이너스를 기록하고 있으나, 10 Runs가 넘을 만큼 뛰어난 수비를 보여 온 덕분에, 높은 WAR를 기록하고 있다.

그 다음은 Matt Holliday이다... -_-;;;  트레이드로 합류한 뒤 고작 26게임밖에 뛰지 않았으나 이미 1.5 WAR로 팀에서 8번째로 높은 WAR를 기록하고 있다. 그 26게임에서의 타격 성적은 .402/.444/.686(OPS 1.131)에 이른다. 트레이드 된 Brett Wallace가 이번 주 BA Hot Sheet에서 1위에 올랐다고 하지만... 그래도 Holliday가 계속 이런 활약을 보여 준다면... 불만을 가질 수는 없을 것이다.

그 뒤로는 고만고만한 선수들이 쭉 이어지다가... 맨 아래쪽에 가면 팀의 성적을 깎아먹고 있는 우울한 플레이어들이 보인다. 영예의 꼴등을 차지한 Stavinoha는 별로 기대도 안했으므로 그렇다 치더라도... Jason Motte가 팀에서 두 번째로 형편없는 성적을 기록하고 있다는 것은 참 안타까운 일이다. 똑같이 -0.6 WAR를 기록하고 있는 Khalil Greene과 함께... 올해 팀에서 가장 실망스러운 플레이어이다.

Posted by FreeRedbird

댓글을 달아 주세요