이 블로그에서 트레이드의 이해득실을 계산할 때나 특정 플레이어의 기여도를 비교할 때에 주로 사용한 비교 툴은 WAR(Wins Above Replacement) 였다. 그런데, 생각해보면 세이버메트릭스의 개념에 대해서 자세히 설명한 것은 FIP와 BABIP 정도밖에 없었던 것 같다. 이래가지고서야 WAR를 가지고 아무리 이야기해봤자 결국 잘난척에 불과하지 않을까...라는 생각이 들었다.

그래서 WAR의 개념과 계산 방법을 설명하기로 결심했지만... 문제는 도대체 어디까지 거슬러 올라가야 하는가였다. 이 블로그를 방문하시는 분들께서 스탯에 대해 얼만큼의 지식을 가지고 있는지 알 수도 없고... 결국 이런저런 고민 끝에, OPS와 그 변종들로부터 출발하기로 했다. 나는 Fangraphs와 같이 wRAA를 WAR 계산시 공격력의 척도로 삼고 있으므로, 이 글에서는 wRAA의 계산 방법까지 다뤄 보고자 한다.


요즘도 야구 중계를 보면 사실 타자에 대해 주로 언급되는 스탯은 타율(AVG), 홈런(HR), 타점(RBI)이 고작이다. 우리나라 중계는 물론이거니와 메이저리그 중계라고 해서 크게 다르지는 않은 것 같다. 그나마 OPS가 널리 퍼진 덕에, 출루율(OBP)과 장타율(SLG) 정도를 덤으로 들을 수 있는 정도이다.

타율이나 타점과 같은 석기시대의 스탯들로 타자를 평가하면 문제가 많다는 이유에 대해서는 자세한 설명을 생략하고자 한다. 이전의 FIP나 BABIP에 대한 글 뿐 아니라, 기회가 있을 때마다 같은 말을 반복해왔기 때문이다. 타율은 타자 본인의 능력과 상관없는 많은 요소들, 이를테면 상대팀의 수비 능력과 같은 외부 요인들이 많은 영향을 끼치므로, 타자의 능력을 평가하는 잣대로 쓰기에는 불완전한 부분이 많다는 정도로만 정리하고 넘어 가겠다. 타점은 팀 동료들이 해당 타자 앞에서 얼마나 출루를 해 주느냐에 더욱 크게 좌우되므로, 개인 스탯이라기보다는 팀 스탯에 가까운 숫자라고 할 수 있다. 타자의 생산성을 평가하는 지표로는 역시 낙제점을 면키 어렵다.


1. OPS

세이버메트릭스 최초의 히트작이라고도 할 수 있는 OPS 부터 살펴보자.

OPS는 On base percentage(OBP, 출루율) Plus Slugging percentage(SLG, 장타율)의 약어이다. 따라서 OBP와 SLG만 구할 수 있다면 쉽계 계산된다. 이 둘을 구하는 식은 아래와 같다.

OBP = (H + BB + HBP) / (AB + BB + SF + HBP)
SLG = TB / AB = (1B + 2*2B + 3*3B + 4*HR) / AB


이 둘을 그대로 더한 것이 OPS이다. 즉,

OPS = OBP + SLG

이렇게 된다. OPS가 히트하게 된 데에는 타자의 출루 능력과 장타력을 골고루 평가한다는 내용상의 우수함 뿐 아니라, 계산식이 단순하여 누구나 쉽게 이해하고 계산할 수 있다는 장점도 크게 작용하였다. 이후 보다 정밀한 스탯이 무수히 많이 개발되었지만, 한 눈에 타자의 생산성을 훑어보는 데에는 여전히 요긴하게 쓰이고 있다.


2. OPS+

이후 구장마다 타자에게 유리한 구장이 있고 불리한 구장이 있다는 것을 감안하여, 조정 OPS(OPS+, Adjusted OPS)가 등장하게 된다. OPS+는 구장 효과(Park Factor)를 반영할 뿐 아니라, 100을 평균으로 하여 스케일도 조정되기 때문에, 특정 시즌에 특정 타자가 리그 평균에 비해 얼마나 좋은 활약을 펼쳤는지 알 수 있다. (100보다 큰 숫자는 리그 평균보다 좋은 활약을 했음을 의미하며, 100보다 작으면 그 반대이다. 또한 100에서 멀어질수록 평균과의 차이가 크다.)

계산식은 다음과 같다.

OPS+ = 100 * ((OBP/lgOBP + SLG/lgSLG) - 1)

혹은 구장 효과를 적용하였음을 나타내기 위해 아래와 같이 표현하기도 한다.

OPS+ = 100 * ((OBP/lgOBP + SLG/lgSLG) - 1) / BPF

여기서 BPF는 타자의 Park Factor를 의미한다.


이렇게 되면 꽤 많이 발전한 것 같지만... OPS의 개념 자체에 대한 비판이 이어졌다. OPS이든 OPS+이든 기본적으로 가중치 없이 OBP와 SLG를 더해서 만들어지는 식이라는 점에서는 동일하다. 즉 출루율과 장타율을 동일한 가치로 취급하고 있는 것이다.

이러한 접근에 문제가 있음은 쉽게 알 수 있는데... 리그 평균 OBP와 리그 평균 SLG가 거의 1할 가까이 차이가 나는 데다가, 그 분포도 다른 것이다. 세이버메트리션들은 여기서 좀 더 나아가서, 득점과의 상관 관계를 통계적으로 구해 보았다. (타자가 타격을 하는 목적은 결국 팀이 득점하는 것이며, 그 외의 것은 모두 부수적인 것일 뿐이라는 사실을 기억할 필요가 있다.) 그 결과, 어떤 연구에서도 출루율과 득점과의 상관 관계(correlation)가 장타율과 득점과의 상관 관계보다 높게 나왔다. 이는 OPS와 같은 스탯을 계산할 때 출루율에 대해 얼마간의 가중치를 부여해야 한다는 의미가 된다.


3. GPA

이에 따라, GPA(Gross Production Average)가 발명되었다. 이 스탯은 출루율에 1.8의 가중치를 부여한 것이다.

GPA = (1.8*OBP + SLG) / 4

물론 이 식을 그대로 쓰지 않고 Park Factor를 적용, 조정하여 사용한다. 4로 나누는 이유는 AVG와 비슷한 정도의 scale을 얻도록 하기 위해서이다. 마치 타율과 비슷하게, GPA가 2할대 초반이 나오면 형편없는 타자이고, 3할이 나오면 아주 뛰어난 공격력을 지닌 타자라고 볼 수 있는 것이다.

GPA는 OPS보다 실제 득점과의 상관관계가 더 높으면서도 여전히 계산하기가 쉽다는 장점을 가지고 있다. GPA를 Runs, 즉 점수를 내는 데 기여한 수준으로 변환하는 공식들도 개발되어 있는데, 대표적인 것은 PA*1.356*(GPA^1.77) 이다.

여담이지만, "Moneyball"에서 Paul DePodesta는 OBP가 SLG보다 3배나 중요한 스탯이라고 주장한 바 있다. OBP가 중요하긴 하지만 그정도로 극단적인 OBP 우선주의는 좀 문제가 있다. DePodesta가 LA Dodgers에서 실패한 데에는 다 이유가 있는 것 같다...


4. RC, RC/27

이번에는 세이버 진영에서 내놓은 좀 더 복잡한 스탯들을 알아보자.

Bill James의 유명한 발명품들 중 하나인 RC(Runs Created)는 일단 아래와 같은 기본 형태를 가진다. (사실 이 스탯은 위의 GPA보다 훨씬 더 오래된 것이다.)

RC = (A*B) / C

A는 출루율을 반영한 어떤 값(On Base Factor)이며, B는 앞서 출루한 주자를 진루시키는 능력을 반영한 어떤 값(Advancement Factor)이다. C는 타자가 출루 내지는 진루를 시킬 수 있는 기회(Opportunity Factor)를 의미한다.

Bill James가 처음 RC를 고안한 이래로, 이 공식은 무려 14차례나 변형되어 왔다. 이를테면... 가장 기본적인 형태의 공식은 다음과 같다.

RC = ((H + BB) * TB) / (AB + BB)
      = OBP * SLG * AB


보다 널리 쓰이는 개량 버전 중 하나는 아래와 같다.

RC = ((H + BB - CS + HBP - GIDP) * (TB + 0.26 * (BB - IBB + HBP)) + (0.52 * SH + SF + SB)) / (AB + BB + HBP + SH + SF)

어이없다는 생각이 들 지도 모르겠으나... 이건 그나마 2002년 버전에 비하면 쉬운 공식이다. 필요한 숫자들이 많긴 하지만 모두 쉽게 얻을 수 있는 기본적인 스탯들이기 때문이다.

2002년 버전은 Wikipedia를 그냥 링크하도록 하겠다. 일일이 적자니 너무 길다... -_-;;;
클릭

링크에서... 위에 소개한 버전들을 쭉 지나면 2002 version이라는 것이 나온다. 읽을 수록 한숨만 나올 것이다. 통계적인 수치와 계산식을 통한 예측치를 일치시키려는 노력이 이렇게 계속되고 있지만... 그러면 그럴수록 식은 복잡해지고... 일반 팬들이 집에서 계산하기에는 무리가 많이 따르는 식이 되어 버리고 만다. 이 식을 바탕으로 한 득점 예상치의 오차가 5% 이내일 만큼 많이 정밀해진 것도 사실이지만... 그러면 그럴수록 오히려 활용하기는 더욱 어려워지고 있다.


[주: RC/27의 설명이 필요한 듯 하여 아래 paragraph를 나중에 추가하였다. 09/11/18]

한편, 공격력 측정 지표로 빈번히 이용되는 RC/27은 무엇일까?

RC/27은 단순히 RC를 27로 나눈 값이 아님에 유의하시길...!!!

RC/27 = 27 * RC / (AB - H + CS + GIDP + SH + SF)

계산하는 사람의 이론적인 이해 또는 입장에 따라 SH와 SF를 넣기도 하고 빼기도 한다. 개인적으로는 "SF는 넣고 SH는 제외해야 하지 않을까" 라는 생각을 하고 있다.

RC 대신 RC/27을 쓰는 이유는... RC가 누적 스탯이기 때문에, 절대적인 출장 기회가 많을수록 유리하기 때문이다. 예를 들어 어떤 플레이어가 부상으로 인해 시즌의 반 밖에 소화하지 못했다면, 그를 RC로 평가하는 것은 정당하지 못하다. RC/27의 개념은, 해당 타자 아홉 명으로 1번부터 9번까지 타순을 짠 다음, 9회까지 27아웃을 뛰는 동안 그 팀이 몇 점이나 득점할 수 있을지의 예상치를 산출하는 것이다. 따라서, 타석 수에 상관없이 절대적인 비교가 가능하다.

RC는 Bill James와 그의 동료들에 의해, 지금도 계속해서 개량 중인 스탯이다. "(출루능력 * 진루능력) / 기회"라는 이론적 기반 위에서, 실제 메이저리그 게임에서 통계적으로 관측되는 결과에 맞추기 위해 계속 식을 변형해 가는 것이다. Tom Tango는 이 이론적 기반 자체에 대해 의문을 제기한 바 있으며, 또한 RC가 홈런의 가치를 정확히 반영하지 못하고 있음을 보여주었다. Tom Tango의 비판에 대해서는 그의 홈페이지를 참고.

이러한 약점에도 불구하고, RC 특히 RC/27은 오랜 기간동안 타자의 공격력을 측정하는 지표로 매우 널리 이용되었다. 적어도 아래의 EqA나 wOBA가 나오기 전까지는 말이다.

5. EqA

이번에는 Baseball Prospectus의 야심작인 EqA를 살펴보자.

EqA는 Equivalent Average의 약자이다.
단어의 의미에서 알 수 있듯이, 역시 친숙한 AVG와 비슷한 숫자를 얻을 수 있도록 scale 조정을 한 스탯이다. 게다가 Equivalent는 리그에 대한 조정도 가능함을 의미한다. 즉 AA 레벨인 Texas League에서 뛰고 있는 어떤 유망주가 있을 때, 그의 활약 정도를 메이저리그로 옮겨 보면 어느 정도가 되는지 등의 분석이 가능하게 되는 것이다.

꽤 파워풀한 스탯 같지만... 역시 이런 스탯을 만들기 위해서는 엄청난 작업이 필요하다.

일단 아무 조정도 되지 않은 Raw EqA를 구해보면,

RawEqA = (H + TB + 1.5 * (BB + HBP + SB) + SH + SF - IBB/2) / ( AB + BB + HBP + SH + SF + CS + SB)

벌써 질렸는가? 이것은 단지 시작일 뿐이다.
이제부터 10번 이상의 변환을 거쳐야 한다. 하나하나가 결코 만만한 작업이 아니다.
이걸 일일이 설명하다가는 밤을 새야 할 것 같으므로, 그냥 Baseball Prospectus 사이트의 링크를 걸도록 하겠다.
클릭

이건 Runs Created 2002 버전보다도 몇 배나 어이없는 공식이다. RC의 경우는 엑셀을 이용하면 그럭저럭 노가다로 구할 수는 있지만... EqA는 솔직히 엄두조차 나질 않는다. 기껏해야 링크된 글을 몇 번 읽어보고 각각의 변환이 갖는 의미를 이해하는 정도가 고작이다.

주루플레이까지 포함하고 있고, 정교한 계산을 통하여 조정 작업을 거치게 되어 있으므로, 꽤 잘 만든 스탯인 것은 사실이지만 역시 일반 팬들이 활용하기는 너무 무리한 스탯이다.


이 밖에도 여러 OPS 대체 스탯이 만들어졌으나 일단 이 정도만 소개하고 넘어가고자 한다.


6. wOBA, wRAA

사실 진짜 소개하고 싶은 스탯은 바로 이 wOBAwRAA이다.

wOBA는 weighted On Base Average의 약자로, Tom Tango 외 2인이 쓴 책인 "The Book"에 잘 소개되어 있다. 앞으로 기회가 있을 때마다 이 책의 내용을 많이 소개할 예정인데... 2007년에 출판된 책으로, 세이버메트릭스의 새로운 교과서라고 해도 과언이 아닐 만큼 알찬 내용으로 잘 쓰여진 책이다.

세이버메트리션들은 이미 타자가 타석에 들어서서 발생한 어떤 "사건(Event)"이 득점에 미치는 영향을 오랜 기간에 걸쳐 조사해 왔다. 예를 하나 들어보자.

1999년부터 2002년간의 모든 메이저리그 게임을 이닝별, 상황별로 분석한 결과... 2사 만루 상황에서의 득점 기대값(Run Expectancy)은 0.815였다. 즉 이런 상황을 1000번쯤 맞게 된다면 815점 정도 득점할 확률이라는 것이다. 그런데... 타자가 여기서 만루홈런을 쳤다고 하자. 팀은 4점을 득점하고, 상황은 2사 주자 없음으로 바뀐다. 2사 주자 없음에서의 득점 기대값은 0.117로 나타나고 있다. 그렇다면, 앞의 만루홈런의 득점 가치(Run Value)를 구해 보자.

이 홈런으로 인해 득점 기대값은 0.815에서 0.117로 떨어졌다. 하지만 그 사이에 홈런으로 인해 팀은 4점을 득점하였으므로, 실제로는 0.117이 아니라 4.117이 된 셈이다. 따라서, 아래와 같이 식을 세울 수 있을 것이다.

0.815 + 만루홈런의 Run Value = 4.117

따라서, 2사 만루에서 홈런의 가치는 득점으로 환산하면 3.302 Runs가 됨을 알 수 있다.

이런 계산을 각 사건에 대하여 아웃카운트와 주자를 변화시켜 가며 모든 상황에 대해 해 보는 것이다. 이렇게 해서 사건별로 가중평균을 얻은 값은 아래와 같다.

홈런 : 1.397 Runs
3루타 : 1.070
2루타 : 0.776
1루타 : 0.475
에러 : 0.508
몸에 맞는 공 : 0.352
볼넷(고의사구제외) : 0.323
고의사구 : 0.179
폭투 : 0.266
아웃 : -0.299
(이하 생략 : 그 밖의 상황에 대한 데이터는 책을 참조하시기 바람... -_-;;; )

그렇다면 타자의 생산성을 어떻게 평가할 수 있을까? 홈런이나 안타 등이 가지는 가치는 아웃에 대비하여 구해야 할 것이다. "아무 것도 아닌 경우"란 존재하지 않기 때문이다. 타자는 아웃 당하거나, 아니면 어떤 방법으로든 살아서 나갈 것이다. 안타가 되었든, 에러가 되었든 간에 말이다. 따라서... 아웃으로 인한 가치의 손실을 빼 주면 해당 이벤트의 진정한 가치가 된다고 말할 수 있겠다. 예를 들면...

홈런 : 1.397 + 0.299 = 1.698

이런 식으로 구하는 것이다.

그 다음, 결과값을 OBP와 비슷한 scale로 나타내기 위해서, 각각의 value에 다시 1.15를 곱해 준다. 홈런의 경우는 1.698 * 1.15 = 1.95가 된다.

위에서 본 다른 스탯들은 주로 타율(AVG)과 비슷한 scale로 나타내기 위해서 조정을 했는데, wOBA의 경우는 출루율과 비슷한 scale로 조정을 해 주고 있다. 이렇게 조정해 주는 이유는 간단하다. 타자의 생산성을 한 눈에 알게 하기 위해서이다. .400의 출루율이 아주 좋은 것처럼, .400의 wOBA도 아주 좋은 것이다. .335 정도의 출루율이 리그 보통인 것처럼, .335 정도의 wOBA도 리그 보통이라고 생각하면 되는 것이다. 편리하지 않은가??

어쨌거나... 각 이벤트에 발생 횟수에 각각의 value를 곱하고, 여기에 다시 1.15를 곱하여 모두 더한다. 이를 PA(타석)로 나눠주면 그 타자가 한 번 타석에 들어설 때 팀의 득점 기대값(Run Expectancy) 상승에 얼마나 기여하는지를 알 수 있게 되는 것이다. 이것이 바로 wOBA이다. 식으로 나타내면 아래와 같다.

wOBA = (0.72*NIBB + 0.75*HBP + 0.90*1B + 0.92*RBOE + 1.24*2B + 1.56*3B + 1.95*HR) / PA

여기서 NIBB는 고의사구를 제외한 볼넷을 의미하며, RBOE는 Reached Base on Error, 즉 에러로 인해 타자가 출루에 성공하는 것을 의미한다. 타자의 능력과는 전혀 상관이 없는 폭투와 같은 이벤트는 아예 제외되어 있음에 유의하자.  (** 이 식은 이 글을 쓴 뒤에 약간 수정을 하게 되었다. 글 맨 마지막 부분 참고.)


이제 다음 단계는 그 타자가 실제로 메이저리그 평균보다 얼마나 뛰어난지를 점수로 계량하는 것이다. wRAA는 weighted Runs Above Average의 약자로, 단어 그대로의 의미를 지닌다. 즉 평균 타자에 비해 얼마나 득점에 기여하느냐를 점수(Runs)로 나타내는 것이다.

일단 리그 평균 wOBA를 구한다. 위의 모든 변수(홈런 등)에 리그 평균 값을 대입하면 된다. 그 다음, 해당 타자의 wOBA에서 리그 평균 wOBA를 빼 준다. 그리고 1.15로 나눠준다. (아까 OBP와 유사한 scale을 얻기 위해 1.15를 인위적으로 곱했으므로, 다시 나눠줘야 한다.) 마지막으로 해당 타자의 PA(타석)를 곱해주면, 그 타자가 해당 시즌에서 메이저리그 평균 타자에 비해 팀 득점에 기여한 정도가 점수로 나타나게 된다. 이를 식으로 나타내면...

wRAA = ((wOBA - lgwOBA) / 1.15) * PA

예를 들어서... Ryan Ludwick이 작년에 타석에서 어느 정도로 훌륭한 활약을 했었는지 계산을 해 보자.

2008년 NL의 리그 평균 wOBA는 대략 .331이었다. 한편, 2008년 Ryan Ludwick의 wOBA는 .406이었으며, 그는 617번 타석에 들어섰다. 이제 그의 wRAA를 계산해 보면...

wRAA = ((0.406 - 0.331) / 1.15) * 617 = 40.24

즉 Ryan Ludwick은 평균적인 NL 타자들에 비해 2008 시즌 팀 득점에 타격을 통해 40.24점 정도 더 많이 기여했다는 뜻이 된다. (참고 : Fangraphs에서는 그의 wRAA가 39.5로 나타나고 있다. 아마도 리그 평균 wOBA를 구하는 과정에서의 오차로 인한 차이가 아닐까 생각된다.)


다른 스탯에 비해 wOBA가 가지는 매력은 분명하다. 우선 실제 메이저리그에서 발생했던 사건들의 기대값을 구하여 계산한 결과이므로... 계산한 이론치와 실제 발생하는 득점 사이의 상관 관계가 우수하게 나타난다. 그리고 OPS만큼은 아니더라도, 다른 세이버 스탯들에 비하면 계산이 무척 쉬운 편이다. 마지막으로, wRAA로의 환산이 아주 편리하여, 해당 플레이어가 타석에서 점수로 몇 점 만큼 팀에 기여해 주었는지를 아주 쉽고 빠르게 계산할 수가 있다. 이것은 특히 여러 플레이어를 비교할 때에 그 진가를 발휘한다.

다만 약간 아쉬운 부분이라면, wOBA는 타석에서 타자에게 벌어지는 이벤트만을 반영하므로, 도루와 같은 주루플레이가 제외되어 있다. 이 부분은 앞으로 보완이 필요하다고 본다.



나름 쉽게 설명해 보려고 애써 보았는데 잘 된 것인지 모르겠다. 다음 번 세이버메트릭스 포스팅에서는 Replacement Level과 Positional Adjustment에 대해 다루고자 한다. 거기까지 다루고 나면 타자들의 WAR에 대해서도 설명이 가능할 것 같다.



** 추가 수정 사항

이 글을 쓴 이후, WAR를 계산하기 위해 직접 wOBA를 산출하던 중, 여러 타자들의 wOBA를 계산한 결과 모두 Fangraphs나 Stat Corner 등의 사이트에 비해 계산 결과가 다소 낮게 나오는 문제점을 발견하였다. 원인이 무엇일까 고민하던 중... wOBA를 창안한 Tom Tango의 글에서 다음과 같은 부분을 발견했다.

Note: Depending on the specific analysis, the PA term (plate appearances) may exclude bunts, IBB, and a few of the more obscure plays.

빙고!
wOBA 계산시 분모에서도 IBB(고의사구)를 제외하면 되는 것이다. 논리적으로 생각해도 분자에서 NIBB, 즉 고의가 아닌 보통 볼넷만을 계산 대상으로 하였으므로, 분모에서도 NIBB만을 계산에 넣는 것이 타당하다고 본다. 따라서, 수정된 식은 아래와 같다.

wOBA = (0.72*NIBB + 0.75*HBP + 0.90*1B + 0.92*RBOE + 1.24*2B + 1.56*3B + 1.95*HR) / (PA - IBB)

이렇게 계산하면 Fangraphs 사이트에 올라와 있는 결과들과 상당히 유사한 값을 얻을 수 있다. 물론 위의 인용문에서도 알 수 있듯이 각자의 논리에 따라 계산식이 조금씩 달라지므로, 소수점 세째 자리에서 나타나는 약간의 오차는 어쩔 수 없는 것일지도 모른다. Fangraphs나 Stat Corner 모두, 자신들이 어떤 특정 스탯을 더하고 뺐는지 상세히 밝히지 않고 있다. Tom Tango의 오리지널 계산식과는 값이 다르게 나오는 것으로 보아 뭔가 변화를 줬음은 확실한데 말이다...
Posted by FreeRedbird

댓글을 달아 주세요

  1. camomile 2009.10.27 14:53 Address Modify/Delete Reply

    흥미로운 스탯이군요. 그런데 RBOE가 나와있는 사이트는 어디인가요?

    • BlogIcon FreeRedbird 2009.10.27 16:17 신고 Address Modify/Delete

      2008년까지의 데이터는 Retrosheet에서 찾아보실 수 있습니다.

      http://www.retrosheet.org/boxesetc/P/Ppujoa001.htm

      이것은 Pujols의 스탯인데요. ROE 라고 적혀 있는 것이 바로 RBOE 입니다.

      Retrosheet의 선수별 데이터는 실시간 업데이트가 안되고 연간 단위로만 업데이트된다는 문제가 있는데요.. 실시간으로 RBOE를 표시해 주는 사이트는 저도 찾지 못했습니다.

    • BlogIcon FreeRedbird 2009.11.21 19:30 신고 Address Modify/Delete

      좀 더 뒤져보니 Baseball-Reference에서 RBOE를 발견할 수 있었습니다.

      http://www.baseball-reference.com/players/b/beltrad01-bat.shtml

      위 링크는 Beltre의 스탯인데요... 쭉 내려가시면 "Baserunning & Misc."라는 항목에서 "ROE"를 발견할 수 있습니다.

  2. camomile 2009.11.21 15:08 Address Modify/Delete Reply

    wRAA라는 스탯에 대해서 살펴보다가 느낀건데요. 시대적 조정이 전혀 되어있지 않은데다 포지션별 조정도 안되어있는 스탯이더라구요. 물론 WAR을 구할 때 포지션조정을 한다지만 VORP나 RARP처럼 애초에 타격스탯 산출부터 포지션을 고려해서 산출하는 것이 더 맞지 않나 싶네요. 이에 대해서 어떻게 생각하시는지 궁금합니다.

    • BlogIcon FreeRedbird 2009.11.21 19:37 신고 Address Modify/Delete

      wOBA나 wRAA는 순수하게 공격력만을 보기 위한 스탯이므로 선수의 포지션과는 그다지 상관이 없습니다. wRAA가 +15라는 것은 해당 포지션의 평균 타자의 공격력 수준보다 15점 높은 것이 아니라 "메이저리그 전체 평균 타자"보다 15점 높은 것이죠. 스탯의 원래 개념상 포지션 조정은 안하는 쪽이 맞다고 생각합니다. WAR계산시 수비력을 합치게 되므로, 이 단계에 가서 포지션 조정을 해 주는 것이 더 합리적이지요.

      wRAA는 시대 조정도 안 하는 쪽이 맞습니다. 왜냐하면... wRAA가 해당 시즌의 리그 평균을 기준으로 하기 때문입니다. 리그 평균은 매 해마다 달라지므로... 일정하게 표시할 수 없는 것이죠. 다른 연도를 비교하시려면 아쉬운대로 wOBA+를 이용하실 수 있겠습니다. Stat Corner(statcorner.com)에서 wOBA+를 제공합니다.

  3. camomile 2009.11.22 00:48 Address Modify/Delete Reply

    근데 매년 포지션의 리그 평균이나 Replacement Level이 변하는데 Fangraph의 방식처럼 wRAA에 UZR을 더해서 일률적으로 포지션에 대해 점수를 더하거나 빼는 것 보다는 BP의 WARP처럼 타격,수비스탯 산출시 각해의 Replacement Level과 비교해서 산출한다음 더하는 것이 보다 합리적인 것 아닌가요? 그리고 어차피 선수의 가치는 포지션대비 성적으로 봐야하는데, wRAA나 wOBA가 얼마만큼 의미가 있는지가 관건이네요. 또한 단순 타격능력만 본다고 하더라도 과연 주루능력이 전혀 반영되지 않는 wOBA, wRAA이 EqA, EqR보다 선수의 능력을 잘 보여줄 수 있을지도 의문이구요. EqA,EqR은 시대별조정된 스탯조차 쉽게 찾아볼 수 있죠.

    • BlogIcon FreeRedbird 2009.11.22 22:48 신고 Address Modify/Delete

      이거 굉장히 많은 내용의 질문이신데요... ^^ 이 내용은 원래 별도의 긴 포스팅을 염두에 두고 있었는데.. 답변으로 먼저 쓰게 되네요. 밑천 다 드러나겠습니다. ㅎㅎ 아마도 무척 긴 답글이 될 것 같습니다.

      우선... wRAA의 Average는 매년 변하는 해당 시즌의 평균에 대한 상대적인 값입니다. UZR의 기준값(리그 평균수비는 UZR=0 입니다.)도 매년 변한다고 봐야겠죠. 작년의 0과 올해의 0은 동일하지 않은 것입니다. BP에서 매년 변하는 Replacement Level을 기준으로 한 상대적인 값을 산출하고 있다고 하면, 방법론적으로는 별 차이가 없다고 봅니다. 저는 BP가 특별히 더 합리적이라고 생각되지는 않네요.

      다음, wRAA나 wOBA는 선수의 가치를 측정하는 스탯이 아닙니다. 공격력을 측정하는 스탯이죠. 포지션과 상관이 없습니다. 포지션을 고려한 종합적인 가치를 비교하시려면 wRAA가 아니라 WAR를 이용하셔야 합니다. BP로 따지면 EqA 단독으로 선수의 가치를 측정할 수 없으며, WARP를 이용해야 하는 것과 마찬가지입니다. WAR계산시 중복 계산을 피하기 위해 조정은 한 곳에서만 해 주는 것이 맞고요, 그 한 곳으로 가장 적절한 곳은 역시 수비 스탯을 더해줄 때라고 봅니다. 포지션이 다르다고 타석에서 다른 규칙을 적용받지는 않으니까요... 하지만 수비는 분명히 포지션에 따라 다르죠. wRAA의 의미와 선수의 포지션대비 가치는 그다지 상관이 없습니다.

      wOBA는 주루능력을 반영하지 않습니다. 애초에 컨셉이 다르기 때문이죠. EqA는 BP에서 공격력의 올인원 스탯을 만들기 위해 발명한 스탯입니다. 이거 하나로 타자의 타격과 주루를 한 번에 평가하고자 시도한 거죠. 반면 wOBA는 계산식에서 알 수 있듯이 타자가 타석에 들어섰을 때 벌어지는 이벤트에 대해서만 계산을 하는 것입니다. wOBA는 단순히 타격 능력을 보여줄 뿐입니다. 님께서 EqA를 선호하신다면 EqA를 쓰시면 됩니다. 저는 타격은 wOBA 및 wRAA를 쓰고 주루는 BP의 EqBRR을 참고하는 쪽을 더 선호합니다. 분리해서 보는 쪽이 더 정확히 볼 수 있다고 생각하기도 하고... 스탯으로서 wOBA의 접근 방식이 EqA에 비해 훨씬 sound하다고 보기 때문입니다. 이런 것은 관점의 차이라고 생각합니다. 세이버메트릭스에 단 하나의 정답은 없다고 봅니다.

      wOBA와 EqA의 대결을 다룬 연구는 여러 차례 시도되었고... 여기에서 wOBA가 진 적은 없었던 걸로 기억합니다. 아래의 최근 연구를 확인하세요. 둘 다 correlation이 0.97로 매우 우수한 스탯입니다만... 현대 야구에 대해서는 근소한 차이로 wOBA가 이기고 있습니다.

      http://www.hardballtimes.com/main/content/blog_article/is-eqa-better-than-woba

      제가 EqA를 좋아하지 않는 이유는 EqA의 계산이 지나치게 복잡하다는 점 이외에도... EqA 자체가 결함을 안고 있기 때문입니다. 약간 technical한 이야기가 되겠는데요... EqA는 개념적으로 Average 즉 타율과 비슷한 Scale을 갖도록 숫자를 맞춘 것입니다만, 투수와 같이 타격능력이 형편없는 경우 마이너스 값을 가지게 됩니다. 마이너스 타율은 있을 수 없는 일이지만, 그와 같은 Scale을 갖는다는 EqA에서는 마이너스가 나옵니다. 즉 너무 낮은 쪽으로 내려가게 되면 EqA의 계산식은 무너집니다. wOBA에서는 이런 일이 일어나지 않습니다. 또한, EqA가 타율과 비슷한 Scale을 갖기 위해서 온갖 보정과 추가계산을 하는 과정에서, 스탯으로서 갖는 자체적인 Scale이 붕괴합니다. .400 EqA는 .200 EqA에 비해 동일한 아웃 수 대비 득점 기여 수준이 2배가 되지 않습니다.
      이 논의에 대해서는 아래 링크를 참고하세요.
      http://www.insidethebook.com/ee/index.php/site/comments/why_is_eqa_so_complicated/

      저는 EqA가 갖는 "올인원 스탯"으로서의 매력을 인정합니다. 게다가 실제 득점과의 상관관계도 매우 우수하게 나옵니다. (correlation 값이 0.97이면 거의 더 바랄 게 없는 수준이죠) 다만 이렇게 복잡한 변형 과정을 거쳐서 결국은 Scale Distortion으로 귀결되는 것이 맘에 들지 않을 뿐입니다. 훨씬 간단하여 누구나 계산할 수 있으면서도 정확도 면에서 전혀 뒤떨어지지 않는 wOBA라는 좋은 대안이 있으니까요. wOBA가 주루를 고려하지 않는데도 이미 EqA와 동일한 수준의 correlation을 갖는다면... wOBA에 EqBRR을 참고하여 주루 부분을 보완하는 정도로도 EqA보다 충분히 더 정확한 결과를 얻을 수 있을 것입니다.

      마지막으로... WARP는 BP의 여러 스탯 중에서도 결함이 좀 많은 스탯입니다. 하나하나를 댓글에 쓰기는 너무 긴데요... 일단 같은 BP의 스탯임에도 불구하고... VORP와 WARP의 Replacement Level은 서로 다릅니다. WARP의 Replacement Level이 너무 낮게 설정되어 있는 것이죠. Keith Woolner나 Tom Tango 등 다른 사람들이 계산하는 Replacement Level 선수들로 이루어진 팀은 대략 .300이나 그 이상의 승률을 가집니다. (162게임에서 49승 정도) 하지만, Clay Davenport가 WARP를 계산할 때 사용하는 Replacement Level 선수들로 구성된 팀의 예상 승률은 .150 정도입니다. 대략 162게임 시즌에서 24승 정도밖에 못하는 쓰레기 팀이죠. Davenport가 설정하는 Replacement Level 선수는 솔직히 메이저리그는 커녕 웬만한 AAA 선수만도 못한 선수로, 메이저리그의 25번째 로스터 자리를 차지할 가능성이 0%에 가까운 커리어 마이너리거 입니다. 이런 선수를 Replacement Level로 잡아서 계산하면 계산이 맞을 수가 없습니다. 또한 투수의 경우 Pythagorean Expectation의 승수를 2로 잡아서 계산하여 계산이 안맞는 문제가 있고요... WARP 계산시 수비력의 척도로 사용되는 FRAR 혹은 FRAA는 PbP데이터가 아니라 PutOut, Error, 병살 등을 가지고 계산하는 관계로... 여러 세이버메트릭스 커뮤니티들에서 믿을 수 없는 스탯으로 이미 공인되어 있습니다. (다시 말하면 FRAR은 그냥 좀 더 잘 계산한 Range Factor라는 이야기 입니다.) 즉.. WARP는 BP가 군데군데 가지고 있는 이런저런 문제점을 한 곳에다 합쳐놓은... 신뢰도가 상당히 의심스러운 스탯이라고 볼 수 있습니다. EqA의 경우는 "공격 올인원 스탯"이라는 확실한 장점이 있습니다만, WARP의 경우는 결함투성이여서 도무지 좋은 점이 무엇인지 모르겠습니다.

  4. camomile 2009.11.23 14:04 Address Modify/Delete Reply

    허접한 질문에 장문의 답글 정말 감사드립니다.^^

    우선 wRAA는 변화하는 리그평균값에 대한 상대적 값이 맞습니다. 하지만, 제가 문제삼는 것은 전체 리그평균이 아니라 포지션 리그평균 혹은 Replacement Level이 매년 변화한다는 것입니다. 전체 리그평균이 불변이라도, 포지션 리그평균은 매년 바뀔수 있지 않습니까? 즉, 작년과 올해의 리그평균 wOBA가 .320으로 동일하다하더라도, 작년 포수 리그평균wOBA가 .290이고 올해 포수 리그평균wOBA가 .320이라면, 작년에 wOBA .380을 친 포수와 올해 wOBA .380을 친 선수의 공격력을 과연 동일하게 볼 수 있느냐는 것이죠. 결국 wOBA와 wRAA가 WAR을 산출하기 위한 공격력 스탯이라는 것을 놓고 본다면, wRAA로 공격력을 산출하고 추후에 상수를 더하거나 빼서 포지션 조정을 하는 것보다 BP처럼 RARP나 VORP로 공격력을 산출하는 것이 더 합리적이지 않나 싶어서 질문을 드린 것입니다.

    두번째로 의문이 드는 것은 과연 WARP와 VORP의 Replacement Level이 얼마나 차이가 나는가입니다. 올해 시대별조정을 거치지 않은 Albert Pujols의 VORP는 98.3, WARP의 산정에 기초가 되는 RARP는 93.2입니다. Joe Mauer의 VORP는 91.0이고 RARP는 77.7이군요. RARP의 Replacement Level이 VORP의 Replacement Level보다 낮다면, 두명의 RARP가 VORP보다 높게 나와야 하는데, 오히려 낮게 나오고 있죠. 지금은 BP의 Replacement Level이 약간 바뀐게 아닐까요?(저도 잘은 모르겠군요^^ 포지션별 리그평균 EqR을 구해서 RARP를 직접 도출하자니 엄두가 안나서ㅎㅎ 타자의 VORP는 정확한 산출방법을 잘 모르겠구요)

    세번째, Fielding Runs같은 경우 물론 결함이 엄청난 수비 스탯입니다만, 적어도 저희가 직접 구할 수 있는 스탯이라는데서 의미를 찾고 싶습니다. UZR이나 RZR같은 스탯이 물론 더 좋겠지만, 2002년 이전의 자료를 볼 수 없으며 포수의 수비에 대한 자료 역시 찾을 수 없고, 단순히 숫자 집어넣어서 나오는 스탯이 아닌데다가 시대별 조정도 안되어있다는 점에서 역시 한계가 있다고 생각합니다. 물론, 저역시도 UZR이나 RZR이 더 우월한 필딩 스탯이라는 점을 인정하며, 사실상 선수의 종합적 가치를 평가할 때 자료만 모두 구할 수 있다면 조정된RARP+조정된UZR(이제 시대조정뿐만 아니라 포지션난이도 조정도 해야겠지요)이 더 타당하다고 봅니다. 시대가 다른 선수들의 비교시, UZR과 wRAA로는 한계가 있죠. 작년 푸홀스가 WAR 8.9이고, 올해 푸홀스가 WAR 8.4라고 해도, 올해 푸홀스가 작년 푸홀스에 비해 못하다고 할 수 없는 점, 즉, 단년도 그리고 리그가 같은 선수간 비교만 허용되는 WAR보다는 오히려 시대가 다른선수 및 리그가 다른 선수간 일관된 비교를 가능하게 해주는 WARP가 많은 한계에도 불구하고 좀 더 범용적으로 사용될 수 있지 않나 생각됩니다. 다만, MGL이 창시한 Super-Lwts가 일반에 공개된다면, 이제 WAR 및 WARP를 사용할 필요조차 없게 되겠죠.

    댓글이 길어져서 일단 이정도로 댓글을 마치고, EqA와 wOBA 두 스탯 중 어떤 것이 더 좋은 스탯인지에 대해선 다음에 다시 토론 부탁드리고 싶네요. 아 그리고 저도 카디널스 팬입니다. ㅎㅎ 세이버매트릭스에 대해 궁금한 것도 많고 이야기할 것도 많은데 Freebird님 블로그때문에 많은 것을 알아가게되어 감사하다는 말도 덧붙이고싶네요.

    • BlogIcon FreeRedbird 2009.11.23 23:31 신고 Address Modify/Delete

      Replacement Level이 매년 변하는 것은 분명합니다. 어쩌면 작년의 8.9 WAR보다 올해의 8.4 WAR가 절대적으로는 높은 수준의 퍼포먼스일 수도 있습니다. (실제로 그런 일은 없겠지만) 1년 사이에 리그의 수준이 크게 높아져서 Replacement Level이 5 Runs 정도 올라갔다면 말입니다.

      이런 관점에서 보면 camomile님께서 말씀하시는 것처럼, 혹은 BP가 WARP2나 WARP3에서 하는 것처럼 긴 기간을 모집단으로 하여 리그의 수준을 반영한 조정 내지는 표준화가 일리 있습니다. 다만, 이렇게 조정함으로써 오히려 잃어버리게 되는 것은... 해당 선수가 해당 시즌에서 기록한 결과물이 갖는 시공간적인 context 입니다. 2009 시즌의 WAR 8.4는 2009 시즌이라는 고유의 context 안에서 8.4라는 고유의 값을 갖는 거죠. 이것은 이것대로 의미가 있습니다. context(혹은 Tom Tango의 표현대로 그 시즌 고유의 Run Scoring Environment라고 해도 좋겠습니다)를 잃어버리고 표준화되는 것은 그 나름대로 아쉬움이 있다고 생각합니다. 즉 2009년에 그 선수가 Replacement Level보다 8.4승만큼 더 기여했다는 것은 그것 그대로 객관적인 사실인데... 표준화로 8.4가 변하게 되면 이러한 맥락을 잃어버리게 되는 거죠.

      결국 자료를 활용하는 목적에 따라 갈리게 될 것 같습니다. 예를들어 Stan Musial의 어떤 시즌과 Albert Pujols의 어떤 시즌을 비교하여 어느 쪽이 더 대단한지 보고 싶다면... 절대적인 척도로 환산하여 비교하는 것은 그 나름의 장점과 의미가 있을 것입니다. 하지만, 조정을 하지 않고 Replacement Level을 그대로 둔다면, 각각의 플레이어가 비교 대상이 되는 그 특정한 시즌에 바로 그 해의 Replacement Level에 비해 어느 정도 우수한 퍼포먼스를 냈는지... 그 context 안에서 비교 되는 것이죠. 1960년대의 Replacement Level과 2000년대의 Replacement Level이 완전히 똑같지는 않을 것입니다. 하지만, 각자 속한 시대 안에서 상대적으로 어느 정도였는가 하는 것 또한 그 나름의 충분한 의미가 있을 것 같습니다.

      WARP의 Replacement Level은 Clay Davenport 자신이 BP의 Glossary 페이지에 "162게임에서 20-25승 하는 수준"이라고 적어 놓았습니다.
      http://www.baseballprospectus.com/glossary/index.php?mode=viewstat&stat=193

      이런 낮은 Replacement Level 설정으로 인해 Tom Tango와 Dave Cameron 등으로부터 뭇매를 맞아 왔죠. 아마도 2009년이 되어서야 Clay Davenport가 자신의 Replacement Level이 잘못되었음을 시인하고 Replacement Level 및 WARP를 수정한 것 같습니다. 아래 링크를 보시죠.
      http://www.insidethebook.com/ee/index.php/site/comments/the_new_warp/

      그리고 수비 스탯에 대해서는... 2002년 이전의 자료가 필요한 경우 저는 Sean Smith의 TotalZone을 이용합니다. 이것은 PbP데이터를 이용하는 스탯이므로, FRAR보다는 훨씬 낫다고 생각합니다.

      계속 답을 달다 보니 마치 BP의 안티가 된 것 같은 느낌인데요... BP에 대해 특별히 나쁜 감정은 없습니다. 저는 단지 제가 생각하기에 가장 신뢰할 만하고 사용이 용이한 스탯들을 선택해서 쓸 뿐입니다. 예를들어 주루 스탯 같은 경우는 여전히 BP의 EqBRR을 참고하고 있고요... 그리고 BP에는 스탯 말고도 볼 거리가 많죠. Kevin Goldstein 같은 뛰어난 필진을 보유하고 있기도 하고요.

      자주 놀러오셔서 많은 말씀 나누셨으면 합니다. ^^

  5. camomile 2009.11.24 23:49 Address Modify/Delete Reply

    아 그렇군요. 좋은 말씀 잘 들었습니다. 생각의 차이라고 볼 수 있는데, 저는 기본적으로 다른 리그 혹은 다른 연도간 일률적인 비교가 힘든 스탯은 1시즌만을 볼 때는 모르겠지만 그 이상에서는 아무런 쓸모가 없다고 보는지라 Fangraph가 제공하는 wOBA,wRAA 및 WAR은 기본적으로 한계가 있다고 생각했습니다. 저는 그래서 홈런,볼넷 등 누적스탯자체도 별로 중요치 않게 생각하거든요. 리그 수준에 따라 홈런 5~10개는 충분히 차이난다고 보기 때문이죠. 이를테면 작년 홈런이 30이었던 선수가 올해 홈런이 36이 되었다 하더라도 리그 홈런 자료가 제공되지 않는한 올해 그 선수의 파워가 작년에 비해 상승했다고 판단할 수 없으니까요. 담에 혹시 괜찮으시다면 EqA vs wOBA, 그리고 Fangraph의 Pitching WAR에 대해서 이야기 나눠보고 싶네요.

    • BlogIcon FreeRedbird 2009.11.25 10:43 신고 Address Modify/Delete

      네.. 언제든지 괜찮습니다. EqA vs wOBA 같은 경우는 여기에 계속 댓글 남기셔도 좋고요... 앞으로 다른 곳을 이용하셔도 괜찮습니다. 어차피 제가 타자의 스탯을 이야기할 때 wOBA를 메인으로 이용하는 한 계속 등장하게 될 테니까요. Fangraphs에서 투수의 WAR를 계산하는 법에 대해서는... 조만간 포스팅을 계획 중입니다.

      지금 포스팅을 생각하고 있는 것들이... MVP 및 사이영상에 대한 것, AFL 정리, Dave Duncan에 대한 생각, Rule 5 Draft, Non-Tender FA, Moneyball 그후 6년, 희생번트의 유용성 검토 part 2 등이 있고요... (적어놓고 보니 써야 할 것들이 엄청 밀려 있군요 ㅎㅎ) 이 사이의 적당한 시점에서 투수 WAR를 다루려고 합니다. 지금 예상으로는 아마 Dave Duncan 글 전후가 될 것 같은데... 거기에서 다시 말씀 나누시죠. ^^

  6. 홈런강탈 2010.02.06 23:43 Address Modify/Delete Reply

    WOBA는 출루율 스케일인데 처음에 공식 개념잡기는 출루율 만큼이나 가벼운듯. 삼진이나 진루에대한 아웃을 세분화시키면 가감을 통해서 해보는 것도 괜찮을 것 같구요.
    국내선수들에게 적용할때 회기분석공식들과 비교해서 차이는 비슷할것 같기는 한데 WAR에서 포지션 적용은 또 어떨지 모르겠고...^^

    • BlogIcon FreeRedbird 2010.02.08 09:20 신고 Address Modify/Delete

      실제로는 홈런이나 각 이벤트에 대한 가중치가 매년 조금씩 변합니다. 1.15라는 숫자 역시 OBP와 유사한 스케일이 될 수 있도록 약간씩 변하고요... 물론 큰 차이가 없으므로 일반적으로 위의 숫자를 그냥 사용하셔도 괜찮습니다.

      가중치의 변화에 대해서는 연구중입니다. "어떻게"는 알 것 같은데 아직 "왜"를 모르겠네요. 이해가 다 되면 따로 포스팅하도록 하겠습니다. ㅎㅎ

    • 홈런강탈 2010.02.08 21:38 Address Modify/Delete

      글쿤요. 답글도 글도 감사합니다. 포스팅기대되요 ㅋ

  7. 오뎅 2010.10.19 00:55 Address Modify/Delete Reply

    WAR 시대별로 평가하기 힘든가요.
    일반적인 팬으로

    04년 AL경우 이치로 7.2승으로 WAR 야수 1위입니다.
    그런데 홈런왕 매니 .308.397.613 WRC+ 154 기록하고 4.1 승 기록 했습니다.
    MVP 게레로 337.391.598 WRC+ 159 6.2 승
    두선수 모두 타격에서 뛰어난 점수를 획득 했지만
    수비에서 역전이 되죠.
    계산으로 알겠는데 일반적인 야구팬들은 납득이 되지 않습니다.
    포지션점수도 동일수준의 선수들이 수비력 때문에 그정도 타격에서 역전된다는 것이 이해하기 힘들죠.
    왜 그런가는 알고있지만 신뢰하지 못하는 이유라고 해야할까
    수비에대한 가중치가 지금까지 팬들의 생각보다 너무커서 괴리감이 있다고 해야할까
    WAR 직접으로 시대 다른 가령 04 이치로가 06 모어노 06 하워드 07 롤린스 08 페드로이야
    등보다 뛰어나다고 해서 뛰어난 시즌이라고 이야기 할수 없다면...
    음 어려워서요.
    타격에 대한 이야기인데 WAR 궁금한점을 질문을...

    • BlogIcon FreeRedbird 2010.10.20 18:31 신고 Address Modify/Delete

      먼저, WAR는 replacement level에 비해 얼마나 활약을 했는지를 나타내는 스탯이므로, 엄밀히 말해 04년의 8 WAR와 06년의 8 WAR가 완전히 똑같다고 할 수는 없습니다. 다만, 2년 사이에 replacement level이 그다지 많이 변했을 리도 없으므로, 오차는 얼마 되지 않을 듯 합니다.

      질문하신 부분과 관련하여, 예를 들어 보지요. 타자가 2루타 하나를 치면 위의 글에서 0.776점의 가치가 있다고 되어 있습니다. 아웃 당하면 -0.299이니까 실제로 2루타의 평균적 가치는 아웃 대비 1.075점의 가치가 있는 셈입니다.

      그런데, 만약 같은 타구인데도 Manny는 잡지 못해서 2루타가 되고, 수비가 좋은 Crawford는 그걸 잡아서 아웃으로 만들었다면, 역시 1.075점의 차이가 생기는 셈이죠. 우리 팀의 득점에 기여하는 것과, 상대 팀의 득점을 막는 것은, 똑같이 가치가 있는 일입니다. (사실 피타고리언 승률 공식으로 보면, 득점을 높이는 것보다는 오히려 실점을 줄이는 쪽이 아주 약간 더 유리하게 나옵니다.)

      문제는 수비 스탯을 얼마나 믿을 수 있느냐가 관건인데.. 공격이나 투수 스탯보다는 오차가 크다는 것이 정설입니다. UZR의 경우 3년 수치를 보는 것이 일반적이이죠. 약간의 오차가 있는 것은 어쩔 수 없다고 생각되고요. 단지 지금으로서는 이정도가 최선이다... 라는 정도입니다. 세이버메트릭스는 단 하나의 정답을 도출하지는 않습니다. 현재의 기술적 수준에서 논리적으로 가장 정답에 가깝다고 생각되는 결과물을 내주는 것이죠. Fangraphs의 WAR는 그것대로 결점을 가지고 있습니다만, 그래도 현재 발표된 메트릭 중에서는 가장 합리적이라고 생각되기에 이렇게 소개를 드리는 것입니다. 이제는 스탯티즈의 스탯도 과거의 BP쪽 스탯(EqA 등)에서 WAR 등의 Linear Weights 중심으로 바뀌어 있지요.

      사족으로... 외야수의 어깨는 과대평가되는 경향이 있고요.. 레인지가 가장 중요합니다. 일단 공을 잡아야 던지든 말든 하는 것이니까요.

  8. 오뎅 2010.10.20 19:23 Address Modify/Delete Reply

    외야수중 이치로 126점 특히 앤보살이 278점 ㅎㄷㄷ
    앤보살은 타격의 공헌을 넘는것 같네요.
    수비스탯은 그렇다고 치더라고 안타 하나 막는것이 생각해보니 엄청나군요.
    외야수 홈런스틸 계산해보니 기본적으로 1.397 아웃 0.299 ...

  9. 모노 2012.07.20 22:31 Address Modify/Delete Reply

    (질문) 숫자에 약해서 헷갈리네요;; wOBA에 사용되는 각각의 가중치를 wOBA상수(1.15?)로 나누면 그것이 득점기대값이 아닌가요??? 처음 단순히 생각해 여기에 타석수를 곱하면 wRC가 될 줄 알았는데 아니더군요.

    • BlogIcon FreeRedbird 2012.07.22 00:47 신고 Address Modify/Delete

      그렇지 않습니다. 1.15로 나눈 다음 아웃의 run value를 차감해 주어야 해당 이벤트의 run value를 얻을 수 있습니다. 홈런의 경우 공식에서 계수가 1.95 인데, 이를 1.15로 나눈 다음 다시 아웃의 run value인 0.299를 빼 주면 홈런의 원래 run value인 1.397을 얻게 되는 것이죠.

  10. gooodchoy 2017.04.09 12:55 Address Modify/Delete Reply

    좋은정보 고맙습니다.

  11. 질문자1 2018.10.11 01:07 Address Modify/Delete Reply

    6번 항목에 0.815 + 만루홈런의 Run Value = 4.117 라고 되어 있습니다. 그런데 0.815에 만루홈런의 가치가 어느 정도 포함되어 있지 않나요? 질문과는 별개로 블로그 글이 굉장히 흥미롭네요. 시험기간임에 불구하고 계속 보게 됩니다.

  12. 으라차 2019.05.21 23:47 Address Modify/Delete Reply

    팬그래프에서 나온 woba와 오차가 생기는 이유는 woba스케일이1.15고정이 아니라 매년 변화하기 때문인거 같아요
    물론 볼넷 사구 단타 등등의 가중치도 매년 변화하고요

  13. Raccoon 2019.05.29 13:44 Address Modify/Delete Reply

    좋은 정보 감사합니다