'Sabermetrics'에 해당되는 글 28건

  1. 2011.12.06 세이버메트릭스 블로그를 별도로 개설합니다.
  2. 2011.09.30 [세이버메트릭스] Log5 System 및 Pythagorean 승률을 이용한 메이저리그 플레이오프 예측 (7)
  3. 2010.09.16 [세이버메트릭스] 스탯은 얼마나 믿을 수 있는가: SSS(Small Sample Size)의 문제 (3)
  4. 2010.03.25 [세이버메트릭스] 그라운드볼의 효과(2) (3)
  5. 2010.03.11 [세이버메트릭스] 그라운드볼의 효과(1) (3)
  6. 2010.02.19 SIERA(Skill-Interactive ERA) : 새로운 투수 스탯의 탄생 (13)
  7. 2010.02.03 [세이버메트릭스] wRC+ : 타자에 대한 상대 평가 (4)
  8. 2010.01.21 [세이버메트릭스] 구원투수의 가치(Value) : WAR(Wins Above Replacement Level) 계산하기 (9)
  9. 2010.01.18 [세이버메트릭스] LI(Leverage Index) : 승부를 가르는 결정적 순간
  10. 2010.01.01 [세이버메트릭스] WPA(Winning Probability Added): 얼마나 승패에 영향을 미치는가, 혹은 얼마나 영양가가 높은가 (6)
  11. 2009.12.18 [세이버메트릭스] 타자의 가치(Value) : WAR(Wins Above Replacement Level) 계산 - Revisited - (23)
  12. 2009.12.07 [세이버메트릭스] 투수의 가치(Value) : 선발투수의 WAR(Wins Above Replacement Level) 계산하기 (9)
  13. 2009.12.01 [세이버메트릭스] 투수의 실점 방어 능력을 평가하기 : ERA, FIP, xFIP, tRA, tRA* (14)
  14. 2009.10.20 [세이버메트릭스] RE(Run Expectancy)와 WE(Win Expectancy) : Holliday의 에러는 얼마나 치명적이었나? (4)
  15. 2009.10.02 세이버메트릭스의 매력 (2)
  16. 2009.09.15 [세이버메트릭스] 타자의 종합적인 기여 수준, Value 측정하기 : WAR의 계산 (3)
  17. 2009.09.08 [세이버메트릭스] 주루플레이 능력을 평가하다? (2)
  18. 2009.08.30 [세이버메트릭스] Positional Adjustment : 수비 포지션의 난이도 차이에 대해서 (5)
  19. 2009.08.30 [세이버메트릭스] 수비 스탯 : FPct, RF, ZR, UZR, TZ, +/-(Fielding Bible) (16)
  20. 2009.08.28 [세이버메트릭스] Replacement Level(대체수준), VORP 란 무엇인가 (3)
  21. 2009.08.25 [세이버메트릭스] 타자의 공격력 계산하기 : OPS, OPS+, GPA, RC, RC/27, EqA, wOBA, wRAA (23)
  22. 2009.08.05 희생번트는 정말 득점에 도움이 될까?? (8)
  23. 2009.06.30 Pythagorean Record란 무엇인가 : 기대 승률, 실제 승률, 그리고 운빨 (6)
  24. 2009.06.17 BABIP란 무엇인가 : David Wright의 2009 시즌 타격 성적 분석 (19)
  25. 2009.06.09 MLB Draft Special : 3. 투수 vs 타자, 누구를 먼저 뽑아야 할까? (2) (4)
  26. 2009.06.08 MLB Draft Special : 2. 투수 vs 타자, 누구를 먼저 뽑아야 할까? (1) (1)
  27. 2009.04.12 What Is FIP?? (FIP란 무엇인가) (19)
  28. 2009.04.09 Sabermetrics를 위한 변명 (2)
Redbirds Nest in Korea라는 블로그를 개설한지도 벌써 만 3년에 가깝게 지났습니다. 시간이 언제 이렇게 갔나 싶네요.

그동안 Cardinals와 메이저리그, 그리고 세이버메트릭스를 다뤄 왔었는데... 포스팅이 계속 늘어나면서 이 모든 것을 한 공간에서 한꺼번에 이야기하기가 좀 어려워진 것을 느끼고 있습니다.

그래서, 이 블로그에서 다루던 내용 중 세이버메트릭스를 따로 떼어서 별도의 블로그를 운영하기로 했습니다.
마침 영화 "머니볼"의 개봉으로 국내에서도 세이버메트릭스에 대한 관심이 증가하고 있는 것 같습니다. Cardinals에는 관심이 없으나 세이버메트릭스에는 관심이 있는 야구팬 분들을 위해, 좀 더 편하게 이야기를 나눌 수 있는 공간을 만들어 보려고 합니다.

블로그 이름은 "Sabermetrics in Korea(세이버 코리아)" 이며, 주소는 http://saberkorea.tistory.com/ 입니다.
이 글을 쓰는 현재는 아무 것도 없어서 썰렁한 상태인데... 일단 기존 글을 몇 개 퍼간 뒤에 새로운 글을 써 볼까 합니다.

물론 기존의 세이버메트릭스 포스팅은 그대로 남겨 둘 예정입니다. 또한, Cardinals와 세이버메트릭스에 모두 관련된 내용으로 글을 쓰는 경우, 양쪽에 모두 포스팅할 생각입니다.


감사합니다.
FreeRedbird 배상.


* 이 글은 블로그 공지사항에도 등록됩니다.

Posted by FreeRedbird

댓글을 달아 주세요

Cardinals의 드라마틱한 플레이오프 진출 기념으로, 오래간만에 세이버메트릭스 포스팅을 해 본다.

Bill James는 이미 오래 전에 팀과 팀 간의 단기전 승률을 계산하는 "Log5 System"을 만들어 놓고 있었는데, "Baseball Abstarct 1981"에 처음 발표되었고, 이후 좀 더 일반적인 형태로 확장되었다. 그의 설명에 의하면 이런 이름을 붙인 것은 이 식이 각각의 팀을 승률 5할짜리 팀과 비교했을 때의 상대적인 값으로부터 계산하는 대수 체계(Logarithmic System)이기 때문이라고 한다.

로그 어쩌구 하는 이름도 그렇고, Bill James의 설명도 그렇고, 뭔가 엄청 복잡한 수식이 등장할 것 같지만, 실제 계산식은 무척 단순하고, 로그함수를 계산하는 일도 없다.

예를 들어, 팀 A와 팀 B가 1게임짜리 단판 승부를 벌인다고 치자. 종목은 꼭 야구가 아니더라도 상관은 없는데, 어쨌든 야구라고 치고, 이 둘은 같은 리그에 속해 있다. 해당 리그에서, 팀 A는 현재 6할의 승률을 거두고 있는 반면, B는 4할의 승률을 기록하고 있다. A와 B가 1게임을 했을 때 A가 이길 확률은 얼마일까?

이 계산을 위해서는, 먼저 A팀과 B팀의 log5 값을 구해야 한다. 이를 각각 log5a, log5b 라고 하자.

Bill James가 생각한 log5 값은, 해당 팀의 "Talent" 를 리그 평균에 비해서 상대적으로 나타낸 값이었다. A팀이 리그 전체(리그 평균 승률은 당연히 5할이고, 리그 평균 탤런트 수준도 0.5 이다)를 상대로 6할의 승률을 거두고 있다면, A팀의 상대적인 재능 수준(Talent Level)은 리그 평균에 비해 어느 정도일까? 아래와 같이 계산할 수 있다.


여기에서 0.5는 리그의 평균적인 재능 수준이고, 우변의 0.6은 이 팀의 승률이다.
역으로 이야기하면, 이 식을 만족하는 값을 A팀의 재능 수준, 즉 A팀의 log5 값으로 Bill James가 정의했다 라고 표현할 수 있을 것이다.

위의 식을 log5a에 대해 풀면,


즉, 리그 평균을 0.5라고 했을 때, A팀의 재능 수준은 0.750이다. 뒤집어 이야기하면, 재능 0.750짜리 팀이 재능 0.5짜리 팀(혹은 평균이 0.5인 리그 전체)을 상대로 경기를 하면 승률은 0.6, 즉 60%라는 것이다.

같은 방법으로, Log5b도 구해 보면,




동일한 식을 이용하여, 이제 A팀과 B팀이 단판 승부를 벌였을 때 각각의 승률을 예측할 수 있다.

A팀이 B팀에게 이길 확률을 Pab라고 하면,



처음의 식과 동일한 식에서, 리그 평균을 의미하던 0.500 대신 log5b, 즉 B팀의 재능 수준을 대입한 것이다. 계산 결과는 A팀이 이길 확률이 69.2%임을 보여준다.

같은 방법으로, B팀이 A팀에게 이길 확률을 계산하면, 30.8%이다.



보다 간단하게 계산할 수 있는 방법은 없을까?

리그 내에서 A팀의 승률을 Pa, B팀의 승률을 Pb라고 하여 식을 정리해 보자.

처음에 log5a를 구하던 식은 아래의 식이었다.


이 식을 log5a에 대하여 정리하면,


마찬가지로, log5b에 대하여 정리하면,


이제, 이 식들을 넣어서 Pab에 대하여 정리하면 아래와 같이 된다.


log5 등 불편한 항들이 사라지고 A, B팀의 승률만 남았다. 즉, 두 팀의 리그 내 승률만 알면 두 팀간 대결에서의 기대 승률을 계산할 수 있음을 알 수 있다.


이제 위의 식을 가지고 실습을 해 보자.

메이저리그는 내일부터 Division Series에 돌입한다. 8개 팀이 2팀씩 5전 3선승제의 단기전을 벌이게 되는 것이다.

페넌트레이스에서의 승패에는 운이 많이 개입하므로, 보다 실제 재능 수준에 가깝게 추정하기 위해, 시즌 득점/실점 자료를 바탕으로 Pythagenpat에 의한 Pythagorean Expectation을 계산하여 해당 팀의 리그 내 승률로 사용하였다.  (Pythagorean Expectation은 여기를 참조)

이렇게 계산한 Division Series 예측 결과는 아래와 같다.


Div. Series 기대승률은 3-0, 3-1, 3-2 승리 확률을 합산한 것이다.
3-0, 3-1, 3-2는 각각 어떻게 구할까? 고등학교 수학에서 배우는 조합을 이용하여 계산하면 된다.

위쪽의 예와 동일하게, 한 번의 대결에서 A팀이 B팀을 이길 확률을 Pab,  B팀이 이길 확률을 Pba라고 하면, n차전에서 시리즈가 A팀의 승리로 끝날 확률은 아래와 같다.


예를 들어, Cardinals가 Phillies에게 4경기만에 3-1로 승리하고 NLCS에 진출할 확률을 계산하면


이렇게 되는 것이다.

참고 : 위 식에서 "(n-1)C2"가 되는 이유는? 마지막 게임은 무조건 해당 팀이 이기게 되므로, 나머지 경기 중에서 두 게임을 이기는 경우의 수를 구하면 되는 것이다.

물론, 플레이오프에서는 5선발을 사용하지 않는 등 정규시즌과는 다른 로스터 운용을 하게 되므로, 실제로는 각 팀의 기대승률 자체가 변하게 되어, 위의 결과에서 오차가 생기게 된다. 하지만, 대략적인 전력상의 우열을 살펴보는 데에는 이정도로도 충분할 것이다.


P.S. 혹시 Bill James가 직접 출판했던 시절의 Baseball Abstract (1977년부터 81년까지)를 구할 수 있는 방법을 아시면 알려 주시길... 가끔 이베이에 올라오는 것 같기는 한데...



Today's Music : Tori Amos - Winter (Live 1992)



중고등학교때 헤비메틀을 많이 듣긴 했지만(팝음악을 들으면 나약한 음악이라고 구박을 받던 시절이었다), 사실 돌이켜보면, 사춘기 소년의 감성을 지배했던 음악은, 이런 곡들이었다. 십 몇 년을 들어도 질리지 않는 곡이다. 그다지 이쁘다고 할 수는 없는 Tori Amos의 얼굴이 너무 크게 잡혀서 약간 부담스럽긴 하지만... -_-;;;

Posted by FreeRedbird

댓글을 달아 주세요

  1. BlogIcon Pedroia 2011.09.30 21:53 신고 Address Modify/Delete Reply

    살짝 내용 바깥의 질문이긴 하지만 저 식을 입력하신거 어떤 툴같은걸 이용하신거 같은데 혹시 어떤 방법으로 식을 입력하셨는지 알수 있을까요?

  2. Vertigo 2011.09.30 22:10 Address Modify/Delete Reply

    본문과는 무관한 얘기지만, Tori Amos나 PJ Harvey가 노래하는 걸 보고 있자면 오싹해지곤 해요-_- Kate Bush만큼은 아니지만ㅎ

    • BlogIcon FreeRedbird 2011.09.30 23:35 신고 Address Modify/Delete

      Kate Bush 정말 대단하죠. 구름 속에서 노래하는 느낌이랄까.. 하지만 저는 조금 더 인간적(?)인 감성을 가지고 있는 Tori Amos가 더 좋네요.

      스타일이 전혀 다릅니다만, Martha Wainwright의 목소리도 무척 좋아합니다. ㅎㅎ

  3. 삼팬 2015.09.14 21:32 Address Modify/Delete Reply

    Redbird님 정말 감사합니다. 글이 완료가 되면 꼭 보여드리겠습니다.

  4. sq00131 2016.04.16 20:09 Address Modify/Delete Reply

    혹시 월드시리즈 승리확률 (7전4선승) 계산할때는 조합을 어떻게 해야되나요? n-1C2 했더니 값이 안나와서요

참으로 오래간만의 세이버메트릭스 관련 포스팅이다.
Cardinals가 시즌 막판에 마구 삽을 푸면서 세이버메트릭스 포스팅을 할 시간을 주고 있다. -_-;;

작년 한국시리즈 때였던 것 같다.
퇴근하면서 PMP로 중계방송을 보는데, 어떤 타자(이름이 기억나지 않음)가 안타를 치고 나가자, 해설위원은 다음과 같은 해설을 하였다. "아, 역시 A 선수가 B 투수에게 강하네요. A 선수 정규시즌에서 B 투수에게 7타수 4안타로 아주 강했거든요."

그 말을 듣는 순간, 이 글을 써야 겠다는 생각을 했었다. 그로부터 거의 1년이 지나서야 글을 쓰게 된다는 것은... 아기가 태어나면 삶이 어떻게 바뀌는지를 잘 보여주는 것이다. ㅎㅎㅎ

특정 투수와 특정 타자의 대결 기록, 즉 Matchup data는 무척 흔히 인용되는 스탯이다. 위와 같이, 이전에 A 타자가 B 투수에게 7타수 4안타를 기록했었다면, 우리는 아마도 다음 대결에서 A타자가 안타를 칠 확률이 매우 높다고 생각하게 된다. 정말 그럴까??

확률에 관한 세상에서 가장 진부한 예를 들어 보겠다. 동전을 던져서 앞면이 나올 확률과 뒷면이 나올 확률은 1/2로 같다고 하면, 동전을 2회 던졌을 때 앞면 한 번, 뒷면 한 번 나올 확률이 당연히 가장 높다. 하지만, 그냥 앞면만 두 번 나올 확률도 1/2 * 1/2 = 0.25 로 상당히 높은 것이 사실이다. 동전을 4회 던졌을때 모두 앞면이 나올 확률은 (1/2)^4 = 1/16 = 0.0625 로, 아까보다는 제법 낮아졌지만 여전히 있음직한 확률이다. 동전 4회 던지기를 10000번 하면 아마도 625번 쯤은 앞면만 4번 나오는 경우가 될 것이라는 이야기이니 말이다. 그럼 동전을 8회 던졌을 때 모두 앞면이 나올 확률은? (1/2)^8 = 0.0039 로, 0.39%이니 매우 작기는 해도 여전히 불가능한 것은 아니다. 즉, 앞면과 뒷면이 완벽하게 같은 멀쩡한 동전이라고 해도, 여전히 8회 연속으로 앞면만 나오는 등의 이상현상이 얼마든지 발생할 수 있다는 것이다.

그런데, 자꾸만 이상현상이 발생하는 경우, 애초에 동전이 이상한 경우를 생각해 볼 수도 있다. 알고보면 동전 자체가 찌그러져 있어서 한쪽 면만 계속 나올 수도 있는 것이다. 동전을 8번 던져 8번 모두 앞면이 나왔을 때, 이것은 단지 멀쩡한 동전이 어쩌다 한 번 보여주는 이상현상일 수도 있고, 찌그러진 동전이 일상적으로 보여주는 현상일 수도 있는 것이다.

야구의 스탯도 마찬가지이다. 어떤 타자가 작년과 재작년에 600 PA에서 홈런을 각각 15개씩 쳤는데 올해 갑자기 30개를 쳤다고 하면, 이것은 해당 타자가 오프시즌 동안 웨이트를 열심히 하여 근육을 늘린 결과 장타력이 실제로 향상된 것일 수도 있고, 단지 운이 좋아서 발생한 뽀록일 수도 있으며, 둘 다 해당될 수도 있는 것이다.

우리는 학교에서 배운 대로, 그리고 경험적으로, 이러한 이상현상은 모수 즉 Sample Size가 커질 수록 줄어든다는 것을 알고 있다. 동전을 2~3회 던지면 무슨 일이든 일어날 수 있겠지만, 동전은 100만 번 던지면 앞면이 나오는 횟수는 아마도 50만번에 가까울 것이고, 동전을 1억 번 던지면 더욱 더 평균에 가까워 질 것이라는 것이다.

어떤 특이한 현상, 예를 들어 어떤 타자의 볼넷 비율이 전체 타석의 30%로 매우 높은 것을 관찰했을 때, 이것이 10 PA 중 볼넷 세 번을 얻은 것과 같이 매우 작은 샘플사이즈에 근거한 것이라면, 그냥 일반적으로 흔히 발생할 수 있는 이상현상일 가능성이 훨씬 높을 것이다. 하지만, 이 타자가 여러 시즌을 뛰어서 2000 PA를 기록했는데 이 중에서 600번의 볼넷을 얻은 것이라면, 이것은 이 타자가 볼넷을 아주 잘 고르는 특이한 능력을 보유하고 있어서 그러한 능력이 발현되고 있는 것일 확률이 훨씬 높아진다.

그렇다면, 얼마나 모수가 커졌을 때 우리가 그것을 "뽀록"이 아닌 "능력"으로 인정할 수 있을까?

인터넷에서 활발한 활동을 벌여 온 세이버리스트(Tom Tango는 Sabermetrician이라는 단어 대신 Saberist를 사용할 것을 제안한 바 있다. 나는 Tango 빠 이므로 그의 제안을 그대로 따르기로 하겠다. ㅎㅎ )인 Pizza Cutter는 실제 데이터를 바탕으로 r=.70 이 상을 도출할 수 있는 모수를 찾아 보았다. 그가 r=.70을 기준으로 삼은 이유는 사회과학에서 이론의 설명력을 판단할 때 일반적으로 이 정도의 correlation을 기준으로 삼고 있으며, 또한 r=.70인 경우 r^2=.49가 되므로, r=.70보다 크다는 것은 상관관계가 50% 이상이라는 의미가 되어 어느 정도 객관적인 설명력이 있다고 생각되기 때문이다.

Pizza Cutter의 연구 결과는 다음과 같다.
(원문: 타자 기록, 투수 기록)

Offense Statistics:

  • 50 PA: Swing%
  • 100 PA: Contact Rate
  • 150 PA: Strikeout Rate, Line Drive Rate, Pitches/PA
  • 200 PA: Walk Rate, Ground Ball Rate, GB/FB
  • 250 PA: Fly Ball Rate
  • 300 PA: Home Run Rate, HR/FB
  • 500 PA: OBP, SLG, OPS, 1B Rate, Popup Rate
  • 550 PA: ISO

Pitching Statistics:

  • 150 BF – K/PA, grounder rate, line drive rate
  • 200 BF – flyball rate, GB/FB
  • 500 BF – K/BB, pop up rate
  • 550 BF – BB/PA

왜 swing%는 50 PA만 있어도 충분한데 HR/FB는 300 PA나 필요할까? 다음과 같이 간단히 생각해 볼 수 있다. swing%는 타자가 본 투구 수를 분모로 한다. 1 PA에서 보통 3~4개의 공을 보게 되므로, 50 PA에서 150~200 정도의 모수를 얻게 된다. 반면, HR/FB의 경우 타자가 친 플라이볼의 갯수를 분모로 하므로, 타자의 contract%를 80% 정도라고 하고 FB%를 40%라고 하면 300*0.8*0.4 = 96 으로 오히려 적은 모수를 얻게 되는 것이다.

또한 여기에는 단순히 모수의 갯수 뿐 아니라, 해당 스탯에 얼마나 많은 선수의 능력 이외의 외생변수들이 개입하는지가 중요하게 작용한다. Pizza Cutter는 750 PA까지 분석을 수행했는데, 타자의 타율이나 BABIP와 같은 경우 750 PA까지 높여도 여전히 r값이 0.70을 밑돌았다. 즉, 750 PA 정도의 샘플을 가지고는 타율에 대해 논하기가 어렵다는 것이다. 메이저리그에서 1년 내내 주전으로 뛰어도 700 PA를 넘기기가 쉽지 않으므로, 한 시즌의 타율을 가지고 다음 시즌의 타율을 예측하는 것은 그다지 신뢰하기 어렵다는 이야기가 된다...!!! 이는 그만큼 타율이나 BABIP가 타자의 능력 이외의 다른 외생변수(상대 수비수의 능력 등)의 영향을 많이 받기 때문이다. 참고로, 신뢰할 만한 수준의 타율을 얻기 위해서는 1,000 PA 이상의 데이터가 필요한 것으로 알려져 있다. 3,000 PA의 커리어 데이터에서 3할의 타율을 가진 타자가 있다면, 그는 진짜로 3할 타율을 칠 능력을 가지고 있었을 확률이 높다고 할 수 있겠지만, 작년 한 시즌 650 PA에서 3할 타율을 기록했다고 해서 그가 3할 타자라고 말하기는 조금 어렵다는 의미이다. 또한, 좌투수/우투수 상대 기록을 비교하는 플래툰 스플릿의 경우 통계적으로 설득력을 갖기 위해서는 무려 2,000 PA 이상의 기록이 필요하다.

응용을 해 보자. 휴식 및 부상으로 인한 결장을 감안하여 메이저리그 풀시즌을 650 PA라고 보면, 한 달에 대략 100 PA + 알파 정도를 얻게 될 것이다. 작년, 재작년에 비해 시즌 초인 4월달에 갑자기 컨택 능력이 확 늘어난 타자가 있다면, 이 타자는 남은 시즌 내내 비슷한 모습을 보일 확률이 높다. Contract%는 100 PA를 넘으면 통계적으로 설명력을 갖게 되기 때문이다. 하지만, 어떤 타자가 4월에 평소에 비해 2배 이상 많은 홈런을 쳤다고 해서, 앞으로도 시즌 내내 쭈욱 그럴 것이라고 기대를 하기는 어렵다. 홈런 비율이 설명력을 가지기 위해서는 적어도 300 PA가 필요하기 때문이다.


다시 처음으로 돌아가서... 타자 A가 정규시즌에 투수 B에게 7타수 4안타를 기록했다고 해서 포스트시즌에서 B 투수를 상대로 안타를 잘 칠 것이라는 기대를 할 수 있는가? 이미 답은 위에 다 나와 있다. 타자의 타율은 750 PA를 가지고도 통계적으로 의미있는 예측을 하기가 어려운데, 7 PA는 거의 아무런 의미도 없는 것이나 마찬가지이다. 특히 중요한 순간에 대타를 기용하고자 하는 감독의 입장이라면, matchup data 같은 것은 완전히 무시하고 현재 벤치에 앉아있는 타자들 중 가장 뛰어난 타자를 무조건 선택하는 것이 정답일 것이다.


P.S. 그럼에도 불구하고, 위와 같은 해설이 나쁘다고 생각하지는 않는다. 오히려 해설위원은 팬들이 야구를 더 재미있게 볼 수 있도록 가능한 한 많은 정보를 제공하는 것이 좋다고 본다. 이전에 7타수 4안타였는데 이번에는 안타를 칠까 못칠까... 라는 생각을 하면서 타자와 투수의 승부를 지켜보면 좀 더 재미있지 않은가? 우리는 팬이다. 팬은 야구를 즐기면 된다. 다만 말씀드리고 싶은 것은, 재미있게 즐기시되 이런 통계적으로 무의미한 데이터를 너무 진지하게 의지하지는 마시라는 것이다.


Today's Music : Elton John - Sweet Painted Lady (Live 1976)



이곡은 Yellow Brick Road 앨범에 있는 숨겨진 보석 같은 곡인데, Elton John 본인도 좀처럼 콘서트에서 부르지 않던 곡으로, 엄청난 레어 영상이다. 화질은 구리지만 음악과 퍼포먼스는 A+ 이다.

Elton John은 이미 셀 수도 없이 많은 히트곡들(30년 연속 빌보드 TOP 40 진입이라는 전무후무한 대기록을 가지고 있다)을 발표하여, 모르는 사람이 없을 정도의 엄청난 명성을 누리고 있지만... 그의 70년대 앨범들을 듣고 있노라면, 특히 국내에서, 나는 아직도 그가 저평가되어 있다고 생각한다. 단연코 20세기 최고의 뮤지션 중 한 사람이다.
Posted by FreeRedbird

댓글을 달아 주세요

  1. 홈런강탈 2010.12.02 23:20 Address Modify/Delete Reply

    요즘에 아마야구 기록을 끄적끄적 정리하고 있는데 표본이 적은 걸 내가 너무 의미부여 하고 있구나 라는 생각이 들었네요 ㅎ 글 재밌게 봤어요. 어떻게 보면 어려운게 표본이 쌓이는 동안 선수 기량도 등락이 있을 테니 쪼개보게도 되구요. 그러다 보면 신뢰성이 떨어질 것도 같고... 단편적으로 기록을 본다면 여러모로 위험하겠구나 싶었네요 ㅋ

  2. BlogIcon Pedroia 2011.06.27 14:58 Address Modify/Delete Reply

    비슷한 내용의 글이 있길래 허접한 실력으로 번역해봤는데 트랙백 걸고 갈게요 ㅋ

  3. BlogIcon ㅇㅇ 2014.06.02 22:43 Address Modify/Delete Reply

    매우 타당한 분석이기는 하신데요 아무리 생각해도 타율에 대란 의미를 가질 수 있는 필요PA보다는 특정 투수에게 상대적으로 강함을 증명할 수 있는 필요 PA는 낮을것 같네요 ㅋ 물론 7타수로는 부족하겠지만요 ㅋ

우리는 앞의 글에서 Matthew Carruth의 연구를 바탕으로 투수의 그라운드볼 유도 능력이 어떤 영향을 미치는지 살펴본 바 있다. 그런데, Carruth의 연구는 2009년 AL만을 대상으로 하고 있고, 또한 그가 살펴보지 않은 다른 부분들에 대해서도 궁금한 게 많아서, 내가 직접 이 연구를 확장해 보기로 했다.

우선, 연구 대상을 2003년에서 2009년까지의 MLB 투수들 중 100이닝 이상을 던진 시즌으로 확장하였다. 필요한 데이터는 Fangraphs와 Baseball-Reference 사이트에서 긁었다. 이렇게 추린 결과 총 986개의 표본을 얻을 수 있었는데, 대략 1시즌에 140명 정도가 100이닝을 넘기는 것 같다. 또한, Carruth가 살펴본 것 이외의 다른 분야에 대해서도 회귀분석을 통한 상관관계를 살펴보았는데, 대표적인 것으로 그라운드볼과 ROE(Reached On Error, 에러로 타자가 출루하는 것)의 관계 등이 있다.

미리 밝혀두지만, 매우 높은 상관관계, 즉 매우 높은 r 및 r-sqaure값을 기대하면 실망할 것이다. 야구에서 다른 변인을 배제한 채 그라운드볼 비율 하나만 가지고 설명할 수 있는 것은 많지 않은 것이다. 하지만, 대부분의 경우에 비록 상관관계는 적더라도 통계적으로는 유의미한 결과가 나왔다. 2차 회귀분석 같은 것은 실시하지 않았다. (나는 Baseball Prospectus의 덕후들이 아니다...!!)

하나씩 차례차례 보면...


<모든 그래프는 클릭하면 크게 보실 수 있습니다.>

1. 그라운드볼과 실점율(RA) : r = 0.138394, r^2 = 0.019153, RA = -2.03629*GB% + 5.639307
사용자 삽입 이미지

미세하나마 그라운드볼 비율이 높아질수록 실점허용이 조금씩 감소하고 있다. r-square가 0.02에 불과하여 큰 의미를 두기는 어렵지만... (이것은 RA의 변화 중 2%를 GB%로 설명할 수 있다는 이야기가 된다. RA를 결정하는 요소는 GB%이외에도 매우 많다고 이해하면 될 것이다.)

2. 그라운드볼과 ERA : r=0.183638, r^2=0.033723, ERA = -2.53154*GB% + 5.493725
사용자 삽입 이미지

ERA는 RA보다 조금 더 그라운드볼에 영향을 많이 받고(그래봐야 영향력은 여전히 미미한 수준이지만...), 그래프의 기울기가 더 급하게 나타난다. 그라운드볼을 더 많이 유도할 수록 RA가 감소하는 것보다 더 ERA가 감소하는 것이다. 과연 그럴까? ERA/RA를 살펴보자.

3. 그라운드볼과 ERA/RA : r=0.228233, r^2=0.05209, ERA/RA = -0.13672*GB% + 0.983837
사용자 삽입 이미지

이 경우는 앞의 둘에 비해 GB%가 미치는 영향이 더욱 커졌다. 이 정도면 분명히 무시할 수 있는 관계가 아니다. 그라운드볼 유도 경향이 강할수록, RA에 비해 ERA가 크게 감소하는 것이다. 그라운드볼을 많이 유도하는 투수가 상대적으로 ERA에서 이득을 보게 됨을 알 수 있다. 이 현상은 뒤에서 다시 확인하게 될 것이다.

4. 그라운드볼과 FIP : r=0.266894, r^2=0.071233, FIP = -2.88823*GB% + 5.643196
사용자 삽입 이미지

FIP는 어떨까? 앞에서 본 것들보다도 더욱 상관관계가 크게 나타나고 있음을 알 수 있다. 그라운드볼을 많이 유도하면 FIP가 내려가는 것이다. FIP가 인플레이 된 공을 무시하기 때문에 그라운드볼 투수를 과소평가한다는 주장을 하시는 분들이 있는데, 현실은 정 반대임을 알 수 있다. FIP는 그라운드볼 투수에게 호의적이다.

5. 그라운드볼과 에러로 인한 출루(ROE) : r=0.242846, r^2=0.058974, ROE/9 = 0.587465*GB% + 0.104385
사용자 삽입 이미지
그라운드볼은 과연 에러를 증가시킬까? 답은 위에서 보는 바와 같이 YES이다. ROE는 투수마다 이닝수가 다르므로 9이닝당 에러 갯수, 즉 ROE/9로 환산하여 계산하였다. (이 데이터는 B-R 사이트의 구석에 숨어 있고, Play Index에서 리포트로 제공되지도 않아서 찾아서 정리하는데 꽤 애먹었다. -_-;;) 이렇게 해서, 투수의 그라운드볼 유도가 수비수들의 에러를 증가시키고, 그에 따라 비자책점이 증가하여 ERA가 감소한다고 할 수 있겠다.

6. 그라운드볼과 폭투 : r=0.066555, r^2=0.00443, WP/9 = 0.1729*GB% + 0.187465
사용자 삽입 이미지

혹시 투수가 그라운드볼을 유도하기 위해 싱커를 많이 던지면 폭투가 늘어나지 않을까? 라는 의문으로 9이닝당 WP 수와 그라운드볼의 관계를 살펴보았다. 그 결과, 그라운드볼 비율과 폭투는 아무런 상관이 없는 것으로 나타났다.

7. 그라운드볼과 BABIP : r=0.098328, r^2=0.009668, 식 생략(무의미함)
사용자 삽입 이미지

이 분석결과는 나로서는 무척 의외였다. 그라운드볼을 많이 유도하면 안타가 많이 나올 것이고, 따라서 BABIP가 증가할 것이라고 생각했었는데, 분석결과는 그렇지가 않았다. 그라운드볼 비율과 BABIP는 거의 아무 상관이 없다...!!

8. 그라운드볼과 타율 : r=0.044523, r^2=0.001982, 식 생략(무의미함)
사용자 삽입 이미지

타율은 BABIP의 영향을 매우 크게 받으므로, 이러한 결과는 이미 BABIP가 GB%와 별 상관이 없음을 보았을 때 이미 예견할 수 있는 것이다. 투수의 피안타율은, 그라운드볼 비율과는 정말 아무런 상관이 없다.

9. 그라운드볼과 출루율 : r=0.014189, r^2=0.000201, 식 생략(무의미)
사용자 삽입 이미지

투수의 피출루율과 그라운드볼 비율은, 그야말로 전혀 상관이 없었다. 위의 그래프는 아무런 설명이 필요치 않아 보인다.

10. 그라운드볼과 장타율 : r=0.271293, r^2=0.0736, SLG = -0.19846*GB% + 0.512522
사용자 삽입 이미지

드디어, 그라운드볼이 모처럼 제법 영향을 미치는 결과가 나왔다. 그라운드볼이 늘어나면 장타 허용이 감소하는 것이다. 이것은 충분히 예측 가능한 결과인데, 그라운드볼이 라인드라이브나 플라이볼에 비해 장타를 덜 맞는 것은 너무나도 당연한 것이다.

11. 그라운드볼과 타자의 컨택 비율 : r=0.07047, r^2=0.004966, 식 생략(무의미)
사용자 삽입 이미지
이 결과는 나를 놀라게 했다. "그라운드볼 투수"라고 하면 아무래도 맞춰 잡는 유형의 투수일 것 같다는 생각이 들지 않는가?? 그라운드볼을 유도하여 내야수들이 타자 및 주자를 아웃 처리하게 하는 것이 그라운드볼의 큰 목적일 것 같은데... 타자가 공을 맞히는 contact 비율은 그라운드볼 비율과 별 상관이 없었다.

12. 그라운드볼과 삼진 : r=0.167946, r^2=0.028206, K/9 = -3.99764*GB% + 8.071883
사용자 삽입 이미지

그라운드볼 투수는 삼진을 덜 잡을 것 같은 선입견이 있는데... 실제로도 약간은 그런 경향이 있음을 확인할 수 있다. 그라운드볼 비율이 높을 수록, 9이닝당 삼진 비율은 내려간다. 비록 r값이 작지만...

13. 그라운드볼과 볼넷 : r=0.136526, r^2=0.018639, BB/9 = -1.86688*GB% + 3.852966
사용자 삽입 이미지

볼넷은 어떨까? 그라운드볼 투수는 볼넷도 적게 허용하는 것으로 나타났다. 물론 여기서도 K/9와 마찬가지로 상관관계가 큰 것은 아니지만 말이다.

14. 그라운드볼과 제구력(K/BB) : r=0.008614, r^2=0.0000742, 식 생략(무의미)
사용자 삽입 이미지
삼진/볼넷 비율은, 완벽하지는 않지만, 투수의 제구 수준을 살펴보는 매우 유용한 스탯이다. 그런데, 그라운드볼과의 상관관계는 전혀 없었다. 이번에 돌려 본 모든 분석 결과 중에서도 가장 형편없는 상관계수 및 P-value를 얻은 것이다. 위의 그래프를 보면 완전 일직선이지 않은가... 그라운드볼 유도 능력과 제구력은 아무 상관이 없다.

15. 그라운드볼과 피홈런 : r=0.455812, r^2=0.207764, HR/9 = -2.18067*GB% + 2.032465
사용자 삽입 이미지
드디어 그라운드볼이 제법 영향을 미치는 결과를 얻게 되었다. 그라운드볼을 많이 유도하면 피홈런이 감소한다. 이건 너무 당연한 이야기처럼 들리는데... 어쨌든 위에서 보는 바와 같이 실제로 유의미한 관계가 존재함을 알 수 있다.

16. 그라운드볼과 Infield Fly : r=0.411868, r^2=0.169635, IFFY% = -0.17908*GB% + 0.180326
사용자 삽입 이미지
그라운드볼을 많이 유도하면 홈런이 줄어들므로 실점을 그만큼 덜 해야 되는데... 기대한 것 만큼 실점 감소의 효과가 크지는 않다. 한 원인은 앞에서 이미 본 바와 같이 ROE가 증가하는 것이겠지만, 이것만으로는 뭔가 부족한 것 같아서, 또 어떤 다른 게 있을까 곰곰이 생각하다가 혹시 내야플라이가 어떨까 싶어 돌려 보았다. 결과는 위에서 보는 바와 같이, 그라운드볼이 증가할 수록 내야플라이가 감소한다. 내야플라이는 삼진 다음으로 타자의 아웃 처리 가능성이 높은, 투수에게 매우 유리한 결과물이므로, 내야플라이가 감소한다는 것은 실점을 줄이는 데에는 악영향을 미친다. 즉, 투수가 그라운드볼을 유도하면 홈런을 줄이는 이득이 있지만, 내야플라이가 줄어드는 손해도 있는 것이다.

17. 그라운드볼과 패스트볼 구속 : r=0.109629, r^2=0.012018, FBv = 4.712103*GB% + 87.71396
사용자 삽입 이미지
그라운드볼과 관련된 선입견을 하나 더 체크해 보았다. 혹시 패스트볼 구속이 안나오는 투수들이 그 대안으로 싱커를 많이 던저셔 그라운드볼을 많이 유도하고 있는 것은 아닌지? 결과는 위에서 보는 바와 같이, 거의 상관이 없었다. r값이 상당히 낮은데, 굳이 억지로 이야기하지면 오히려 그라운드볼 비율이 높은 투수가 구속도 약간 빨랐다.

18. 그라운드볼과 이닝당 투구수 : r=0.38887, r^2=0.15122, P/IP = -5.60524*GB% + 18.54446
사용자 삽입 이미지

그라운드볼의 이점이 또 무엇이 있을까...? 위의 그래프에서 보는 바와 같이, 그라운드볼을 많이 유도할수록 적은 공을 던져서 이닝을 마무리할 수 있다...!! 삼진도 적고 볼넷도 적으면 당연히 공을 덜 던질 수밖에 없다. 이것은 투수의 스태미너에도 긍정적인 영향을 미칠 것이다.

19. 그라운드볼과 WAR : r=0.213114, r^2=0.045418, WAR = 5.695013*GB% + 0.252346
사용자 삽입 이미지

마지막으로, 그라운드볼과 WAR(Wins Above Replacement Level)의 관계이다. NL 투수들은 타석에서의 삽질로 인해 WAR을 까먹게 되므로, 이 분석은 AL에서만 뛴 425명의 기록을 대상으로 하였다. 그 결과는, r=0.21의 상관관계에서, 그라운드볼을 많이 유도할수록 높은 WAR를 기록한다는 것이다...!!!!!!!!!  이것은 그라운드볼을 유도하는 것이 투수에게, 나아가 팀에게 좋은 전략임을 보여준다.


정리.

그라운드볼을 유도하는 것은 다음에 대해 어느 정도 내지는 상당한 영향을 미친다.
- 피장타율 및 피홈런의 감소
- 내야플라이의 감소
- 이닝 당 투구수의 감소
- ERA/RA의 감소
- FIP의 감소
- WAR의 증가

그라운드볼을 유도하는 것은 다음에 대해 약한 영향을 미친다.

- ERA의 감소
- RA의 감소
- ROE의 증가
- 삼진의 감소
- 볼넷의 감소

그라운드볼은 다음과 아무런 상관이 없다.
- 폭투
- BABIP
- 피안타율
- 피출루율
- K/BB
- Contact%
- 패스트볼 구속


아래는 작업에 사용된 엑셀파일이다. 참고하시기 바란다.

Posted by FreeRedbird

댓글을 달아 주세요

  1. 홈런강탈 2010.03.26 17:04 Address Modify/Delete Reply

    감사히 잘봤어요. 어렵게 작업하신거 너무 쉽게 본다는 생각이 드네요^^ 그라운드볼 투수를 ERA가 아닌 FIP로 보는게 과소평가가 아니라 오히려 다소 과대평가의 우려가 있겠네요. FIP/RA도 ERA/RA보다 더 적게 나타나게 되겠죠?

    근데 헷갈렸던게 구속의 경우 패스트볼구속에 싱커와 투심이 같이 카운트 되는 것 같아서 실제보다 과소평가 됬다는 인상을 받았었는데요. 그게 아니라면 그라운드볼 투수들이 뿌릴수 있는 포심이 평균보다 다소 빠르지 않을까 생각도 되네요.

    • BlogIcon FreeRedbird 2010.03.29 17:08 신고 Address Modify/Delete

      네... 말씀하신 대로 Fangraphs의 선수 페이지에서는 투심과 포심을 구분하지 않고 있습니다. Picth F/X 페이지에 들어가면 그때는 구분이 되어 있습니다만...

  2. 세이버리스트 2014.01.13 02:37 Address Modify/Delete Reply

    고생 많이하셨었네요 ^^ 단순 회귀식이라 설정한 독립변수에 누락되었지만 설명력이 있는 다른 변수들의 효과가 포함될 수 있어서 회귀계수는 의미 없겠지만 기울기 값이 가지는 포지티브 네거티브 사인 만큼은 잘 보이네요. 앞으로 이 페이지의 글을 많이 인용하게 될 것 같습니다^^; 시간이 나면 개인적으로 2009년 이후의 자료로 한 번 변화 양상을 정리해봐야겠습니다 ㅎㅎ

그라운드볼은 현대 야구에서 무척 권장되는 덕목 중 하나이다. 그라운드볼은 장타를 덜 허용하며, 병살의 가능성을 높여서 궁극적으로 실점을 줄일 수 있다는 것이다. 특히, raw stuff가 부족하여 탈삼진을 충분히 잡아내지 못하는 투수들도 메이저리그에서 성공할 수 있는 비결로 알려져 있다.

정말 그렇게 그라운드볼은 좋기만 한 것일까? 좋다면 얼마나 좋은 것일까?

얼마 전, Fangraphs의 Matthew Carruth는 5편에 걸쳐서 그라운드볼에 관한 시리즈를 연재한 바 있었다.
링크: 1 2 3 4 5

글이 5편이나 되지만 짧은 글들이므로 그다지 부담스럽지는 않을 것이다. 가능하면 원문을 한 번씩 읽어보실 것을 권한다.

그라운드볼이 플라이볼 보다 유리하며, 이왕이면 그라운드볼을 많이 유도하는 것이 좋다는 것은 이미 널리 알려진 것이므로, 굳이 따질 필요는 없을 것이다. 2009년 AL을 대상으로 한 Carruth의 연구에서도, 플라이볼은 그라운드볼보다 몇 배나 실점을 많이 자초하는 것으로 나타나고 있다.

Carruth도 지적하고 있지만, 이러한 차이는 주로 홈런에 기인하는 것이다. Tom Tango의 연구에 의하면, 플라이볼에서 홈런을 제외하고 나면 그 가치는 그라운드볼과 비슷해진다. 홈런을 빼고 생각하면, 투수가 플라이볼을 내주나 그라운드볼을 내주나 거기서 거기라는 것이다. 왜 이런 결과가 나올까? 플라이볼은 장타로 연결될 확률이 높지만, 그라운드볼에 비해 아웃이 되기도 쉽다. 또한, 종종 간과되는 부분인데, 그라운드볼은 내야 에러의 확률을 높여서, 타자가 에러로 출루할 가능성이 높아진다. (물론 평균적으로 그렇다는 것이고... 수비수들의 능력이나 주자 유무 등에 따라 달라지는 것은 당연하다.) 참고로, FIP가 그라운드볼 비율 같은 것을 아예 계산에 넣지 않으면서도 여러 테스트에서 매우 우수한 결과를 보여주는 것은 바로 이러한 이유 때문이다. 이미 피홈런을 반영하고 있으므로, 그라운드볼/플라이볼 비율을 무시하더라도 괜찮은 것이다.

널리 퍼져있는 생각 중 하나는, "그라운드볼 투수가 실투를 하여 높은 공을 던지면 오히려 장타가 될 확률이 더 높다"라는 것인데, Carruth의 2편을 읽어 보면 그렇지가 않다는 것을 알 수 있다. 플라이볼 중 홈런 비율, 라인드라이브 중 홈런 비율은 그라운드볼 유도 능력과 그다지 상관이 없었다. R-square 값이 0.01 혹은 0.02에 불과함을 주목하자.

재미있는 것은, 3편에서 보여주듯이 "플라이볼을 허용한 경우의 장타율"은 그라운드볼 유도 비율이 높을 수록 올라가는 경향을 보여준다는 것이다. 정확한 이유는 알 수 없으나, 아마도 높은 그라운드볼 비율로 인해 외야수들이 전진수비를 많이 함으로써 플라이볼이 오히려 장타가 되는 경우가 많아지지 않나 추측할 수 있을 것 같다.

4편은 그라운드볼 비율과 삼진/볼넷의 상관관계를 다루고 있는데, 그라운드볼 비율이 높을 수록 삼진과 볼넷이 모두 약간씩 줄어드는 모습을 보이고 있으나, 역시 형편없이 낮은 R-square 값을 고려할 때 큰 의미는 없어 보인다.

5편에서 그는 아래와 같은 결론을 내렸다.

그라운드볼 유도 능력은 다음 항목과 무관하다.
- 플라이볼/라인드라이브 허용시 홈런이 될 확률
- 삼진 비율
- 볼넷 비율
- 라인드라이브의 장타율(SLG)

그라운드볼 유도 능력은 다음의 영향을 미친다.
- 플라이볼의 장타율 상승
- 팝업(내야플라이) 감소
- RBOE(에러로 타자가 출루) 증가
- 피홈런 감소
- FIP 및 RA(실점) 감소


그라운드볼 유도 능력이 영향을 미치는 항목에서... 내야플라이나 피홈런이 감소하고 RBOE가 증가하는 것은 상식적으로 이해가 가능하다. 다만, FIP와 RA가 감소하는 것은 아마도 그럴 것이라고 기대되기는 하는데... Carruth의 그래프를 보면 역시 R-square가 너무 낮게 나타나고 있어서, 이렇게 결론을 함부로 내려도 되는지 조금 의문이다. (FIP의 R-square는 0.07, RA는 0.02에 불과하다)

그라운드볼을 많이 유도함으로써 얻는 이득은 RBOE의 증가로 어느 정도 상쇄되는 면이 있는데, 이에 대해서는 이미 2006년에 The Hardball Times의 David Gassko가 보여준 바 있다. Derek Lowe의 예에서 알 수 있듯, RBOE로 인한 실점은 비자책점으로 기록되므로, 그라운드볼 투수들이 오히려 ERA에 의해 과대평가될 수도 있다는 것이다. (이것은 그라운드볼 투수를 FIP가 과소평가한다는 널리 퍼진 견해와는 정반대의 주장이다.) 또한, FIP 및 RA에 대한 낮은 R-square값으로 볼 때, 삼진이나 볼넷 등 다른 기록을 무시한 채 그라운드볼 비율 하나만으로 투수의 실점 방어 수준을 설명하기는 무리인 것으로 판단된다. 요컨대, 그라운드볼을 많이 유도하는 것은 미덕이지만, 단지 그것만으로 성공을 담보할 수는 없는 것이다.


위에서 나온 이야기들에 대해서, 그리고 개인적으로 품고 있는 그라운드볼에 대한 의문점들에 대해서, 나 스스로 추가적인 테스트를 진행하는 중이다. 정리가 되면 추가로 포스팅하도록 하겠다.


Today's Music : Pet Shop Boys - A Red Letter Day (Live)



Awesome.
Posted by FreeRedbird

댓글을 달아 주세요

  1. BlogIcon Marple 2010.03.14 22:32 신고 Address Modify/Delete Reply

    재밌네요. 땅볼유도능력이 좋은 투수는 K/9이 상대적으로 적다는걸 의식하고 봤는데 개연성이 크지않네요. 단지 극단적인 땅볼유도 선수들은 능력에 비해서 다소 삼진%가 적다는것도 맞는것 같기도 한데 제가 그래프를 잘못 이해했나요?^^

    울나라의 경우는 메이저리그에 비해 사이드암,언더핸더 투수가 많은게 특징같은데 Statiz에서 보면 FIP/ERA가 잠수함투수가 그렇지 않은 선수보다 매시즌 0.1가량 높긴해요. 이게 ROE로 어느 정도 상쇄가 가능한지도 궁굼하네요.

    • BlogIcon FreeRedbird 2010.03.16 18:46 신고 Address Modify/Delete

      그라운드볼 경향이 강할 수록 삼진이 줄어드는 것은 맞습니다. 제가 직접 돌려본 바로도 "통계적으로 유의미"하게 나옵니다. 하지만 r^2가 낮은 만큼 그 영향이 별로 크지 않다는 것이죠.

      메이저리그에는 언더핸드가 거의 없다보니 관련된 연구도 별로 없습니다. 사이드암 혹은 언더핸드라고 해서 ROE가 많이 나올지는 잘 모르겠습니다. 그리고 ROE가 영향을 미치는 것은 FIP/ERA보다도 ERA/RA가 되겠지요. 곧 제가 직접 엑셀을 돌린 결과를 올려 드릴 예정입니다. 더 재미있는 결과들이 기다리고 있습니다. ㅎㅎ

    • BlogIcon Marple 2010.03.19 12:05 Address Modify/Delete

      답 댓글 감사합니당! 잠수함 투수의 경우 성향상 땅볼타구를 더 많이 유도하는 경우가 많더라구요. 그래서 정확히 매치하진 않지만 유용한 비교가 될 것 같아서 얘기해 봤어요^^

      많은 ROE로 인해 방어율이 과대평가 됬다면 FIP가 높게 나오는 경향을 감안할 수 있지 않을까 하고 생각도 되는데 이게 어느 정도인지 ㅎ

      담 글도 기대할게요~

(주의: 이 글은 그동안 적어온 세이버메트릭스 글 중에서도 매우 매니악한 분위기의 글이다. 마음의 준비를 하고 읽으시기를...)

Baseball Prospectus가 세이버메트릭스의 중심지이던 시절이 있었다. Voros McCracken이 DIPS 이론을 발표하고, Keith Woolner가 Replacement Level 및 VORP를 소개하던 2000년대 초반이 바로 그 시기이다. 이후 Nate Silver와 Clay Davenport 등 뛰어난 세이버메트리션들이 활약하면서 WARP, EqA와 같은 새로운 스탯과 퍼포먼스 예측 시스템인 PECOTA를 내놓으며 지속적으로 상당한 영향력을 행사해 왔다. 그러나, 최근 들어서는 BP에서 독자적으로 내놓은 기존 스탯들이 많은 비판을 받고, 반면 별다른 새로운 것을 내놓지 못하면서 다소 침체에 빠진 것도 사실이다. Dave Cameron 등은 대놓고 BP를 한물 간 퇴물집단으로 취급하고 있기도 하다. (물론 이것은 세이버메트릭스에 국한된 이야기이고... BP의 Kevin Goldstein이나 Will Carroll 등은 좋은 읽을거리를 많이 제공하는 괜찮은 칼럼니스트들이다.)

그러한 BP가 최근 들어 Eric Seidman, Colin Wyers, Matt Swartz 등을 새로 필진으로 영입한 것은 바람직한 변화의 흐름이라고 할 수 있다. 이번에 Eric Seidman과 Matt Swartz가 SIERA를 발표하는 모습에서도 BP의 변화를 볼 수 있다. BP는 보통 자신들의 스탯에 대해 계산과정에 대한 자세한 설명을 공개하지 않으며, 그나마도 유료 회원 전용 컨텐츠로만 올려놓는 경우가 많았다. 이러한 폐쇄성은 그 자체로도 비난의 대상이 되어 왔고, 발전적인 논의가 풍부하게 재생성되는 데 큰 지장을 주어 왔다. 하지만, 이번 SIERA의 경우는 무려 5개의 포스팅에 걸쳐서 기본 컨셉과 계산 과정이 비회원에게도 상세하게 공개되어 있는 것이다. 아래 링크의 인트로 페이지에 가면 5개의 포스팅을 모두 볼 수 있다.

링크(Baseball Prospectus의 SIERA 페이지)

SIERA는 Skill-Interactive ERA의 약자이다. (이 스탯의 이름을 보면서 과거에 잘나갔던 게임회사 SIERRA를 떠올리는 것은 나 뿐일까??) 이 스탯을 이해하기 위해서는, 역시 BP를 통해 2006년에 발표되었던 Nate Silver의 QERA를 먼저 살펴보는 것이 좋을 것이다.

QERA는 Quick ERA의 약자이다. Nate Silver의 글에 따르면(이 글은 유료 컨텐츠이다. 이런 것들이 BP의 폐쇄성을 나타내는 것이다. 돈을 벌고자 하는 것은 전혀 나쁜 것이 아니지만, 이런 기본적인 글조차 유료인 것은 많은 사람들이 이 스탯에 대해 토론할 기회를 박탈하는 것이다. 게다가 이 글은 발표된지 3년이 넘게 지났는데, 아직도 유료컨텐츠로 묶어둘 이유가 무엇이 있을까? BP 사람들 이외에 거의 아무도 QERA를 쓰지 않는 것은 다 이유가 있다.), 투수의 스탯 중에서 K%, BB%, GB%/FB%가 투수에 따라 상당히 일관된 경향을 보이며, 나아가 투수의 ERA와 밀접한 상관 관계를 갖는다는 것이다. 따라서, 위의 숫자만 가지고 투수의 ERA를 예측할 수 있는 식을 개발하였다.

QERA = (2.69 - 3.4*K% + 3.88*BB% - 0.66*GB%)^2

FIP가 K, BB(+HBP), HR을 사용하는 것과 비교하면, HR 대신 GB%를 사용하는 것이 가장 큰 차이임을 주목하시기 바란다. 또한, 이 식은 선형함수가 아님을 알 수 있는데, 주자를 누상에 내보내면 더욱 많은 점수를 실점하게 되므로 실점은 Linear하게 나타나지 않다는 BP의 주장을 반영하고 있다.

그런데, 이 스탯은 구조적인 문제를 안고 있었다. K%나 BB%가 K/PA, BB/PA로 계산되는 데 반해, GB%는 GB/BIP(Ball in Play), 즉 인플레이가 된 타구 중에서의 GB 비율로, 비교 대상이 되는 숫자가 서로 다른 것이다. 게다가, Eric Seidman과 Matt Swartz(이하 Eric/Matt)에 따르면, 이 식은 "K, BB, GB 간의 상관관계를 제대로 고려하지 않았다"는 것이다.

그래서, Eric/Matt은 QERA를 업그레이드하기로 했다. 그들은 GB/BIP를 (GB-FB-PU)PA로 바꿔서 비교대상을 PA로 통일하였다. (여기에서의 FB는 외야플라이이며, PU은 Pop Up 즉 내야플라이의 약자이다. 쉽게말해 "(그라운드볼-플라이볼)/타석" 이다. Fangraphs의 경우 외야/내야를 구분하지 않고 그냥 FB로 합쳐 놓고 있음을 참고하시기 바란다.) 또한, K%나 BB%, GB%가 상당 부분 서로 영향을 준다고 보고, 위의 QERA 식을 전개한 다음 나오는 모든 변인에 대해 회귀분석을 실시하였다. 예를 들어 K%나 BB% 뿐 아니라, K%*BB%도 중요한 변인이 될 수도 있다고 생각한 것이다.

또한, Eric/Matt은 QERA와 마찬가지로, HR을 변인으로 사용하는 것을 거부하고 대신 GB%를 선택하였다. HR/FB 비율이 투수의 실력이라기보다 운에 의해 많이 좌우된다는 것이 그 이유였다.


이렇게 해서 이들은 새로운 스탯을 개발하게 되었다. 이들이 SIERA를 처음 발표한 것이 미국시간으로 2월 8일이고, 현재의 버전으로 식을 수정한 것이 2월 12일이니, 아주 따끈따끈한 새 스탯인 셈이다.

그런데, 이 스탯의 궁극적인 목표가 아주 재미있다. Eric/Matt의 원문(SIERA 시리즈 중 네 번째 글)을 보자.

To be blunt, our goal was to beat everyone at predicting park-adjusted ERA in the following season, regardless of HR/FB treatment, and beat everyone but FIP and tRA in terms of same-year predictive value.


SIERA의 궁극적 목적은 특정 투수의 올 시즌의 데이터를 가지고 그의 내년 ERA(파크팩터 적용)를 가장 정확하게 예측하는 것이며, 같은 시즌의 ERA에 대해서는 FIP와 tRA 다음으로 정확한 예측을 할 수 있는 것이라고 한다...!!! 이것은 스탯을 비교하는 데 있어서 문제가 될 수 있는데, FIP나 tRA는 투수의 내년 ERA가 아니라 투수의 현재 진짜 기량 수준(True Talent)를 나타내기 위해 개발된 스탯이며, 원칙적으로 미래를 예측하기 위해 개발된 스탯은 아니기 때문이다. SIERA와 FIP 혹은 tRA를 아무 전제 없이 그냥 1:1로 대결시키는 것은 공정하지 않을 수도 있다는 이야기가 된다.

Eric/Matt의 생각은, 수비수나 운의 개입 보다 투수 자신의 역량이 매우 크게 작용하는 변인들(K% 등)은 해가 바뀌더라도 각 투수별로 비슷하게 나타날 것이므로, 올해의 데이터를 가지고 내년의 ERA를 맞출 수 있다면, 그것이 해당 투수의 진정한 기량 수준을 가장 잘 표현하는 스탯이라는 것이다. 이런 주장의 문제점에 대해서는 글의 뒷부분에서 다시 언급하기로 하고, 일단은 이러한 SIERA의 개발 목적을 감안하여 계산식과 결과를 살펴보도록 하자.


Eric/Matt이 회귀분석을 통해 얻은 계산식은 아래와 같다.

SIERA = 6.145 – 16.986*(SO/PA) + 11.434*(BB/PA) – 1.858*((GB-FB-PU)/PA) + 7.653*((SO/PA)^2) +/– 6.664*(((GB-FB-PU)/PA)^2) + 10.130*(SO/PA)*((GB-FB-PU)/PA) – 5.195*(BB/PA)*((GB-FB-PU)/PA)

where the +/- term is a negative sign when (GB-FB-PU)/PA is positive and vice versa.


주: BP 사이트에서는 두 가지의 서로 다른 SIERA 계산식을 볼 수 있다. 즉 시리즈의 1편에 나온 식과 5편 및 인트로 페이지에 나온 식이 서로 다른 것이다. 이것은 1편 발표 후 Eric/Matt이 일부 오류를 수정하여 다시 계산했기 때문이다. 앞으로도 또 바뀔 수도 있는데, 이 페이지에 있는 식을 최신 버전으로 보면 된다.

Matt/Eric은 2003년부터 2008년까지의 MLB 데이터를 가지고 스탯 간 비교를 수행하였다. 이들의 계산 결과를 그대로 옮기면 아래와 같다.
Stat    YR-Same YR-Next
SIERA 0.957 1.162
tRA 0.755 1.222
FIP 0.773 1.224
xFIP 1.168 1.319
QERA 1.070 1.248
ERA-Park ---- 1.430
ERA 0.094 1.434

숫자는 RMSE이다. 작을 수록 우수하다는 의미가 된다.

YR-Same은 같은 해의 파크팩터 적용 ERA를 예측하는 데 얼마나 우수한가를 나타낸다. 예를 들어 2005년의 SIERA로 2005년의 ERA를 맞춰 보려고 할 때의 에러 수준인 것이다. tRA와 FIP가 역시 뛰어난 성적을 보이고 있음을 알 수 있다. xFIP가 성적이 안좋은 것이 매우 의외이다.

YR-Next는 올해의 스탯을 가지고 내년의 파크팩터 적용 ERA를 예측하는 데 얼마나 우수한가를 나타낸다. SIERA가 1위를 차지했음을 알 수 있다. (비록 SIERA의 RMSE 1.162와 FIP의 1.224는 그다지 큰 차이가 아니지만 말이다.) 이렇게 보면 Eric/Matt은 당초의 목적을 달성한 것으로 보인다...!!

과연 그럴까...?

SIERA가 발표된 이후, 여러 세이버메트릭스 커뮤니티에서는 열띤 토론과 검토가 이어졌다. 그 중에서도 특히 주목할 만한 것은, 사실상 현대 세이버메트릭스의 최전방이라고 볼 수 있는 Tom Tango의 inside the book 블로그에서 벌어진 토론이다. 개인적으로는 거의 100개에 달하는 댓글을 통해 벌어진 이 온라인 토론을 매우 흥미진진하게 읽었는데... 혹 위의 링크에 가서 이 댓글들을 몽땅 읽고 "정말 재미있다"고 느끼시는 분이 있다면, 당신은 세이버메트릭스 매니아 혹은 Stathead/Stat Nerd로서의 자격이 충분하다. ^^

Eric/Matt은 SIERA가 항상 더 좋은 결과를 낸다고 주장하였으나, Tom Tango의 테스트 결과는 조금 다르다.

2002-09 시즌에 1500 PA 이상을 기록한 투수 중에서 가장 극단적인 그라운드볼 성향의 투수 20명에 대해 계산한 결과는 아래와 같았다.
투수 20명의 실제 ERA 평균 : 4.17
SIERA 평균 : 4.16
FIP 평균 : 4.14
이정도면 거의 비긴 것이다.

샘플을 "가장 볼넷을 적게 내준 투수 20명"으로 바꿔서 다시 계산해 보았다.
투수 20명의 실제 ERA 평균 : 3.95
SIERA 평균 : 3.98
FIP 평균 : 3.93
이것도 거의 비긴 것이다.

그럼 그라운드볼 + 적은 볼넷의 경우는? Tom Tango는 GB와 BB 분야에서 모두 평균에서 1 표준편차 이상 우수한 투수 9명에 대해 계산을 수행하였다.
9명의 ERA 평균 : 3.82
SIERA 평균 : 4.12
FIP 평균 : 3.94
여기서는 FIP의 승리이다.

Matt Swartz는 이에 대해 "High GB/High BB" 투수에 대해서는 SIERA가 더 정확하고, "High GB/Low BB" 투수에 대해서는 FIP가 더 정확한 것이 맞다고 대답하고 있다. Matt Swartz가 주장하는 SIERA의 강점은, 특히 그라운드볼과 볼넷이 모두 많은 투수의 경우, 볼넷으로 내보낸 주자를 병살 처리할 수 있기 때문에 FIP나 다른 스탯이 생각하는 것보다 ERA가 낮게 나타나고, SIERA는 이러한 특징을 잘 잡아낼 수 있다는 것이다.


어쨌거나... SIERA 및 위의 테스트에 대한 개인적인 의문점을 몇 가지 적어 보도록 하겠다.


1. Tom Tango도 지적한 부분인데... 위의 테스트에서 Year-to Year 부분을 시즌별로 나눠서 보면 아래와 같다. (이 Matt Swartz의 코멘트는 시리즈 4의 댓글에서 볼 수 있다. 독자의 질문에 대답하여 올린 것이다.)
BP staff member Matt Swartz
BP staff
(24824)

Sure. If that helps, I'll put it here in the comments--

Next-year ERA for
03-04, 04-05, 05-06, 06-07, 07-08, 08-09

SIERA 1.107 1.141 1.179 1.186 1.107 1.248
QERA 1.237 1.237 1.219 1.277 1.206 1.316
xFIP 1.284 1.403 1.211 1.404 1.287 1.311
FIP 1.120 1.230 1.298 1.236 1.170 1.283
tRA 1.162 1.202 1.273 1.216 1.171 1.307
ERA_pk 1.391 1.388 1.488 1.429 1.390 1.493


As you can see, it's ahead every time and offers a solid improvement if you compare the difference between the other estimators and regular ERA_pk to the difference between the other estimators and SIERA.

SIERA의 RMSE를 보면 흥미로운 부분을 발견할 수 있는데, 03-04에서 07-08까지는 RMSE가 1.107에서 1.186 사이에서 움직이다가, 08-09 시즌에서는 1.248로 이탈하는 것이다. 이는 SIERA가 2003년부터 2008년까지의 MLB 데이터를 가지고 만들어진 스탯임을 극명하게 반영하는 결과라고 하겠다. 이것이 일시적인 이탈인지, 아니면 앞으로 더욱 오차가 커질지는 몇 시즌을 더 두고 보아야 할 것 같다. 하지만, 분석 대상이 되는 시기가 바뀌어서 표본이 바뀌게 되면 오차가 커질 수 있다는 것은, 철저하게 회귀분석에 기반한 SIERA와 같은 스탯이 태생적으로 가지게 되는 약점이다.

FIP의 경우 1.12에서 1.298 사이에서 움직이고 있는데, 08-09년의 경우에도 이 범위 안에 들어 있으며, xFIP도 비슷한 양상을 보인다. 한편, QERA나 tRA의 경우는 SIERA처럼 08-09년에 약간 예외적인 모습을 보이고 있는데, 역시 SIERA와 비슷한 시기의 데이터에 최적화된 스탯이 아닌가 의심을 해 볼 수 있는 부분이 되겠다.


2. 비교 자체가 공정하지 않은 부분이 있다. SIERA는 처음부터 파크팩터 적용 ERA(Park-adjusted ERA)의 예측을 목표로 하여 이듬해의 파크팩터 적용 ERA를 가지고 각 변인에 대해 회귀분석을 실시하였다. 반면, FIP나 xFIP는 파크팩터가 전혀 고려되지 않은 스탯이다. 이들을 서로 비교하면 당연히 파크팩터 적용 상황에 최적화된 SIERA가 가장 우수하게 나올 수밖에 없다. 개인적으로는 FIP에 파크팩터를 적용해서 좀 더 공정한 환경을 만들어서 동일한 테스트를 수행해 보고 싶은데, 혹 실제로 테스트를 하게 되면 별도로 포스팅을 하도록 하겠다.


3. 내년 시즌의 파크팩터 적용 ERA가 과연 투수의 진짜 능력을 보여주는 가장 좋은 지표인지에 대한 의문이다. ERA는 늘 강조하다시피 투수와 수비수들이 함께 만들어내는 팀 기록이다. 순수한 투수 스탯이라고 보기가 어려운 것이다. Eric/Matt이 이런 점을 모를 리는 없다고 생각하는데, 그럼에도 불구하고 ERA를 다시 궁극적인 지표로 보고 ERA를 맞추는 것을 목표로 하여 스탯을 개발한 것은 이해가 잘 되지 않는다. 정말 이게 최선인 것일까? 올해의 ERA가 수비수의 실력이나 운에 의해 왜곡되어 있는 것이라면, 내년의 ERA 역시 마찬가지 아닐까?


4. SIERA가 맞추고자 하는 목표가 올해가 아니라 "내년" 시즌의 파크팩터 적용 ERA라는 점이다. 올해의 기록을 가지고 내년 시즌의 ERA을 맞추고자 한다면, 여기에는 내년의 퍼포먼스에 대한 예상치가 포함되게 된다. 그렇다면 선수의 나이에 대한 고려, 즉 Aging Curve를 포함시켜야 하는 것이 아닌가? 현재의 계산식은 모든 투수들이 1년 동안 똑같은 수준으로 나이를 먹는 것처럼 취급하고 있다. 30세의 투수가 올 시즌과 내년 시즌에 기록하는 ERA와, 40세의 투수가 올 시즌과 내년 시즌에 기록하는 ERA는 전혀 다른 것이 아닐까? 내가 위에서 언급한 대로 직접 SIERA에 대해 테스트를 수행한다면(그럴 시간이 된다면...), 나이가 다른 투수들 간의 비교도 해 보고자 한다.

궁극의 목적이 내년 ERA라는 점에서, SIERA는 FIP나 tRA보다는 CHONE이나 ZiPS와 같은 퍼포먼스 예측 시스템과 대결을 붙이는 것이 더 타당할지도 모른다.


5. 마지막으로, Eric/Matt의 테스트에서 xFIP가 상당히 안좋은 결과를 낸 부분이다. 이것은 매우 의외인데, 작년에 역시 BP 필진이기도 한 Colin Wyers가 The Hardball Times에 기고한 글에서, xFIP는 ERA를 예측하는 데 있어 FIP보다도 우수한 스탯으로 나타났었기 때문이다. 물론 Wyers의 테스트 방법은 시즌을 반으로 나누어 짝수 일의 등판 스탯으로부터 홀수 일의 ERA를 얼마나 잘 예측하는지를 살펴본 것으로 Eric/Matt과는 약간 다르지만, 그렇다고 해서 이렇게 정반대의 결과가 나올 수는 없다고 생각한다. 이러한 현상은 Colin Wyers 본인도 황당하게 느끼고 있는데, 아직 원인 규명이 되지 않은 듯하다.



개인적으로는 SIERA라는 새로운 스탯의 출현도 인상적이었지만, FIP의 우수성에 다시한번 감탄하는 계기가 되었다. FIP는 DIPS이론을 가장 간략하게 표현한 스탯으로, 사실 간단한 계산과 ERA Scale로의 변환을 위해 정확도를 약간 희생시킨 것이다. 그럼에도 불구하고, "다음 시즌의 파크팩터 적용 ERA"라는 적지에서의 원정 경기에서도 위에서 보는 바와 같이 해당 조건에 완전히 특화된 SIERA와의 대결에서 거의 밀리지 않고 대등한 결과를 내놓고 있다. FIP가 인플레이된 타구를 모두 제외하는 것에 대하여 많은 분들이 "투수도 BABIP를 분명히 일정부분 제어하므로, FIP는 잘못된 스탯이다"라고 주장하시는데, 이분들에게 이러한 테스트 결과를 보여 드리고 싶다. SIERA는 그라운드볼 비율을 매우 중요한 요소로 간주하여 계산하므로, 인플레이된 공에 대한 투수의 제어 능력을 인정하는 스탯이다. 그럼에도 불구하고, 인플레이된 공을 통째로 제외시킨 FIP가 똑같이 우수한 결과물을 내놓고 있는 것이다. 그것도 훨씬 간단한 계산식으로 말이다...!!!!!  이정도면 FIP를 믿고 사용해도 되지 않을런지???

물론, 투수의 퍼포먼스를 절대적으로 평가할 수 있는 단 하나의 스탯 같은 것은 없다. 이전 포스팅들에서 보여 드린 바와 같이, FIP와 xFIP, tRA, tRA* 등은 제각기 장단점을 가지고 있었고, 이는 SIERA도 마찬가지이다. 볼넷을 많이 내주는 투수들에게 상대적으로 정확한 반면, 볼넷을 적게 내주는 투수들의 경우는 이와 반대의 현상이 나타나는 것이다. Matt Swartz가 Tom Tango와의 토론 거의 끄트머리에서 남긴 댓글을 보면서 마무리하도록 하자.

Will doing a regression miss some things?  Absolutely. Will doing linear weights miss some things?  Absolutely. Will they miss different things?  Absolutely.  So let’s continue to do both.  If I told you only that a pitcher had a FIP of 4.00 and a SIERA of 3.50, and then I said you had to guess if a pitcher had an ERA above or below 4.00?  I hope you would guess below.  If I then asked if you to guess whether he had an ERA above or below 3.50, I would hope you would guess above.

결국 SIERA나 FIP나 각각의 장단점이 있으니 둘 다 잘 활용하자는 이야기이다. 결론이 너무 싱거운가? 애초에 단 하나의 절대적인 답을 바라는 것 자체가 무리이다. 세이버메트릭스는 진리 자체가 아니다. 그냥 조금이라도 진실에 가까이 다가가 보고자 하는 소박한 바램이 통계적인 기법을 타고 나타나는 모습일 뿐이다. 그것도 Tom Tango의 블로그에서 벌어진 난상토론과 같이, 일방적인 도그마가 아니라 많은 사람들이 참여하여 토론을 통해 풀어 나가는 민주적인 세계이다. 당장 답을 알 수 없고, 어디에나 오차가 있다고 하더라도, 진실을 조금이나마 알고 싶어하는 이러한 바램 자체가 잘못되어 있는 것은 아니지 않은가? 아니, 인간은 원래부터 이런 존재이지 않은가??


PS. Fantasy Baseball을 하시는 분들은 이러한 스탯의 특성을 잘 활용하면 도움이 될 것이다. 시즌 전에 드래프트를 할 때에는 직전 시즌의 SIERA를 바탕으로 투수를 선택하고, 시즌 중에 트레이드나 웨이버 픽업을 할 때에는 현 시즌의 FIP를 참고하는 전략이 어떨지?


Today's Music : Sheryl Crow - Always on Your Side (ft. Sting) (Official MV)



듣는 이의 심금을 깊이 울리는 명곡. Sting과의 듀엣 버전도 좋고 Sheryl Crow 혼자 부른 앨범의 버전도 좋다.
Posted by FreeRedbird

댓글을 달아 주세요

  1. BlogIcon drlecter 2010.02.22 16:48 신고 Address Modify/Delete Reply

    글 고맙습니다. 안 그래도 VEB에 얼마전에 tom.s인가 vivaelpujols인가가 세이버 스탯들 좌악 나열하면서 SIERA를 언급해서 이게 뭔가 그랬었는데 ㅎㅎ FIP는 삼진이 적은 투수에게 지나치게 가혹한 스탯이라고 생각은 하지만, 보면 볼수록 우수한 스탯이라는 것에는 동감합니다.

    • BlogIcon FreeRedbird 2010.02.25 18:32 신고 Address Modify/Delete

      그건 아마 vivaelpujols의 글이었을 겁니다. VEB 뿐 아니라 Beyond the Box Score와 The Hardball Times까지 활동 영역을 넓혀서 왕성하게 포스팅을 하고 있죠.

  2. BlogIcon Q1 2010.02.23 05:09 신고 Address Modify/Delete Reply

    그래도 환타지에선 승수가 중요하기 때문에 승빨 좋은 투수가 킹왕짱입죠 ^^;;
    어차피 다 좋은 투수는 비싸고 중반에 영입은 어딘가 모자라도 승빨 좋은 (운 좋은) 투수가 짱인거 같아요.
    운 좋은 놈 못 당한다는 옛말도 있듯이 말이죠 ^^;;

    • BlogIcon FreeRedbird 2010.02.25 18:33 신고 Address Modify/Delete

      하긴 SIERA나 FIP를 기준으로 해 봐야 ERA 한 항목에서 이길까말까한 것이니까요... 역시 승수가 짱이겠죠.

      사실 저는 판타지 완전 초보입니다. 올해 처음 참여하는 중입니다. ㅎㅎㅎ

    • BlogIcon Q1 2010.02.26 02:05 신고 Address Modify/Delete

      K/BB비율이 좋은 투수이니 삼진을 추가하면서 볼넷 증가는억제할 수 있으니 괜찮은 관점입니다만.. 보통 투수 볼넷은 그냥 WHIP에 포함시키는 경우가 많아서요. 그냥 볼넷 많더라도 삼진 갯수가 많고 승빨 좋은 투수를 (중간급 중에서는) 개인적으로 선호하죠 ^^;
      사실 에이스들은 부상만 안 당해주면 (승운은 팀사정이고) 거기서 거기인지라 ^^;;;

  3. BlogIcon 홈런강탈 2010.03.01 21:07 Address Modify/Delete Reply

    최근에는 국내야구에 너무 빠져버려서 국내선수에게 적용시키기는 SIERA는 그림의 떡이군요 ㅋ 저두 FIP를 선호하는데 특히 구원투수에게 ERA는 크게 의미를 두지 않는데요. 근데 유동훈의 올시즌 0.53의 방어율이 FIP로 3.29정도가 나오는걸 보면 좀 난감한데 라는 생각이 들기도 하네요. 이런 극단적인 경우는 ERC로 보는게 나은가 라는 생각도 들었어요 ㅎ

    • BlogIcon FreeRedbird 2010.03.02 15:43 신고 Address Modify/Delete

      구원투수는 시즌당 이닝 수가 너무 적어서 분석하기가 매우 어렵습니다. 선발투수도 예측이 어려운 판에.. marcel projection을 보면 선발투수들이 대체로 0.8 정도의 신뢰도를 가지는 데 비해 구원투수들은 0.5 정도에 머물고 있죠...

    • BlogIcon 홈런강탈 2010.03.02 22:10 Address Modify/Delete

      그렇긴 하네요. 유동훈의 FIP를 계산했더니 3.29던데 내년시즌 그 정도 성적을 거둘수도 있다는 생각이 들고. 확실히 릴리버들은 예측이 어렵네요 ㅎ

  4. 버스터포지 2011.07.20 21:30 Address Modify/Delete Reply

    오늘 보니까 FanGraphs 투수 스탯 'Advanced' 탭에 SIERA가 추가됐더군요. ㅎㅎ

  5. ss 2012.07.17 23:35 Address Modify/Delete Reply

    FIP이 좋기한데 케인 같은 선수는 왜 그럴까요? 현지 세이버메트리션들은 케인에 대해서 어떤 식으로 평가하는지 궁금해지네요.

    • BlogIcon FreeRedbird 2012.07.18 00:57 신고 Address Modify/Delete

      Matt Cain은 커리어 내내 낮은 BABIP를 유지하고 있고, 이것이 FIP나 xFIP에 비해 낮은 ERA를 기록하는 주된 이유가 되고 있습니다. 메이저리그에서 1,444 이닝을 던졌으니 이쯤되면 운이 아니라 실력이라고 인정해야 합니다. 그에게는 남들보다 안타를 덜 맞는 특별한 능력이 있는 것이죠.

      그가 왜 이런 특별한 능력을 가지게 되었는지에 대해 아직 명확한 설명은 없으나, 다음의 두 글을 참고하시기 바랍니다.

      http://www.fangraphs.com/blogs/index.php/matt-cain-as-an-example-in-beating-the-spread/
      http://www.fangraphs.com/blogs/index.php/matt-cain-destroyer-of-dips/

      Cain 같은 경우는 FIP나 xFIP가 제대로 나타내지 못하는 skill을 보유하고 있다고 봐야겠지요. 모든 법칙에 예외가 있듯이 FIP도 마찬가지 입니다. 그래도 FIP가 유용한 이유는 1) 쉽고, 2) 투수와 명확히 관련된 사건들만 반영되고, 3) 예외가 적습니다.

  6. 001 2012.07.21 16:16 Address Modify/Delete Reply

    근데 근래에 팬그래프에서 제공되는 tERA는 거의 에러 수준이네요.

    • BlogIcon FreeRedbird 2012.07.22 00:37 신고 Address Modify/Delete

      글쎄요.. 제가 보기엔 그렇게 문제가 많은 것 같지는 않은데요.
      http://www.fangraphs.com/leaders.aspx?pos=all&stats=pit&lg=all&qual=y&type=1&season=2012&month=0&season1=2012&ind=0&team=0&rost=0&age=0&players=0&sort=19,a

      tERA순으로 정렬시켜서 보면, 그런대로 납득할 만한 순서의 리스트라고 생각합니다. 스탯 자체의 결함으로 인해 전반적으로 다소 높게 나타나는 문제가 있긴 합니다만...

우리는 그 동안 타자의 생산성을 평가하기 위한 보다 발전된 스탯으로 wOBA, wRAA 등을 살펴보았고, 타자를 종합적으로 평가하기 위한 WAR의 계산 방법도 살펴본 바 있다.

그런데, OPS 대신 wOBA나 wRAA를 사용할 수 있다고 하더라도, 이 블로그에 wOBA를 소개하는 글을 쓸 당시 OPS+를 대체할 개량 스탯은 아직 없었다. OPS+는 비록 OPS가 갖는 단점을 그대로 가지고 있기는 하지만, 계산 과정에서 파크 팩터를 적용하여 홈구장으로 인한 왜곡을 보정하고, 리그 평균에 대한 상대적인 값을 계산함으로써 리그에 대해서도 보정해 주는 효과를 가진다. 또한 항상 100이 평균이 되므로, 특정 타자가 리그 평균에 비해 얼마나 좋은(혹은 나쁜) 활약을 했는지를 한 눈에 쉽게 알 수 있다는 장점이 있다.

그러던 중, Fangraphs에 wRC+가 소개되었다. 이는 한 마디로 wOBA의 OPS+ 버전이라고 할 수 있는데... 이제부터 자세히 살펴보고자 한다.

설명을 위해, 이전에 WAR 계산 설명 때 사용하였던 2009년 Chase Utley와 Joe Mauer의 스탯을 다시 이용하기로 하였다. 계산에 사용된 엑셀파일을 첨부하니 참고하시기 바란다.


1. wRC

wRC는 weighted RC이다. Bill James의 RC와 유사한 것 같지만 계산 방법은 매우 다르다. wRC는 앞의 w에서 알 수 있듯이, wOBA를 기반으로 계산된 것이다.

RAR이나 WAR 같은 스탯은 "Above Replacement Level"이므로, 비교 대상이 Replacement Level 플레이어이다. 즉, WAR=0이면 Replacement Level 플레이어라는 이야기이다. 또한 wRAA는 "Above Average"이므로, 비교 대상은 리그 평균이다. 즉, wRAA=0이면 타격 기여 수준이 딱 리그 평균 수준이라는 이야기가 된다.

반면, wRC는 비교 대상이 "0"이다. 타석에 마네킹을 그냥 세워두어서 마네킹이 .000/.000/.000을 기록했을 때와 비교해서 해당 타자의 득점 기여 수준을 평가하는 것이다. (마네킹이 볼넷이나 HBP로 출루하는 어이없는 경우는 없다고 치자. -_-;;; )

이러한 wRC의 개념을 생각하면, wRAA로부터 쉽게 계산이 가능하다. 해당 타자의 wRAA를 알고 있으면, 해당 타자가 리그 평균보다 얼마나 더 많은 기여를 했는지 알 수 있으므로, 이제 여기에다가 마네킹과 리그 평균 사이의 차이를 더해 주면 바로 wRC가 된다. 다시 말해서 아래와 같은 식이 된다.

wRC = wRAA + 리그 평균 타자의 득점 기여 수준 = wRAA + (lgR/lgPA)*PA
lgR : 리그 전체 득점
lgPA : 리그 전체 타석

구체적인 예를 통해 계산을 해 보자.

위의 첨부 파일을 보면 2009년 Chase Utley의 스탯이 있다. 그의 wRAA는 파크팩터를 적용하여 계산하면 37.45가 나온다. (주: Fangraphs는 wRC 계산 시에는 파크팩터를 쓰지 않고, wRC+를 계산할 때 파크팩터를 사용하는데, 여기서는 그냥 wRC 계산 때부터 파크팩터를 적용하도록 하겠다.)

이제 "리그 평균 타자의 득점 기여 수준"을 계산해 보자. 2009년 NL 리그 전체 기록을 보면, 99,531 타석(PA)에서 11,482 득점이 발생하였다. 따라서, 1 타석의 평균적인 득점 기여 수준은 11482/99531 = 0.12 점 임을 알 수 있다.

Utley는 2009년에 687 PA를 기록했으므로, 그가 2009년에 기록한 wRC는 687 PA를 통해 기록한 wRAA에 687 PA를 리그 평균 타자가 기록했을 때의 득점 기여 수준을 합치면 될 것이다. 즉, 아래와 같이 계산하면 된다.

Chase Utley의 wRC
 = Utley와 마네킹의 연간 득점 기여 수준 격차
 = Utley와 리그 평균의 연간 득점 기여 수준 격차 + 리그 평균과 마네킹의 연간 득점 기여 수준 격차
 = wRAA + (0.12 * 687)
 = 116.70


Chase Utley는 687 타석에서 마네킹을 세워두는 것에 비해 팀 득점에 116.70점을 기여한 것이다.


혹은, wRAA가 아니라 wOBA로부터 계산하고자 한다면, wRAA = ((wOBA-lgwOBA)/1.15)*PA 를 wRAA 자리에 대입하면 된다.

wRC = wRAA + (lgR / lgPA) * PA
        = (wOBA - lgwOBA) / 1.15) * PA + (lgR / lgPA) * PA
        = ((wOBA - lgwOBA) / 1.15 + (lgR / lgPA)) * PA


2. wRC+

이제 이 116.70점이 같은 리그의 다른 타자들과 비교해서 얼마나 대단한 정도의 공격 기여 수준인지를 살펴보자.
wRC+는 아래와 같이 계산한다.

wRC+ = (((wRAA / PA) / (lgR / lgPA)) + 1) * 100

계산식을 보면, 1타석당 득점 기여 수준을 가지고 비교를 하게 됨을 알 수 있다.

분모를 보면, 리그 전체의 1타석당 득점 기여 수준이다. 위의 예에서는 0.12로 계산되었다.

분자를 보면, wRAA를 해당 타자의 타석으로 나누고 있으므로, 1타석당 해당 타자와 리그 평균간 득점 기여 수준의 차이가 된다. Chase Utley의 경우는 37.45/687 = 0.0545가 된다.

여기에 리그 평균을 100으로 만들어주기 위해 1을 더하고 100을 곱해서 계산한다.

Chase Utley의 wRC+는 이렇게 해서 147이 된다. 첨부파일을 참고하시기 바란다.


Joe Mauer의 경우에는 AL에 속해 있으므로 lgR과 lgPA 자리에 AL의 데이터를 넣어 주어야 한다.
이렇게 해서 계산하면 wRC는 133.23, wRC+는 176이 나온다. 엄청난 시즌을 보냈음을 알 수 있다.
(Fangraphs에서는 Mauer의 wRC+를 174로 계산하고 있다. 파크팩터의 적용 방법, 소숫점 반올림 등에 따른 약간의 오차가 발생함을 감안하시기 바란다.)

OPS+와 비교하면 어떨까? 2009년 Utley의 OPS+는 136이었고, Mauer의 OPS+는 170이었다.
이것은 OPS+가 특히 Utley를 저평가하고 있음을 의미한다.


2009 시즌 wRC+와 OPS+의 메이저리그 TOP 10 비교이다.
OPS+는 Baseball-Reference에서 가져왔고, wRC+는 아직 시즌별 비교데이터가 제공되지 않아 Fangraphs에서 선수별 데이터를 직접 일일이 클릭해서 만들었다. -_-;;

wRC+
Albert Pujols 184
Joe Mauer 174
Prince Fielder 163
Adrian Gonzalez 158
Joey Votto 157
Hanley Ramirez 155
Ben Zobrist 154
Ryan Braun 153
Derrek Lee 153
Kevin Youkilis 153

OPS+
Albert Pujols 188
Joe Mauer 170
Prince Fielder 168
Adrian Golzalez 166
Joey Votto 155
Mark Teixeira 149
Hanley Ramirez 148
Ryan Braun 148
Alex Rodriguez 147
Ben Zobrist 146


참고 : 왜 wOBA+나 wRAA+를 쓰지 않고 wRC+를 쓰는 것일까?

Chase Utley의 wOBA+를 계산해 보자.
Utley의 2009년 wOBA는 0.390이고, NL 평균 wOBA는 0.328이었으므로,

((0.390 / 0.328) * 100 = 119

이렇게 하면 OPS+나 wRC+에 비해 훨씬 좁은 범위에 결과값이 분포하는 스탯이 만들어진다. 우리에게 익숙한 OPS+와 유사한 스케일인 wRC+를 사용하는 것이 이해도 빠르고 한 눈에 알아보기도 쉬울 것이다.

한편, wRAA+는 계산이 불가능하다. 리그 평균이 0이기 때문에, 분모가 0이 되어 버리는 것이다.

Today's Music : David Bowie - Five Years (Live)



이런 게 "음악"이다.
Posted by FreeRedbird

댓글을 달아 주세요

  1. 홈런강탈 2010.02.03 23:09 Address Modify/Delete Reply

    재밌게 봤어요. WOBA관련 스탯은 좀 더 직관적이고 이해하기 쉬워서 좋은 것 같네요. 다른 글들도 쭈욱 보고있어요^^

    • BlogIcon FreeRedbird 2010.02.04 13:34 신고 Address Modify/Delete

      Tom Tango의 스탯들은 상대적으로 계산이 쉬우면서도 직관적이고 명확한 논리를 가지고 있어서요... 저도 세이버메트릭스에 대해 글을 쓸 때에는 거의 그의 편에 서서 이야기를 하게 되네요. 현재 가장 뛰어난 세이버메트리션을 딱 한 사람만 꼽으라면, 저는 Tom Tango를 선택할 것 같습니다. Bill James, Clay Davenport, Nate Silver와 같은 쟁쟁한 사람들을 모두 제치고 말입니다.

      그가 Cardinals가 아니라 Mariners에 고용되어 일하고 있다는 게 안타깝네요...

  2. 호머 2012.07.19 19:09 Address Modify/Delete Reply

    잘봤습니다. 어틀리가 제 생각보다 훨씬 좋은 선수였네요. ㅎㄷ
    (헌데 엑셀 파일에 포함된 것과 같은 항목별 파크팩터는 어디서 찾아볼 수 있는 건가요?)

    • BlogIcon FreeRedbird 2012.07.22 00:41 신고 Address Modify/Delete

      09년 당시에 제가 사용한 Park Factor는 http://fantasy411.mlblogs.com 에서 가져온 것이었는데, 이 블로그가 지금은 없어진 것 같습니다. 지금 이런 계산을 하려고 하신다면.. Fangraphs의 Park Factor를 사용하시면 됩니다.

      http://www.fangraphs.com/guts.aspx?type=pf&teamid=0&season=2011

드디어, 오랫동안 마음속에 무거운 짐(?)으로 남아 있던 구원투수의 WAR 계산에 대해 포스팅을 하게 되었다.

구원투수의 WAR 계산은 기본적으로 선발투수의 WAR 계산과 동일한 방법으로 수행한다. (선발투수의 WAR 계산은 이 글을 참고) 하지만, 불펜 특유의 독특한 운용 방식으로 인해, 계산시에 추가적으로 고려해야 할 사항이 생긴다. 예를 들어, 똑같이 ERA 3.0을 기록한 두 릴리버가 있는데, 투수 A는 클로저로 위기 상황에 주로 등판하였고 투수 B는 주로 패전처리용으로 기용되었다면, 비슷하게 실점을 허용했다고 해도 두 투수가 팀 승리에 기여한 바는 전혀 다른 것이다.


1. LI를 고려해야 하는 이유

우리는 앞의 글에서 LI(Leverage Index)에 대해 살펴보았다. 선발투수는 본인이 직접 게임을 시작하며, 게임이 흘러감에 따라 LI가 늘어나기도 하고 줄어들기도 한다. 일반적으로 선발투수들의 평균 LI는 1이다. 또한, 안타와 볼넷, 사사구를 연속으로 허용하여 주자 만루를 만들어서 LI가 올라갔다면, 그것은 전적으로 본인의 책임이므로, 본인이 위기를 자초한 뒤에 스스로 해결했다고 해서 특별히 그것을 칭찬할 이유도 없다.

하지만, 구원투수는 사정이 다르다. 감독이 어떤 투수를 LI 2.0 인 상황에서 마운드에 올렸다면, 이 투수가 잡아내는 아웃이나 이 투수가 허용하는 실점의 가치는 평균적인 상황의 2배에 달하는 것이다. 이러한 위기 상황을 무실점으로 잘 막아냈다면, 이 무실점 역투의 가치 역시 평균적인 상황의 2배이다. 구원투수는 본인의 의지나 희망과 상관없이 타의에 의해 특정 상황에 투입되어 역할을 수행하므로, 역할의 경중에 따라 가치를 조정 평가해 주는 것이 타당할 것이다.

여기에서 각각의 상황이 갖는 중요도는 LI로 평가할 수 있다. 예를 들어 메이저리그 클로저들의 평균 gmLI는 1.8 정도이므로, 이들은 평균적인 상황보다 1.8배 중요한 상황에 보통 등판한다는 의미가 된다.

그러면, 클로저들의 WAR을 선발투수와 같은 방식으로 구한 뒤에, 1.8배 해 주면 되는 것이 아닐까? 아쉽게도 현실은 그렇게 단순하지가 않다.


아래의 내용은 글만 읽어서는 이해하기가 쉽지 않을 수도 있다. 진지하게 접근하고자 하시는 분들은 첨부된 엑셀파일의 계산을 꼭 참고하시기 바란다. 또한, 나중에 다시 언급하겠지만, 2009년 MLB 클로저들에 대한 WAR 계산 결과도 포함되어 있다.




2. Bullpen Chaining Model

MLB 팀들은 보통 12인 투수진(선발 5명 + 구원 7명)을 운용한다. 예를 통해서 불펜이 어떻게 운용되는지를 살펴보자. 이 예는 Sky Kalkman의 글에서 퍼온 것이다. 참고로, Kalkman의 예는 Tom Tango의 오리지널 모델을 다듬은 것이다.

CASE 1

여기에 어떤 팀의 7명짜리 불펜이 있다. 감독은 이 7명에게 각각의 역할을 부여하고 있으며, 평균적으로 아래와 같은 상황에서 각각의 투수를 기용한다고 하자. 한 시즌 동안, 이 7명의 투수들은 각각 72이닝씩을 던졌다고 치자. 투수의 실점 방어 수준은 편의상 ERA를 사용한다.

ERA  LI
3.00  1.8  (CL)
3.75  1.3  (Setup #1)
4.00  1.0  (Setup #2)
4.25  0.9  (Middleman #1)
4.50  0.8  (Middleman #2)
4.70  0.7  (Middleman #3)
4.80  0.6  (Mop-up)

이들의 평균 LI는 1이고, 평균 ERA는 4.14이다. 이들이 72 x 7 = 504 이닝을 던지는 동안 내준 자책점(ER)은 총 232점이다. 그러나, 등판 상황의 중요도에 따라 실점의 가치가 달라지므로, 각 투수의 ERA에 LI를 곱해서 leveraged ERA를 구할 수 있을 것이다. 예를 들어 클로저의 3.00 ERA를 leveraged ERA로 바꾸면 1.8 x 3.00 = 5.40 이 된다. 이러한 방식으로 leveraged ERA를 구하고, 이를 바탕으로 leveraged ER을 구해 보면, 504 이닝동안 총 223점을 내준 것이 된다.


CASE 2

이번에는 위의 팀에서 클로저가 시즌 개막 직전에 교통사고로 시즌아웃 되었다고 가정하자. 이미 시즌 개막이 임박하여 FA시장에 좋은 릴리버는 남아있지 않고, 다른 구단들과의 트레이드도 잘 되지 않아서, 이 팀은 결국 AAA에서 Replacement Level 릴리버를 로스터에 포함시키게 된다. 그런데 여기서, Replacement Level 릴리버를 클로저로 대신 기용하는 팀은 어디에도 없을 것이다. 바로 이 부분이 문제가 된다.

대부분의 감독은 이런 경우에 ERA 3.75의 셋업맨 #1을 클로저로 돌리고, 나머지 릴리버들의 역할을 하나씩 올린 다음, 방금 AAA에서 올라온 신참 릴리버에게 Mop-up 역할을 맡길 것이다. 이 리그의 Replacement Level Reliever의 ERA가 4.85라고 하면, 이 팀의 새로 구성된 불펜은 아래와 같다.


ERA  LI
3.75  1.8 (CL)
4.00  1.3 (Setup #1)
4.25  1.0 (Setup #2)
4.50  0.9 (Middleman #1)
4.70  0.8 (Middleman #2)
4.80  0.7 (Middleman #3)
4.85  0.6 (Mop-up)  <-- AAA에서 올라온 신참

상황이 이해가 되시는지?

이 7명이 똑같이 72이닝씩 던졌다고 하고, 위에서와 같이 leveraged ERA 및 leveraged ER을 구해보면, 504 이닝 동안 이들이 내준 레버리지 자책점(leveraged ER)은 242.2점이 된다. 이제 ERA 3.00의 클로저가 전력에서 이탈하고 대신 Replacement Level 릴리버를 한 명 넣게 됨으로써 이 팀이 추가로 얼마나 실점하게 되는지 알 수 있다.

242.2 - 223.0 = 19.3   (반올림으로 인해 0.1점의 오차 발생)

이 팀은 19점을 더 실점하게 되었다. 즉, 이 팀의 불펜에 있어서 ERA 3.00의 클로저가 Replacement Level 투수에 비해 팀 실점을 막는데 기여하는 수준(RAR: Runs Above Replacement Level)은 19.3점이며, 대략 10점=1승이라고 치면 이 클로저의 WAR은 1.9 정도가 된다.

이렇게, 불펜에서 한 명이 빠질 경우 체인으로 연결된 것처럼 역할이 차례차례 변경된다는 의미에서, 위와 같은 불펜 설명 모델을 Bullpen Chaining 이라고 한다.


CASE 3

만약 이러한 체인 효과를 무시하고 계산하면 결과가 어떻게 달라지는지 살펴보자.

위의 예에서, 클로저가 시즌아웃된 뒤에, 감독이 다른 투수들의 역할은 그대로 둔 채 방금 AAA에서 올라온 신참 구원투수를 클로저로 기용하는 만용을 부렸다고 가정하자. 불펜 구성은 아래와 같이 바뀐다.

4.85  1.8  (CL) <-- AAA에서 올라온 신참
3.75  1.3  (Setup #1)
4.00  1.0  (Setup #2)
4.25  0.9  (Middleman #1)
4.50  0.8  (Middleman #2)
4.70  0.7  (Middleman #3)
4.80  0.6  (Mop-up)

이 7명이 똑같이 72이닝씩 던졌다고 하면, 504이닝에서 이 불펜의 leveraged ER 총합은 249.6점으로 나타난다. 이렇게 되면 CASE 1과 비교할 때, 클로저의 RAR이 26.6점이 되어 클로저의 WAR는 2.7로 계산된다.

CASE 2와 CASE 3 중에 어느 쪽이 현실에 가까운지는 명약관화하다고 본다. ERA 4.85의 Replacement Level 구원투수를 클로저로 기용하는 팀은 없을 것이므로, CASE 2와 같이 생각함이 더 타당하다. CASE 3의 계산법은 0.7~0.8 WAR 정도 클로저를 과대평가하게 되는 것이다.


3. WAR 계산시 LI의 조정 적용

클로저의 LI가 1.8이라고 해서, 1.8의 LI를 그대로 곱해 주면, 해당 선수가 맡았던 역할을 그대로 Replacement Level 선수에게 맡기는 모습이 되어 위의 CASE 3과 같은 결과가 되어 버린다. 불펜 운용을 이렇게 하는 팀은 별로 없으므로, 체인 효과를 고려하여 LI를 조정해 주어야 할 것이다.

구원투수의 WAR 계산을 위해 현재 Tom Tango나 Fangraphs 사이트가 사용하고 있는 조정 LI는 아래와 같다.

Effective LI = (1 + gmLI) / 2

(gmLI : 구원투수가 경기에 투입되는 순간의 LI)

이 식을 위의 Chaining Model 예에 적용해서 클로저의 WAR를 다시 구해보자.

클로저의 ERA는 3.00이었고, Replacement Level 구원투수의 ERA는 4.85였다.
클로저의 LI는 1.8이었으므로, Effective LI는 (1+1.8) / 2 = 1.4 이다.
이 클로저가 Replacement Level 투수에 비해 덜 실점하는 점수는 (4.85 - 3.00) * 72 / 9 = 14.8 이다.
클로저라는 역할 및 체인 효과를 감안해주기 위해 Effective LI를 곱해 주면,

14.8 * 1.4 = 20.7

이것이 클로저의 RAR이다.
따라서, WAR은 20.7 / 10 = 2.1이 된다.

앞의 예에서 직접 체인 효과를 돌려 보아서 얻은 클로저의 WAR은 1.9였다. 0.2의 오차가 생기고 있는데, 이는 체인 모델이 모든 투수가 72이닝씩 똑같이 던진다는 다소 비현실적 가정을 하고 있다는 점에 주로 기인하는 것이다. 하지만, 각 팀마다 동료 불펜투수들의 구성은 조금씩 다르고, 이에따라 체인 효과도 조금씩 다르게 나타나므로, 위와 같은 Effective LI 공식이 100% 맞는다고 볼 수도 없다. 이 클로저의 진정한 WAR은 아마도 1.9와 2.1 사이의 어딘가에 위치하고 있을 것이다. 아마도 2.1에 가까운 쪽이 되겠지만 말이다. 위에서 언급한 Sky Kalkman의 글에도 나와 있지만, Effective LI의 공식은 아직 조금 더 정교해질 수 있는 여지가 있으며, 그러한 연구도 계속 진행되고 있다.


4. 2009년 MLB 구원투수들의 WAR 계산

계산 방법은 기본적으로 선발투수 WAR 계산과 동일하지만, 두 가지를 고려해 주어야 한다.
1) Replacement Level 구원투수의 기대 승률은 .470 이다. (선발투수는 .380이었다.)
2) 구원투수의 역할에 따른 중요도를 Effective LI를 통해 감안해 준다.

또한, 선발투수 때 ERA/RA 비율을 그냥 0.92로 계산했던 것과는 달리, 실제 2009 시즌의 리그 총 ERA와 리그 총 RA로부터 비율을 계산하여 약간이나마 정확도를 높이려고 노력하였다.

위에서 보여 드린 첨부파일에는 Bullpen Chaining 모델 뿐 아니라 2009 시즌 메이저리그 클로저들의 WAR 계산 결과도 들어 있으므로, 받아서 확인해 보시기 바란다. 특히 누가 과대평가되고 있는지, 한 눈에 확인할 수 있을 것이다.


Today's Music : Chage & Aska - On Your Mark

Official MV (지브리 애니메이션)


Live


말이 필요 없는 명곡. 뮤직비디오도 너무 좋다.
Posted by FreeRedbird

댓글을 달아 주세요

  1. BlogIcon lecter 2010.01.21 19:33 Address Modify/Delete Reply

    바로 며칠 전에 데이브 카메론이 글을 올렸었죠.(http://www.fangraphs.com/blogs/index.php/war-and-relievers) 실제 수치로 설명해 주셔서 감사합니다 :)

    • BlogIcon FreeRedbird 2010.01.22 18:31 신고 Address Modify/Delete

      지금의 WAR 계산이 클로저를 과소평가한다고 주장하는 사람들이 있지요... 저는 Dave Cameron의 논리에 대체로 동의합니다. 워낙 던지는 이닝이 적으니 LI를 고려해 주더라도 여전히 좋은 포지션 플레이어들보다는 기여도가 낮을 수 밖에 없는 것이죠.

  2. 발전없는푸홀스 2010.01.22 22:48 Address Modify/Delete Reply

    안녕하세요 역시 세이버매트릭스의 세계는 놀랍네요~

    근데 위에 첨부하신 엑셀파일에 09년 클로저들의 war가 없는거 같은데 저만 그런건가요?

    그냥 case 1,2,3밖에없는거같은데..,

    • BlogIcon FreeRedbird 2010.01.25 09:30 신고 Address Modify/Delete

      안녕하세요... 주말 내내 아기와 시간을 보내다 보니 답이 늦었습니다. ^^

      엑셀 파일을 열어서 화면의 아래쪽을 보시면 "2009_Relievers"라는 탭이 있습니다. 그걸 누르시면 2009년 클로저 14명의 WAR 계산 결과를 보실 수 있습니다.

  3. 푸홀스처럼 2011.09.11 15:48 Address Modify/Delete Reply

    에릭 가니에의 WAR이 솔직히 4.3정도밖에 되지 않는다는 데 실망했습니다.
    WPA로 볼 경우 가니에는 세시즌 연속 2위안에 들정도로 엄청난 공헌도와 임팩트를 보여줬는데 WAR로 볼 경우 너무 박한 거 아닌가 싶을 정도로 허무하더라고요. 가니에의 2003년을 x2해줘도 00페드로만 못한 가치라는 건 좀 말이 안되는 거 같아요.

    • BlogIcon FreeRedbird 2012.02.17 18:04 신고 Address Modify/Delete

      너무 늦게 답변을 드리는 것 같네요. 구원투수는 이닝 수가 적다보니 아무래도 WAR과 같은 시스템에서 좋은 평가를 받기가 어렵습니다. high-leverage 상황에서의 등판에 대해 얼마나 가중치를 적용해 줄 것인가가 관건이 되겠네요. 현재의 구원투수 평가 시스템은 개선의 여지가 있는 게 사실입니다.

  4. 진흙 2012.02.15 21:56 Address Modify/Delete Reply

    좋은 글 잘 읽었습니다.
    다만 이해가 안 되는 점이,
    case 2에서
    ERA LI
    3.75 1.8 (CL)
    4.00 1.3 (Setup #1)
    4.25 1.0 (Setup #2)
    4.50 0.9 (Middleman #1)
    4.70 0.8 (Middleman #2)
    4.80 0.7 (Middleman #3)
    4.85 0.6 (Mop-up) <-- AAA에서 올라온 신참
    가 된 다음에 다시 보정을 해 줘야 하는 것 아닌가요?
    (제일 위의 선수만 보자면) LI 1.3의 상태에서 3.75를 던지던 선수가
    LI 1.8의 상황에서 이제 던지게 되었을때, 방어율을 그대로 3.75로 계산한다는 것이 저는 이해가 되질 않네요.
    실제 계산은 해보지 않았지만, 각 선수들이 체인으로 이동해서 각 상황에서의 보정 방어율이 적용된다면 결국 case 3쪽에 더 가까워 질 것 같아 보이는데요.
    이해를 위한 예이고, 이것까지 계산해서 보정한 것이 최종이란 것인가요? (물론 아직 완벽한 계산식은 나오지 않았겠지만요)

    • BlogIcon FreeRedbird 2012.02.17 18:07 신고 Address Modify/Delete

      죄송합니다만 제가 질문을 잘 이해하지 못하고 있는 것 같습니다. 본문에서 각 case의 비교는 leveraged ER로 하고 있으므로, 말씀하신대로 보정이 이루어지고 있는 것 아닐까요? case 2의 클로저의 경우에도 3.75를 그대로 사용하고 있지는 않고요. 계산과정에서 LI를 반영해 주고 있습니다.

  5. pa8055 2016.08.16 22:19 Address Modify/Delete Reply

    너무 오래된 글이라 답해주실지지는 모르겠는데 선발이랑 중계 둘다 나왔다면 선발 따로 중계 따로 구해서 더하면 되나요??

앞에서 "WPA(Winning Probability Added)"를 살펴본 바 있다.

WPA는 이미 벌어진 일에 대한 평가이다. 어떤 이벤트(홈런, 병살, 삼진, 볼넷 등...)가 벌어졌을 때, 그 이벤트로 인해 해당 팀의 기대 승률이 얼마나 변했는지를 통해, 해당 이벤트가 승부에 끼친 영향력의 정도를 평가하는 것이다.

그렇다면, 현재 타석에 들어선 타자가 승부에 끼칠 수 있는 영향력의 정도는 어떻게 되는 것일까? 이 타자의 타석에서 벌어질 수 있는 여러 이벤트들과 그들로 인하여 변하게 되는 WPA의 변화 정도를 가중 평균하면 해당 타석에서 평균적으로 일어나는 WPA의 변화 수준을 얻을 수 있는 것이다. 이것이 바로 특정 순간이 승부에 미치는 중요도, 즉 LI(Leverage Index) 이다.

WPA나 LI는 Tom Tango의 발명품이므로, 그가 The Hardball Times에 직접 기고한 예를 가지고 LI를 이해하여 보자.

9회 초, 홈팀이 원정팀에 3점 차로 앞서 있다. 노아웃에 주자 1, 2루. 원정팀이 한 방으로 경기의 흐름을 바꿀 수도 있는 상황이다. 메이저리그에서, 이러한 상황에 놓인 홈팀이 결국 이 경기를 승리로 가져갈 확률은 경험적으로 0.841이다. 예를 간단하게 하기 위해, 여기에서 원정팀의 타자가 타격을 했을 때, 결과는 안타와 삼진 밖에 없다고 하자. 안타를 치면 원정팀이 1점을 득점하며, 상황은 무사 1, 3루로 바뀐다. 반면, 삼진을 당하면 1사 1, 2루가 된다. (Tango의 예에서는 "안타"와 "주자가 진루하지 않는 아웃"이므로, 그냥 아웃을 삼진이라고 표현하였다.) 이 타자는 33%의 확률로 안타를 치고 67%의 확률로 삼진을 당한다고 하자.

이 타자가 안타를 쳐서 2점차에 무사 1, 3루가 되면, 홈 팀의 WPA는 0.701로 내려가게 되어 원래 WPA에서 0.140이 감소한다. 반면, 이 타자가 삼진을 당해서 3점차에 1사 1, 2루가 되면, 홈 팀의 WPA는 0.910으로 올라가게 되어 원래 WPA에 비해 0.069가 증가한다.

이제 각각의 이벤트에 대해 발생 확률과 기대 승률의 변화 정도를 가지고 가중 평균을 구해 보자.

0.33 * 0.140 + 0.67 * 0.069 = 0.09243

이것이 바로 이 타석에서 발생할 수 있는 WPA의 변화 수준이다. 이 계산 과정에서 WPA의 변화 값의 절대값을 사용하고 있음에 유의해야 한다. 홈팀이 유리해졌는지, 불리해졌는지는 생각하지 않는 것이다. 오직 승부가 얼마나 크게 변할 수 있는가만 살펴보는 것이다.


이 0.9243이라는 숫자가 얼마나 큰 숫자인지를 알기 위해서는, 절대적인 비교 대상이 필요하다. 그래서 Tom Tango와 동료들은 1999-2002년 4년간의 메이저리그 전체 데이터를 가지고 계산을 해 보았다. 그 결과, 메이저리그에서 한 타석의 평균 WPA 변화 수준은 0.0346으로 나타났다.

앞의 타석은 평균적인 상황에 비해 얼마나 중요한 것일까?

0.09243 / 0.0345 = 2.7

이 상황은 메이저리그의 보통 타석에 비해 2.7배 WPA를 많이 변화시킨다, 즉 2.7배 중요한 타석임을 알 수 있다. 이것이 바로 LI(Leverage Index) 이다. 정의에 따라, LI의 평균값은 1이 된다. 1보나 낮으면 평균보다 덜 중요한 순간이며, LI가 1보다 클 수록 게임의 향방을 좌우하는 중요한 순간이 된다.


물론 실제로 특정 타자가 타석에 들어섰을 때 벌어질 수 있는 이벤트는 1루타와 삼진 이외에도 무척 많다. Tom Tango와 동료들은 각각의 상황에 대해 발생할 수 있는 모든 이벤트의 LI를 계산해서 표로 만들었다.

표 링크

표에서 회색은 보통의 LI, 파란색은 1.5 이상의 높은 LI(중요한 상황), 빨간색은 매우 높은 LI(매우 중요한 상황)임을 나타내며, 아무 색깔이 없는 상황은 낮은 LI이다. 야구에서 LI가 가장 높은 상황, 즉 한방으로 승패를 가장 크게 좌우하는 상황은 9회말 2사 만루에서 홈팀이 1점 뒤져 있을 때 임을 알 수 있다.  왜 2사 만루 동점이 아니고 2사 만루 1점차 상황일까? 2사 만루 동점일 때보다 1점 뒤져 있을 때가 홈 팀의 WPA가 낮지만, 안타 한 방이면 역전승(=홈팀 WPA 1.000) 하는 것은 거의 마찬가지이므로, 1점 뒤져 있을 때의 WPA 변화 정도가 더 큰 것이다.


세이버메트리션들은 특히 마무리투수의 기용에 대해 지속적으로 의문을 제기해 왔다. 9회초 무사, 주자 없음, 홈팀 3점 리드인 상황에서 마무리투수가 등판하면, 이 때의 LI는 0.2에 불과하다. 어쨌든 이 투수가 아웃 3개를 잡으면 세이브가 기록된다. 하지만, 예를 들어 8회초 무사, 주자 만루, 홈팀 2점 리드인 상황의 LI는 4.1로 매우 높다. 이런 훨씬 중요한 순간에 왜 클로저를 안 내보내고 그보다 구위가 떨어지는 셋업맨을 내보내는 것일까?

일반적으로 생각되는 이유는 세 가지 이다. 우선 팀 동료들과 감독 본인에게 끼치는 심리적인 효과이다. 어쨌든 가장 좋은 릴리버가 경기 맨 마지막을 책임짐으로써 뒷문을 든든하게 잠가 주는 것 같은 심리적 안정감을 주는 것이다. 선수들과 감독 자신이 받는 이런 심리적 안정감은 의외로 큰 모양이어서, 한때 Red Sox가 Bill James의 충고에 따라 집단 마무리 체제를 운용하다가 실패한 사례가 있다. (그런데 셋업맨이 8회에 경기를 날려 버리면 클로저는 나올 기회조차 없지 않은가? -_-;;; )  두 번째는 클로저 본인의 자존심이다. 클로저들은 자신들이 경기를 마무리해야 한다고 믿고 있으며, 이러한 기회를 빼앗기게 되면 불만을 표시하거나 트레이드를 요청하기도 한다. 마지막으로, 감독이 스스로 비난을 자초하기 싫어한다는 것이다. 9회의 "세이브 상황"에 클로저를 내보내서 클로저가 블론세이브를 기록하면, 그것은 클로저가 불쇼를 했기 때문이라는 식으로 선수에게 비난이 집중된다. 감독은 정해진 역할에 따라 할 일을 했을 뿐이다. 반면, 7회나 8회 노아웃 만루의 위기 상황에 클로저를 내보내 일단 불을 끈 후 9회에 셋업맨을 올렸다가 경기를 날린 경우, 비난의 화살은 주로 등판 순서를 바꾼 감독에게 집중된다. 감독이 굳이 이런 식으로 스스로 욕먹을 짓을 할 이유가 없다는 것이다.

Fangraphs에서는 구원투수가 게임에 들어설 때의 LI를 gmLI, 강판될 때의 LI를 exLI로 구분하여 보여주고 있다. 릴리버의 gmLI가 높다는 것은 그만큼 감독이 그 투수를 믿고 위기상황에서 많이 내보낸다는 의미가 된다.

이번 오프시즌에 Fernando Rodney가 37세이브 1블론의 일견 그럴싸해 보이는 기록 덕분에 Angels와 2년 11M의 짭짤한 계약을 챙길 수 있었다. 이러한 높은 세이브 성공률은 Tigers의 Leyland 감독의 철저한 관리 덕분이라는 비판이 있었는데, 실제로 그의 gmLI를 확인해 보면 1.44에 불과하여 규정이닝을 채운 MLB 릴리버 중 38위에 불과하다. 다른 팀의 클로저 들은 물론이고 웬만한 셋업맨들(Mark Lowe, Jeremy Affeldt, Nick Masset, Luke Gregerson, Phil Hughes, Grant Balfour) 보다도 gmLI가 낮은 것이다. 그가 어렵지 않은 상황에 많이 등판하여 쉬운 세이브를 많이 챙겼음을 보여주는 강력한 증거이다. 2년 11M 계약은 의심의 여지가 없는 확실한 오버페이이다.


Today's Music : Rainbow - Kill the King (Live)



7-80년대를 풍미했던 Ritchie Blackmore(guitar), Ronnie James Dio(lead vocal), Cozy Powell(drums)의 전설적 뮤지션들을 모두 만날 수 있는 귀중한 영상. 명불허전의 퍼포먼스이다.
Posted by FreeRedbird

댓글을 달아 주세요

영양가에 대한 논란

9회말 2사 2-2 동점에서 솔로홈런을 치면, 3-2가 되면서 게임이 끝난다. 이 홈런은 게임의 향방을 결정지은 "승리타점"이 된다. 하지만, 9회초 15-0으로 앞서 있는 상황에서 솔로홈런을 치면, 16-0이 된다. 15-0이나 16-0이나 어차피 이길 확률이 100%에 가까운 것은 마찬가지이므로, 이 홈런은 게임의 향방과는 거의 관계가 없는 홈런이다. 소위 홈런의 "영양가"가 다른 것이다.

HR, RBI, OBP, SLG, OPS, RC, wOBA, EqA 등 우리가 사용하는 거의 모든 스탯은 이 두 홈런을 똑같은 가치로 취급한다. 시즌 기록으로 생각하면, 한 시즌은 꽤 긴 기간이므로, "영양가 있는 순간"과 "영양가 없는 순간"은 상당 부분 상쇄될 것이다. 또한, 클러치 능력이라는 게 랜덤에 가깝다는 주장을 수용한다면, 올해에 "영양가 있는 적시타"를 유난히 많이 쳤다고 해서 내년에도 그러리라는 보장은 없는 것이다. 따라서, 일반적으로 선수의 능력을 판단할 때에는 위의 스탯들을 사용하는 것으로 별 무리가 없다.

하지만, 그 "영양가"를 구체적으로 따져보고 싶은 경우에는 어떻게 해야 할까? 예를 들어 특정 경기의 수훈 선수를 한 명 꼽고 싶다면? 위의 스탯들로는 해결이 불가능하다. 이럴 때 사용하면 좋은 것이 바로 WPA(Win Probability Added) 이다.


WE(Win Expectancy)에 대한 복습

WE에 대해서는 이미 이전 포스팅에서 소개한 바 있다.

Insidethebook 사이트에 공개되어 있는 표를 이용하여 다시 복습을 해 보자.

Inning: 6, Top

1B 2B 3B Out -4 -3 -2 -1 Tie 1 2 3 4
0 0.089 0.146 0.230 0.348 0.500 0.651 0.769 0.854 0.911
1 0.097 0.158 0.249 0.375 0.534 0.690 0.802 0.879 0.929
2 0.103 0.167 0.263 0.394 0.560 0.717 0.825 0.896 0.941
1B 0 0.078 0.128 0.204 0.310 0.448 0.594 0.717 0.812 0.881
1B 1 0.089 0.145 0.230 0.347 0.498 0.649 0.766 0.852 0.910
1B 2 0.099 0.161 0.253 0.380 0.542 0.697 0.808 0.884 0.932
2B 0 0.069 0.114 0.182 0.280 0.410 0.557 0.689 0.793 0.868
2B 1 0.083 0.136 0.216 0.327 0.473 0.625 0.749 0.840 0.902
2B 2 0.095 0.155 0.244 0.368 0.526 0.682 0.797 0.876 0.928
3B 0 0.058 0.098 0.158 0.247 0.369 0.517 0.662 0.774 0.856
3B 1 0.071 0.118 0.189 0.291 0.427 0.582 0.719 0.820 0.889
3B 2 0.093 0.152 0.240 0.362 0.519 0.675 0.793 0.873 0.926
1B 2B 0 0.062 0.102 0.164 0.253 0.372 0.506 0.633 0.742 0.827
1B 2B 1 0.078 0.127 0.202 0.308 0.445 0.590 0.711 0.806 0.877
1B 2B 2 0.092 0.151 0.238 0.358 0.513 0.665 0.780 0.862 0.917
1B 3B 0 0.051 0.085 0.139 0.218 0.327 0.463 0.602 0.720 0.813
1B 3B 1 0.067 0.111 0.178 0.274 0.402 0.548 0.682 0.786 0.864
1B 3B 2 0.089 0.146 0.231 0.349 0.500 0.652 0.770 0.855 0.912
2B 3B 0 0.046 0.078 0.127 0.201 0.303 0.431 0.569 0.695 0.795
2B 3B 1 0.062 0.102 0.165 0.255 0.377 0.517 0.652 0.764 0.848
2B 3B 2 0.087 0.143 0.226 0.341 0.490 0.639 0.757 0.845 0.906
1B 2B 3B 0 0.042 0.071 0.116 0.183 0.277 0.395 0.523 0.644 0.748
1B 2B 3B 1 0.060 0.099 0.159 0.245 0.362 0.495 0.622 0.731 0.818
1B 2B 3B 2 0.084 0.137 0.217 0.328 0.471 0.617 0.733 0.823 0.888


위의 표는 홈팀의 입장에서 6회초의 각 상황별로 기대 승률, 즉 Win Expectancy를 표시한 것이다. 즉, 6회초에 동점이고 무사에 주자가 없는 경우(위 표의 빨간색 글씨), 홈팀이 이 경기를 이길 확률은 정확히 0.5 이다. 하지만, 홈팀이 원정팀에게 1점 뒤진 상태에서 2사 3루의 상황을 맞이한 경우(위 표의 파란색 글씨), 홈팀이 최종적으로 이 경기를 이길 확률은 0.362 로 내려간다.

이 표는 Run Environment가 5.0인 상황, 즉 각 팀별로 경기당 평균 5점씩 득점하는 리그를 기준으로 한 것이다. 이 Run Environment가 바뀔 경우에는 WE Matrix도 바뀌게 된다.

아래 엑셀파일은 Tom Tango의 웹사이트에 걸려 있는 외부 링크에서 집어온 것이다. (출처는 여기)
파일 안에 있는 "BigTable" sheet가 바로 Run Environment=4.5일 때의 Win Expectancy 표이다. 위의 표와 6회초 부분을 비교해 보면 숫자가 조금씩 다름을 알 수 있다. 1점을 득점하거나 실점하는 경우 첨부파일의 WE가 더 크게 변하는 것을 볼 수 있는데, Run Environment가 작으므로(=게임당 평균득점이 적음) 1점의 위력이 더 큰 것이다.

WPA : Win Probability Added

WPA는 Win Probability Added의 약자로, 단어 안에 그 의미가 이미 드러나 있다. 즉, 기대 승률이 변화한 정도를 나타내는 것이다.

예를 들어... 위의 엑셀 파일에서처럼 Run Environment가 4.5인 상황에서 양 팀이 0-0이고, 6회초가 막 시작되고 있다고 가정해 보자. 이 상황에서 양팀의 기대 승률은 똑같이 50% 이다. 그런데, 6회초에 원정팀의 선두타자가 나와서 솔로 홈런을 쳤다고 하면, 점수는 0-1로 바뀌고, 노아웃 주자 없음 상황은 그대로 유지된다. 이제 홈팀이 1점을 뒤지게 되었으므로, 위의 표에서 -1점, 노아웃, 주자 없음을 찾아 보면 33.6%로 기대 승률이 내려갔음을 알 수 있다. 홈런 한 방을 맞음으로써 이 경기를 이길 확률이 16.4%가 줄어든 것이다. 따라서, 홈런을 친 선두타자는 +0.164의 WPA를 인정받게 되며, 반대로 홈런을 허용한 홈팀 투수는 -0.164의 WPA를 기록하게 된다.

이런 상황이 9회에서 발생했다면 어떻게 다를까? 9회초 노아웃에 무사, 동점인 상황에서 선두타자에게 홈런을 허용한 경우 홈팀의 기대 승률은 50%에서 16.2%로 크게 떨어진다. 여기에서 타자와 투수가 얻게 되는 WPA는 각각 +0.338, -0.338에 달한다. 6회초의 홈런에 비해 2배 이상 높은 것이다. 그만큼 같은 동점이라도 9회초의 홈런이 6회초의 홈런에 비해 훨씬 크게 승부를 좌우한다는 의미이다. 즉, 홈런의 "영양가"가 더 높은 것이다.

9회말, 홈팀이 3점 뒤진 상황에서 2사 만루에 타석에 들어섰다면, 이때 홈팀의 승률은 9.1%에 불과하다. 그런데, 여기서 만루홈런을 쳐서 역전승을 거뒀다면, 승리를 거두었으므로 기대승률은 100%가 되어 이 타석의 WPA는 +0.909에 달한다. 그야말로 영양가 만점이라고 할 수 있을 것이다.

이번에는 원정팀이 6점 앞서 있는 상황에서 9회초를 시작하는 것을 가정해 보자. 이때 홈팀의 승률은 0.3%에 불과하다. 여기에서 원정팀의 선두타자가 홈런을 쳐서 7점차로 벌어지면, 홈팀의 승률은 0.1%로 떨어진다. 같은 홈런이지만, 이 타석에서 타자의 WPA는 +0.002에 불과하다. 어차피 이길 확률이 매우 높은 상황이었으므로 영양가가 거의 없는 홈런이다. 같은 홈런인데도 이렇게 차이가 나는 것이다.

선수별 WPA는 Fangraphs에서 찾아볼 수 있다. 또한, Fangraphs는 메이저리그 정규시즌 및 포스트시즌에서 모든 게임의 WPA 변화를 실시간으로 중계해 준다.


WPA의 장점 그리고 한계

wRAA와 같은 스탯은 해당 선수가 팀 득점에 얼마나 기여했는지를 나타내는 스탯이지만, WPA는 해당 선수가 팀 승리에 얼마나 기여했는지를 나타내는 스탯이다. WPA가 높다는 것은 그만큼 팀 승리에 결정적인 공헌을 많이 했다는 것이고, 영양가 있는 활약을 했다는 이야기가 된다. (물론 162게임의 시즌은 상당히 긴 기간이므로 wRAA가 높은 타자는 아무래도 WPA가 높게 되기 마련이지만...) 만약 MVP를 순수하게 "팀 승리에 제일 많이 기여한 선수"에게 주고자 한다면, WPA가 가장 높은 선수에게 주는 방법도 고려해 볼 수 있다.

하지만, WPA는 그 배분 방식에 문제를 가지고 있다. 예를 들어 타자가 홈런을 친 경우, 승률의 변화를 그대로 타자의 WPA에 플러스 해 주고 투수의 WPA에 마이너스 해 주면 된다. 하지만, 타자의 타구가 수비수의 어설픈 수비로 인해 안타로 연결된 경우, 이 때 승률의 변화는 어떻게 계산해 주어야 할까? 타자는 어쨌든 안타를 만들었기에 변화한 승률 만큼을 플러스 WPA로 가져가지만, 수비측은 투수의 일방적인 책임으로 보기에는 어려운 상황이다. 이 경우에는 관측자의 주관적 판단에 따라 투수와 수비수의 책임 수준을 평가하여 마이너스 WPA를 배분하게 된다. 그런데, Fangraphs의 경우는 이러한 주관적 판단을 배제하고 수비측에서 받게 되는 모든 WPA를 투수에게만 부여하고 있다. 수비수의 호수비로 안타성 타구가 아웃이 되어 플러스 WPA를 얻게 된 경우에도 투수가 이득을 보고, 수비수의 어설픈 수비로 아웃될 타구를 안타로 만들어준 경우의 마이너스 WPA도 역시 투수가 모두 가져가게 되는 것이다. 이것은 관측자의 주관적 판단으로 인한 오류를 배제하는 장점이 있고, 또한 WPA를 리얼타임으로 계산할 수 있게 해 준다. 이렇게 쉽게 계산하기 때문에 Fangraphs가 메이저리그 시즌 중에 실시간으로 각 경기의 WPA 변화를 업데이트해 줄 수 있는 것이다.

또한, WPA는 과거의 팀 기여도를 살펴보는 데에는 유용하지만, 미래를 예측하는 데에는 상당히 부적절하다. 올해 유난히 결승타를 많이 올린 선수가 있다고 해서, 내년에도 특유의 클러치 능력을 발휘하리라는 보장이 전혀 없는 것이다.


Today's Music : Fleetwood Mac - Don't Stop (Live)



Don't stop thinking about tomorrow
Don't stop, it'll soon be here
It'll be better than before
Yesterday's gone, yesterday's gone

새해를 기념하여 좀 긍정적인 분위기의 곡을 골라 보았다.

새해 복 많이 받으세요...!!!


(이 글은 한국야구팬사이트에서도 보실 수 있습니다.)
Posted by FreeRedbird

댓글을 달아 주세요

  1. BlogIcon lecter 2010.01.01 13:20 Address Modify/Delete Reply

    FreeRedbird님 희망찬 새해 되시기 바랍니다 :)

  2. BlogIcon jdzinn 2010.01.03 05:41 신고 Address Modify/Delete Reply

    블로그 더욱 번창하시고 새해 복 많이 받으시길 바랍니다^^

    • BlogIcon FreeRedbird 2010.01.03 20:46 신고 Address Modify/Delete

      감사합니다. 새해에도 빠른 소식과 더 좋은 글로 찾아뵙도록 노력하겠습니다. 좋은 일 가득한 한해가 되시길...

  3. yuhars 2010.01.03 10:12 Address Modify/Delete Reply

    늦었지만 새해 복 많이 받으세요.~!

    • BlogIcon FreeRedbird 2010.01.03 20:47 신고 Address Modify/Delete

      새해에도 자주 들러 주세요... 감사합니다. 새해엔 복 많이 받으시고 대박 나십시오...!! 대박 나시면 함 쏘시고요... ^^

(주: 타자의 WAR를 구하는 글은 이미 이전에 포스팅한 바 있었으나, 일부 잘못된 계산을 바로잡고 내용을 보충하여 다시 포스팅 하기로 하였다. 또한, 이제 2009 시즌이 끝났으므로 계산에서 사용한 예도 2009년의 스탯들로 바꾸었다.)



Chase Utley : 항상 실력에 비해 충분한 인정을 받지 못하고 있는, 심각하게 저평가된 플레이어이다.


타자가 팀의 득점에 기여하는 방법은 크게 보아 공격(타격), 수비, 주루가 있을 것이다. 그래서 좋은 타자를 이야기할 때 "공, 수, 주 3박자를 두루 갖췄다"는 표현을 사용하기도 한다.

각각의 타자에 대해서 이러한 득점 기여의 정도가 어느 정도인지를 측정하기 위해, 이전의 글들을 통해 공격, 수비, 주루의 측면을 차례로 검토해 왔다. 또한 비교 대상으로서 절대적 기준이 되는 Replacement Level 및 수비 포지션에 따른 조정 수준에 대해서도 살펴본 바 있다. 각각의 항목에 대해 다시 한번씩 훑어 보시면 이해에 도움이 되시리라고 생각하여 링크를 걸어 본다.

1. 타격 기여 수준 : wOBA 및 wRAA
2. 비교의 절대적 기준 : Replacement Level
3. 수비 기여 수준 : UZR, TZ
4. 포지션별 차이 : Positional Adjustment
5. 주루 기여 수준 : 도루 성공/실패, EqBRR

이를 종합하면 특정 타자의 전체 기여 수준, 혹은 그의 가치(Value)를 계산할 수 있는데, 이것이 바로 RAR(Runs Above Replacement level) 및 WAR(Wins Above Replacement level) 이다.

여기에서는 우선 Fangraphs와 동일한 방식으로 WAR를 구해 볼 것이다. 원문에서는 여기까지만 시도했었지만, 이 글에서는 Fangraphs 방식의 한계와 그 보완 방법까지 생각해 보고자 한다.

먼저 RAR을 구해 보면... 위의 다섯 가지를 차례로 더해 주면 된다.

RAR = Batting + Replacement Level + Defense + Positional Adjusment + Running

이제 RAR을 WAR로 환산해야 하는데... 원칙적으로는 팀 전체 득점과 실점에 대해 해당 플레이이어의 RAR이 미치는 점수 변화 정도를 가지고 Pythagorean Expectation의 식에 넣어서 계산하는 것이 맞지만... Pythagorean 관련 포스팅에서 언급한 바와 같이, "10점 득점 = 1승"의 단순한 계산 방법이 의외로 높은 정확도를 가지므로, 계산의 편의를 위해 이를 활용하는 것이 좋을 것이다. 즉, 아래와 같이 쉽게 계산할 수 있다.

WAR = RAR/10

이제부터 실제 예를 통해서 자세히 살펴보자.
계산에 필요한 Raw Data는 Baseball-ReferenceFangraphs에서 얻었으며, 이후의 모든 계산은 직접 하였다. 계산에 사용한 엑셀 sheet를 첨부하였으므로, 계산 결과를 쉽게 확인하실 수 있을 것이다.



아래는 Chase Utley의 2009년 성적이다.

공격 : 687 PA, 98 1B, 28 2B, 4 3B, 31 HR, 85 NIBB, 3 IBB, 24 HBP, 4 RBOE
수비 : 10.8 UZR
주루 : 23 SB, 0 CS


(NIBB : 고의사구가 아닌 볼넷, IBB : 고의사구, RBOE : 에러로 인해 타자가 출루한 경우)

순서에 따라 차례차례 계산해 보면...


1-1. Park Adjust

먼저 wOBA를 계산하기에 앞서서, 구장으로 인한 효과를 보정해 주는 것이 계산의 신뢰도를 높이는 데 도움이 될 것이다. Park Factor를 계산하는 방법은 여러 가지가 있고, 개인적으로는 어떤 방법이 가장 좋은지 아직 결론을 내리지 못하고 있다. 일단 여기서는 Fantasy411의 2006-08년 Park Factor를 빌려와서 사용하도록 하겠다. 이 자료는 엑셀 파일에 포함되어 있다. (단, RBOE의 Park Factor는 어디에서도 얻을 수가 없었다. 어차피 Utley의 RBOE가 4에 불과하여 Park Factor가 있더라도 그다지 영향은 없었겠지만...)

정밀한 조정을 위해서는 Utley의 경기별 홈구장을 일일이 찾아서 계산해야겠지만... 너무 품이 많이 들므로, 다음과 같은 간단한 방법을 사용하였다. 1) 타석의 절반은 홈, 절반은 원정에서 기록한 것으로 본다. 2) 원정구장들의 평균 Park Factor는 100이다. (실제로는 홈구장을 뺀 15개 NL 구장의 평균이므로 100에 근접한 값일 것이나, 큰 오차는 없으리라고 본다) 3) 따라서, 조정된 Park Factor는 (100 + 홈구장 Park Factor) / 2 로 계산할 수 있다.

계산시 1B, 2B, 3B, HR에 대해 Park Factor를 적용하였으나, 볼넷이나 HBP, 도루 등의 경우는 구장별 차이가 있다고 인정하기가 어려운 관계로 반영하지 않았다. 이런 부분에도 구장으로 인한 차이가 존재한다고 생각한다면... 취향에 따라 해당 스탯의 Park Factor를 찾아서 추가적으로 적용해 주면 된다. 또한, 1루타에 대한 Park Factor가 따로 없으므로... 안타 총 합계(H)의 Park Factor와 장타(XBH)의 Park Factor, 그리고 실제 2009년 메이저리그 안타, 장타 기록으로부터 1루타의 Park Factor를 유추하였다.

이렇게 조정한 Utley의 09년 성적은 아래와 같다.
687 PA, 97 1B, 28 2B, 5 3B, 28 HR, 85 NIBB, 3 IBB, 24 HBP, 4 RBOE

역시 홈런이 많은 홈구장을 쓰다 보니, 조정 결과 홈런이 약간 줄어든 것을 확인할 수 있다.


1-2. wOBA 및 wRAA 계산

wOBA 및 wRAA의 계산식 및 이론적 근거는 위의 링크를 참고하시고... Park Factor를 적용한 기록을 가지고 Utley의 wOBA를 계산한 결과는 다음과 같다. (엑셀 sheet 참조)

(Park Adjusted) wOBA = 0.390

한편, 2008년 NL 전체 타격 기록을 가지고 구한 리그 평균 wOBA는 0.328이므로, 이를 이용하여 Utley의 wRAA를 구하면 다음과 같다. (엑셀 sheet 참조)

wRAA = 37.45 Runs

즉, 2009년 시즌의 Chase Utley는 NL 평균 타자에 비해 타격으로 팀 득점에 37.45점 더 기여했다는 의미가 된다.


2. wRAA를 Batting RAR로 : Replacement Level의 설정

wRAA는 Runs Above Average라는 단어의 의미에서도 알 수 있듯이 리그 평균과 비교하는 스탯이므로, 이를 Replacement Level과의 비교로 조정하여 RAR(Runs Above Replacement leve)로 만들 필요가 있다. 이전부터 한 시즌을 기준으로 리그 평균 수준의 주전 선수와 Replacement Level의 땜빵 선수 차이에는 20점 혹은 2승 정도의 차이가 난다는 경험적 분석 결과들이 있었는데, 작년 말에 THT에 게재된 Sean Smith의 뛰어난 연구는 이를 다시 한 번 확인시켜 주었다. 즉, 600 PA를 기준으로 리그 평균과 Replacement Level의 사이에는 20점(20 Runs)의 기여 수준 격차가 있다는 것이다. 이러한 격차를 wRAA 값에 더해주면, RAR로 쉽게 환산된다.

Utley의 경우로 돌아가면, Utley는 687 PA를 기록했으므로, 687 PA에서 평균과 Replacement Level의 격차를 계산해 보면...

600/20 x 687 = 22.90 Runs

이 값이 Utley의 Replacenemt Level 값이 된다. 즉, Utley 대신 Replacement Level 선수를 시즌 내내 기용했다면, 아마도 22.9점 만큼 덜 득점했을 것이라는 이야기이다.


3. 수비 기여 수준 : UZR

이전 포스팅에서 ZR을 개선한 합리적인 스탯으로 UZR, TZ(TZR), +/-를 소개한 바 있다. 그 포스팅에서 언급한 바와 같이, +/-는 유료 정보이며 연말에 발표되고, TZ의 경우 현역 메이저리거들에 대한 데이터는 아직 작업중인 상태여서 조회가 되지 않으므로, 현재로서는 UZR이 거의 유일한 선택이라고 할 수 있다. UZR은 Fangraphs에 거의 실시간으로 계속 업데이트 되므로, 지난 시즌의 결과물 뿐 아니라 현재 진행중인 시즌에 대해서도 누구가 쉽고 빠르게 정보를 얻을 수 있다. 뿐만 아니라, TZ의 창시자인 Sean Smith조차 UZR이 가장 뛰어난 수비 스탯이라고 인정하고 있으므로, UZR을 쓰는 것이 여러 모로 좋은 선택이라고 생각한다.


Utley는 2009년 1년 내내 2루수로만 출장했으며, 1년간의 누적 UZR 값은 10.8이다.

UZR = 10.8 Runs

이는 Utley가 2008년 시즌에 수비를 통해 실점을 평균 2루수보다 10.8점 더 방지하는 정도의 기여를 했음을 의미한다.


4. Positional Adjustment

다시 한 번 포지션별 조정 점수를 정리해 보면 아래와 같다.

포수 : +12.5 Runs
유격수 : +7.5 Runs
중견수, 2루수, 3루수 : +2.5 Runs
좌익수, 우익수 : -7.5 Runs
1루수 : -12.5 Runs
지명타자 : -17.5 Runs


이 조정 점수는 162게임의 풀 시즌을 기준으로 만들어진 것임에 유의해야 한다. 162게임을 이닝으로 환산하면 1,458 이닝이 되므로, 실제 수비에 참가한 이닝을 1458로 나눠서 위의 조정 점수를 곱해 주면 실제 해당 시즌의 조정 점수가 될 것이다.

Utley는 2008년에 2루에서 1357 이닝을 뛰었다. 따라서...

(2.5 x 1357) / 1458 = 2.33 Runs

이 점수가 Utley의 수비 포지션에 따른 최종 조정 점수가 된다.


5. 주루플레이의 기여 수준: 도루 성공과 실패

Fangraphs는 주루플레이에 대해 도루 성공/실패만을 반영하고 있는데, 이는 Fangraphs가 다른 주루 능력에 관심이 없어서라기보다는 무료로 이용 가능한 공개 주루 스탯이 존재하지 않기 때문일 것이다. 주루 스탯을 제공하는 곳이 BP와 Bill James Online 정도밖에 없는데, 둘 다 Fangraphs에 자료를 그냥 링크해 줄 생각은 없는 듯하다.

Fangraphs의 선수 페이지에서 맨 아래에 있는 Value를 보면, Running 항목이 따로 존재하지 않고 도루 성공/실패를 Batting에 합산하고 있다. 평균적으로 도루 성공은 0.175, 도루 실패는 -0.467점의 가치(Run Value)를 지니므로, 도루 및 도루 실패의 갯수에 Run Value를 곱해서 계산하는 것이다.

Utley는 2009년에 23 SB, 0 CS를 기록하였으므로...

23 x 0.175 - 0 x 0.467 = 4.03 Runs

도루를 통해 4.03점 만큼 팀 득점에 기여하였다는 결론을 얻을 수 있다.


6. RAR 및 WAR의 산출

이제 모든 구성 요소의 계산을 다 했으므로, 지금까지 나온 값을 모두 더하면 타자의 총 기여 수준, 혹은 그의 가치(Value)가 된다.

RAR = 37.45(타격) + 22.9(Replacement Level) + 10.8(수비) + 2.33(포지션 조정) + 4.03(도루)
      = 77.50


득점 10점은 1승과 동일하므로,

WAR = RAR/10 = 7.8

즉, 거칠게 표현하자면, 2009년 Chase Utley는 7.8승짜리 플레이어였다는 것이다.

2009년 Phillies는 93승 69패를 기록하였는데, 만약 Utley 대신 1년 내내 Miguel Cairo와 같은 Replacement Level 플레이어들로 2루를 돌려막기 했다면, Phillies는 아마도 85승 77패를 기록했을 것이라는 이야기이다. 이렇게 되면 Florida Marlins와 동률이 되므로, 플레이오프 진출을 장담할 수 없게 되어 버린다. 이것이 바로 진정한 스타 플레이어 한 명의 위력이다.

Fangraphs의 Utley 페이지를 보면, 2009년 그의 WAR를 7.6로 계산하고 있다. Fangraphs의 WAR 계산 로직은 이 글에서 내가 설명해 온 바와 동일하다. 0.2의 오차는 타격 기여도 계산에서 생겨난 것인데, 내가 타격에 37.45, 도루에 4.03으로 총 41.48점으로 계산한 데 비해 Fangraphs는 둘을 합쳐 39.4로 계산하고 있다. 오차의 원인으로 생각되는 것은 사용한 Park Factor 데이터의 차이 및 Park Factor 적용 방법의 차이가 가장 유력하다. 또한, 소숫점 반올림으로 인한 약간의 오차도 발생할 수 있다.


이번에는 Joe Mauer의 2009년 성적을 이용해서 WAR를 계산하여 보자.
(역시 첨부한 엑셀 sheet에 계산한 결과물이 들어 있다.)

다음은 Mauer의 2009년 타격 Raw Stat이다.
606 PA, 131 1B, 30 2B, 1 3B, 28 HR, 14 IBB, 62 NIBB, 2 HBP, 3 RBOE

Twins의 홈인 Metrodome의 Park Factor를 고려하여 위의 스탯을 조정해 주면 아래와 같다.
606 PA, 132 1B, 30 2B, 1 3B, 30 HR, 14 IBB, 62 NIBB, 2 HBP, 3 RBOE

이 기록으로부터 wOBA 및 wRAA를 계산하면,
wOBA = 0.449
wRAA = 57.50

Replacement Level = 20 / 600 * 608 = 20.2

수비 : UZR = 0 (포수는 UZR데이터가 없다.)

포지션 조정 : Mauer는 포수로 939 이닝을 뛰었으며, 지명타자로 28게임에 출장하였다. 따라서...
12.5 x 939 / 1458 - 17.5 x 28 / 162 = 5.03

도루성공/실패 : 4 SB, 1 CS이므로
4 x 0.175 - 1 x 0.467 = 0.23

이제 모두 더해주면,
RAR = 57.5(타격) + 20.2(Replacement) + 0(수비) + 5.03(포지션 조정) + 0.23(도루) = 82.96
WAR = RAR/10 = 8.3

즉, 2009년 Mauer는 8.3승짜리 플레이어였다는 것이다.

Fangraphs의 계산 결과는 8.2이다. 역시 0.1의 차이는 Park Factor 및 소수점 반올림 등으로 인한 오차로 생각된다.


여기까지가 Fangraphs의 WAR 계산 방법인데... 주루플레이가 도루 성공/실패만 단순히 계산되고 있고, 포수 UZR이 없어 포수 수비력의 차이가 반영되지 않는다는 문제점이 있음을 알 수 있다. 이제 이를 보완하는 방법을 찾아 보자.

주루플레이에 대해서는 이전에 소개한 바와 같이, Baseball Prospectus의 EqBRR을 대신 사용할 수 있다. Chase Utley의 경우 2009년 EqBRR이 8.80으로, 매우 뛰어난 주자임을 알 수 있다. 도루성공/실패로 계산한 숫자 대신 이 EqBRR을 대신 넣어서 계산하면 아래와 같다.

RAR = 37.45(타격) + 22.9(Replacement Level) + 10.8(수비) + 2.33(포지션 조정) + 8.8(주루) = 82.28
WAR = RAR/10 = 8.2

Fangraphs에서 저평가되었던 주루 능력을 제대로 평가해준 결과, Chase Utley는 이제 8.2승짜리 선수가 되었다. 워낙 주루능력이 좋은 선수이다 보니, 주루를 이렇게 반영해주지 않았더라면 억울할 뻔 했다.


이번에는 Joe Mauer를 재평가해 보자.

EqBRR에 의하면 Joe Mauer의 주루 능력은 -3.60으로 나온다. 포수들은 일반적으로 좋은 주자가 아니라는 상식과 일치하고 있다.

포수 수비력
은 아직 의견이 분분한 분야이나... 이 글을 참고하면 Mauer는 2009년 수비에서 4.4점 기여한 것으로 되어 있다. 역시 Mauer는 수비가 좋은 포수라는 상식과 일치하는 결과이다.

이 둘을 기존 계산식의 주루와 UZR 대신 넣어서 계산해 보면,

RAR = 57.5(타격) + 20.2(Replacement) + 4.4(수비) + 5.03(포지션 조정) - 3.6(도루) = 83.43
WAR = RAR/10 = 8.3

수비에서 플러스 된 대신 주루에서 마이너스가 되어 RAR은 0.5점 올라가는 데 그쳤다. 결국 8.3 WAR로 거의 같은 결과를 얻게 됨을 알 수 있다. 비록 결과값은 비슷하지만 이것은 주루와 수비를 제대로 반영해 준 값이다.


나로서는 위의 방법이 크게 어렵지 않으면서도 타자의 공/수/주를 모두 커버하고 있어서 현재로서는 가장 좋은 툴이라고 생각하고 소개한 것이지만, 이러한 방법이 타자를 평가하는 단 하나의 절대적인 기준이 될 수는 없다. 취향에 따라 특정 스탯을 넣을 수도, 뺄 수도 있다. 예를 들어 EqA를 선호한다면 위의 계산에서 wRAA와 EqBRR을 빼고 대신 EqA로부터 Batting+Running Runs를 유도하여 넣어 주면 될 것이다. 혹 수비 스탯은 아무 것도 믿을 수 없다는 매우 회의적인 시각을 가진 사람이라면, UZR를 빼 버리면 될 것이다. 어떻게 활용하느냐는 각자의 몫이다.

또한, 세이버메트릭스에 절대적으로 의존하기보다는 활용 가능한 모든 정보(스카우팅 등)를 총 동원하여 여러 가지 각도에서 선수를 평가하는 것이 더욱 좋을 것이다. 물론 전문적인 스카우팅 훈련을 받거나 직접 선수생활을 해보지 않은 보통의 팬들이 자기 스스로의 안목을 가질 수 있는 방법은 역시 세이버메트릭스 만한 것이 없다고 생각하지만...


(이 글은 한국야구팬사이트에서도 보실 수 있습니다.)


Today's Music : Phil Collins Playing Drums!!! (with Chester Thompson)




Phil Collins는 무수히 많은 히트곡을 만든 송라이터이자 보컬리스트로서 유명하지만, 사실은 그런 것 이전에 매우 탁월한 드러머였다. 특히 Genesis의 초기 앨범들을 들어보면 Collins의 드럼 실력에 정말 놀라게 될 것이다. Collins는 공연시에 주로 자신의 드럼 연주로 오프닝을 장식하곤 했는데, 위의 두 라이브 클립에서는 세션 드러머 Chester Thompson(역시 아주 뛰어난 드러머임)과 환상적인 호흡을 보여준다.

Collins는 올해 가을, 아쉽게도 드러머로서 은퇴를 발표했다. 척수 부위의 부상으로 인해 스틱을 잡을 수조차 없게 되었기에, 50년간 쳐 왔던 드럼을 더 이상 칠 수 없게 되었다는 것이다. 너무나도 안타까운 일이 아닐 수 없다.

Posted by FreeRedbird

댓글을 달아 주세요

  1. 홈런강탈 2010.02.03 23:15 Address Modify/Delete Reply

    EqBRR이 어떤 과정에서 계산되는지 궁굼하네요. 추가진루라던지 주루가 공격력에서 어느 정도 가치를 가지게 될지 애매하기도 하고 ㅎ

    • BlogIcon FreeRedbird 2010.02.04 13:45 신고 Address Modify/Delete

      EqBRR은 다음 다섯 가지의 component를 더해서 계산합니다: Equivalent Ground Advancement Runs (EqGAR), Equivalent Stolen Base Runs (EqSBR), Equivalent Air Advancement Runs (EqAAR), Equivalent Hit Advancement Runs (EqHAR) and Equivalent Other Advancement Runs (EqOAR)

      예를 들어 EqGAR의 경우는 타자가 그라운드볼을 친 경우에 해당 주자가 얼마나 진루에 성공했는지를 가지고 득점 기여 수준을 평가하고요, 다른 component의 경우도 각각의 상황에 대해 평가를 하는 것입니다. 추가진루 1개의 득점 기여 가치가 어떻게 계산되는지에 대한 구체적인 설명은 없으나, 아마도 RE(Runs Expectancy) 테이블과 각각의 상황에 대한 oppotunity를 가지고 가중평균을 구해서 나오지 않았을까 싶네요.(저라면 그렇게 계산했을 것이라는 이야기입니다...)

      Baseball Prospectus는 자신들의 스탯에 대해 디테일한 정보를 잘 주지 않습니다. 거의 모든 계산방법을 인터넷에 오픈하는 Tango나 Litchman, Sean Smith 등에 비하면 꽤 폐쇄적인 자세를 가지고 있죠.

  2. 오뎅 2010.10.20 21:42 Address Modify/Delete Reply

    어틀리 과소평가는 08년 정점에...

    하워드 48홈런 146타점 162경기 700타석 251.339.881
    331루타 H+BB+LBB 250회 WRC 106 WAR 3.1승 mvp 2위

    어틀리 33홈런 104타점 159경기 707타석 292.380.535.915
    325루타 H+BB+LBB 255회 WRC 121 WAR 8.1승 mvp 순위권없음...

    • BlogIcon FreeRedbird 2010.10.22 19:20 신고 Address Modify/Delete

      WAR나 여기 있는 여러 스탯들이 완전 절대적이라고는 할 수 없습니다만, MVP 투표를 하는 사람들이 지나치게 홈런과 타점 같은 타격 지표에만 매달리는 것은 편중된 결과를 가져올 수밖에 없습니다. 1루수의 수비는 중요하지 않다고 생각하는 인식도 문제이고요. 1루도 엄연히 수비 포지션입니다.

  3. BlogIcon HJ90 2011.01.26 15:18 Address Modify/Delete Reply

    잘봤습니다. 새로운 기록에 대해 배우고 갑니다. (좀 어렵네요)

  4. BlogIcon aslkjdqwe 2011.10.18 23:18 신고 Address Modify/Delete Reply

    리플레이스먼트 레벨은 연마다 다르게 적용하는데 이 경우 연간파크팩터처럼 경향성이 있을 거 같은데 과소평가, 과대평가 위험이 있지 않나요? 레드버드님은 WAR로 다른 포지션끼리의 비교, 다른 시즌끼리의 비교를 어떻게 보시나요? 요즘 세이버스탯이 보편화 되어서 좋은데 무슨 만능치트키인양 사용하는 사람들도 많고 참...

    • BlogIcon FreeRedbird 2011.10.19 13:17 신고 Address Modify/Delete

      서로 다른 시즌을 비교하는 것은 쉽지 않은 작업입니다. 타고투저와 같은 현상도 있고, 스테로이드와 같은 외적 요소의 영향을 받기도 하고.. 뭔가 기준이 있어야 겠지요. 예를들어 타율 .400인 타자는 타율 .300인 타자에 비해 1.3배 좋은 타격을 한 것일까요? 그렇지는 않지요. 타율 .000 인 타자는 존재하지도 않고, 그런 타자를 기준으로 비교하는 것도 무의미합니다.

      Replacement Level은 이러한 문제를 해결하기 위해 설정된 기준입니다. Replacement Level을 달리 표현하면 구단들이 메이저리그 로스터에 포함시킬 수 있는 최저수준의 선수이므로, 이를 기준으로 이보다 얼마나 더 많은 기여를 했는가를 놓고 비교를 하는 것은 합리적이라고 할 수 있습니다.

      현재와 1940년대를 비교하면 물론 많은 차이가 있을 수 있겠지만.. 예를 들어 2011년과 2007년을 비교할 때에는 큰 문제는 없습니다. 2011년의 replacement level과 2007년의 replacement level은 절대적으로 다를 수 있고, 아마도 조금 다를 것입니다. 비교를 위해서는, 단지 메이저리그 전체 수준(리그 평균) 대비 상대적인 위치만 동일하면 됩니다. 평균 대비 -2~2.5 WAR 이라는 값은 2011년이나 2007년이나 거의 동일합니다.

      다른 포지션끼리의 비교에 있어서도, 아시다시피 1루수에게 요구되는 공격력의 수준과 유격수에게 요구되는 공격력의 수준은 다르므로, 뭔가 기준이 필요한 것이고요. 마찬가지로 구단들이 어떻게 판단하느냐를 기준으로 삼은 것입니다. 최저 수준(메이저/마이너의 경계)의 1루수와 최저 수준의 유격수는 같은 Replacement Level인 것으로 보고, 이를 기준으로 선수의 기여 수준을 계산하여 비교하는 것입니다. 나름 합리적인 방법인 것 같습니다.

      저는 이러한 방법론은 올바르다고 생각하는데요. 관건은 WAR이 제대로 계산이 되었느냐 이겠지요. 여기에는 많은 이슈가 존재합니다. Linear Weights의 약점이라고도 할 수 있는 Context 무시(주자 유무 등에 따라 같은 타구도 value가 달라짐) 라든지, 각 이벤트의 value를 어떻게 설정할 것인가 라든지(홈런의 절대 가치, 1루타의 절대 가치 등은 사실 시즌별로 RE Matrix가 변화하면서 같이 바뀝니다. 본문에 소개해 드린 수치는 절대적이지 않습니다.), 타격에 비해 정확도가 다소 떨어지는 주루/수비 스탯의 신뢰도 문제라든지... 투수의 경우는 Run Estimator 선택의 문제(FIP? ERA? SIERA? ERC? 등)가 존재하고요. 또, 여러가지 계산방법이 존재하는 Park Factor를 어떤 식으로 반영하느냐의 차이도 있고요. 사실 우리가 보는 WAR의 결과값에는 이런 여러가지 이슈에 대한 가정 내지는 판단이 포함되어 있는 것입니다. 당장 같은 선수에 대해서 Fangraphs와 Baseball Reference의 WAR 값이 서로 다르지 않습니까? 이러한 한계를 인정한다는 전제 하에서, WAR 기준의 선수 비교는 우리가 지금 시도해볼 수 있는 가장 합리적인 선택이라고 봅니다.

      야구에 만능치트키 같은 것은 없습니다. 세이버메트릭스는 어떻게 하면 좀 더 현실을 잘 반영할 수 있을까... 끊임없이 고민하고 개선시켜 나가는 과정이죠. 10년 전에는 선수 평가의 가장 발전된 도구가 Win Share였고, 5년 전에는 BP의 VORP/WARP였다면, 지금은 WAR인 셈입니다. 계속해서 현실에 다가갔다고 생각되고요. 시간이 흐르면 또 좀 더 좋은 메트릭이 만들어질 수도 있겠지요. 꼭 혁명적인 새로운 지표가 나올 필요는 없고... 지금의 WAR을 보다 많은 사람들이 동의할 수 있도록 개량해 가는 정도로도 괜찮을 것 같습니다.

  5. 123 2012.08.11 14:13 Address Modify/Delete Reply

    war수치에 대해 알아보다 우연히 발견했는데 알차고 알기쉽게 되있네요. 감사합니다 좋은 글 읽고 갑니다.

  6. 한기범 2012.11.14 15:43 Address Modify/Delete Reply

    안녕하세요, 스탯 계산하면서 레드버드님의 포스팅 많은 참고 되었습니다. 엑셀 프로그램을 사용하면서 레드버드님의 포스팅으로 어려운 스탯도 기록 할 수 있게 되었습니다. ㅎㅎ
    KBO선수들의2013 스탯을 조금이나마 기록하는게 목표인데 잘 할 수 있을지 걱정이네요. ㅎㅎ
    특히 궁극적으로 WAR지수를 표현하고 싶어 UZR기록이 필요한데 전부 수작업으로 해야 해서..
    한편으로는 걱정입니다.ㅎㅎ;

    이것저것 알아보면서 BPF,PPF도 구할 수있게 되었는데요, 레드버드님의 포스팅에 첨부된 어틀리_
    마우어 엑셀을 봤는데 신기한 파크팩터가 있더군요. 홈런에 대한 파크팩터, 2루타,3루타등
    정말 다양했습니다.

    레드버드님의 엑셀을 보니 한가지 걱정?이 생겼는데요, 제가 구한 BPF,PPF는 WAR지수를 계산할때
    어떻게 적용해야하나요? WAR를 계산할 때, BPF,PPF가 신뢰할 만한 스탯인지 걱정입니다.

    • BlogIcon FreeRedbird 2012.11.16 10:59 신고 Address Modify/Delete

      개별 이벤트에 대한 파크팩터가 아닌 PF를 이용할 경우, 마지막 결과값에 적용해 주시면 됩니다. 예를 들어, PF가 110인 구장을 홈으로 사용하는 선수의 batting RAR이 20이라면, 20/1.1=18.2를 쓰시면 되겠지요. 개별 이벤트에 직접 적용하는 것이 더 정확하겠지만, 이것도 아쉬운대로 사용 가능합니다.

      BPF와 PPF가 다르게 나오나요? 득실점을 가지고 PF를 구하면 둘은 같아야 되는게 아닌가 싶은데요... 홈구장이 공격할 때 다르고 수비할 때 다른 것은 아니니까요.

      PF는 계산 방법이 여러가지가 있고, 각각의 방법에 대해 일장일단이 있습니다. 여기서 생각하셔야 할 것은 계산으로 나오는 PF 수치를 그대로 믿어도 되느냐 인데요. 구장에서 1년동안 열리는 경기 수는 그렇게 큰 모수라고 할 수가 없고요. 결과에는 random variation이 포함될 수밖에 없습니다. 그러니 일정부분 평균으로 회귀(regression to the mean)시켜 주시는 것이 안전합니다.

  7. 한기범 2012.11.17 01:45 Address Modify/Delete Reply

    답변 감사합니다. 코멘트를 보고 PF에 대한 의문이 생겨(혹시 잘못 설정 했나 해서요..;) 임의값을 부여하고 값을 확인했습니다.
    a. 득,실점과 게임에 의한 PF : 1.05225
    b. PF를 IPC,OPC에 의한 보정 : 1.04766
    c. b에 대한 TBR,TPR에 의한 BPF : 1.007824 PPF : 1.005759
    저는 c에서 얻은 값으로 ops+, era+ 등을 나타낼 생각입니다. 그런데 레드버드님의 엑셀 파일 보고 깜짝 놀랬어요.
    한눈에 신뢰 할 수 있는 자료임을 알 수 있었습니다. 신뢰도가 높은 자료가 부럽기도 하구요. ㅎ

    BPF=PPF 라고 하셨는데 계산이 틀린걸까요? ㅠㅜ

    조사기간이 짧은 PF에 대한 주의점 알려주셔서 감사합니다. 죄송합니다만, '일정부분으로 회귀'가 무엇인지 알려 주셨으면 합니다.
    야구를 좋아하기만 하지. 세이버매트릭스, 수학에 대해서는 문외한이여서요 ㅠㅠ

    언제나 레드버드님의 양질의 포스팅을 유익하게 보고 있습니다. 앞으로도 세이버 매트릭스에 대한 좋은 포스팅 부탁드려요.^^

    • BlogIcon FreeRedbird 2012.11.19 14:25 신고 Address Modify/Delete

      블로그 왼쪽 위에 보시면 "Mail to FreeRedbird"라는 링크가 있는데요. 눌러보시면 제 메일 주소가 나옵니다. 메일로 지금 계산하신 방법을 참고하신 출처를 알려 주시면 제가 살펴보고 조언을 드리겠습니다.

  8. RJ 2013.01.11 13:59 Address Modify/Delete Reply

    옛날부터 세이버매트릭스에 대해 자세히 알기 위해 블로그 자주 들렸었습니다ㅎㅎ
    이 글도 몇 번째 다시 보는건진 모르겠는데,
    다시 보다 보니 지금 Fangrahs 사이트에선 2009년 마우어의 WAR을 7.9, wRAA를 54.8로 계산하고 있습니다.
    주인장님께서 엑셀 파일로 올려 주신 계산과정엔 마우어의 wRAA가 57.50(park adjusted)로 계산되어 있더라구요. 7.9와 8.3의 차이가 여기서 난 것 같은데..
    왜 이런 차이가 나게 되었는가가 궁금하네요^^ 댓글 주시면 감사하겠습니다ㅎㅎ

    • BlogIcon FreeRedbird 2013.01.12 02:43 신고 Address Modify/Delete

      안녕하세요.
      이 글은 쓰여진지가 좀 오래되어서 지금 다시 보면 업데이트가 필요해 보입니다. 제가 바빠서(게을러서?) 새로 글을 쓰지 못하고 있네요.

      그 당시와 비교해 보면, Fangraphs에 BsR과 포수 수비 스탯이 추가되었습니다. 09년 Mauer는 BsR에서 -1.6이고 Fld에서 -0.4이니 여기서 -0.2승의 차이가 생깁니다.

      나머지 -0.2승은 솔직히 잘 모르겠는데요. 이 글을 쓸 당시에도 -0.1 정도의 차이는 있었습니다. 파크팩터 적용시 소숫점 처리 등의 차이가 아닌가 생각됩니다. 아 그리고... wOBA 구할때 사용되는 각 이벤트(1루타, 2루타 등)의 1개당 가치와 마지막에 곱해주는 scale(1.15)은 사실 매년 리그평균에 따라 조금씩 변동이 됩니다. 제가 여기서 보여드린 식은 The Book 책에 나온 수치들인데요. 이 책은 2000-2004년 리그 평균을 기준으로 하고 있습니다. 2009년의 계산식은 계수들이 조금씩 다릅니다. 별도 포스팅으로 설명 드리겠다고 약속(?)한 게 너무 많이 밀려있어서 이건 몇 번째 포스팅이 될지 모르겠네요. ㅎㅎ

      암튼, WAR을 계산하는 기본적인 골격은 여전히 동일합니다만, 그 사이에 포수 수비도 측정을 하게 되었고, 주루 스탯도 추가로 반영된 것이(둘 다 Mauer에게는 불리한 변화) 차이를 더 크게 만든 가장 중요한 요인이라고 생각됩니다.

  9. KP 2013.09.07 04:07 Address Modify/Delete Reply

    안녕하세요,, 죄송하지만 war에 대해 여쭤볼게 있는데 물어볼 곳이 여기밖에 없네요
    죄송합니다

    Baseball Prospectus랑 Baseball Reference에서 oWAR는 Replacement Level에 포지션 차이를 두는걸로 알고있는데요

    프리레드버드님께서 다른 포지션끼리의 비교에 있어서도, 아시다시피 1루수에게 요구되는 공격력의 수준과 유격수에게 요구되는 공격력의 수준은 다르므로, 뭔가 기준이 필요한 것이고요. 마찬가지로 구단들이 어떻게 판단하느냐를 기준으로 삼은 것입니다. 최저 수준(메이저/마이너의 경계)의 1루수와 최저 수준의 유격수는 같은 Replacement Level인 것으로 보고, 이를 기준으로 선수의 기여 수준을 계산하여 비교하는 것입니다. 나름 합리적인 방법인 것 같습니다.

    이렇게 말씀하셨는데 Fangraphs에서는 Replacement Level에서 포지션 차이를 않두는 건가요?

    • BlogIcon FreeRedbird 2013.09.07 05:15 신고 Address Modify/Delete

      안두는 건 아니죠. 위의 본문을 보시면 "Positional Adjustment"라고 해서 포지션 조정을 해 주는 부분이 있습니다. 거기서 차이를 두는 거죠. 포지션 조정에 의해 1루수와 유격수의 Replacement Level은 풀타임 기준으로 20점의 차이가 나게 됩니다.

    • KP 2013.09.08 01:46 Address Modify/Delete

      결혼식 갔다와서 이제서야 봤네요 죄송합니다,,,,

      최저 수준의 1루수와 유격수의 Replacement Level이 같다고 하셨는데 이게 공격war에서 Replacement Level을 포지션 상관없이 다 같게 둔다는거 아닌가요,, woba에서 wraa 계산할때 사용하는 woba도 포지션 상관 않하고 모두 같은 리그 평균 woba이를 쓰구요,,, Baseball Prospectus랑 Baseball References는 oWAR 자체에 Replacement Level을 포지션별로 계산하구요,,

      Fangraphs의 Positional Adjustment는 제가 보기에는 dWAR에 대한 조정으로 보는게 맞을꺼 같은데요,,

      제가 궁금한거는 dWAR가 아닌 oWAR에서만 Fangraphs에서는 Replacement Level 자체에 포지션 차이를 두는지 않두는지 이게 궁금한겁니다. 엠팍에서 스탯티즈WAR랑 비교하면서 메이저리그 WAR는 oWAR에도 포지션 차이를 둔다고했는데 제가 보기에는 Fangraphs에서 oWAR는 포지션 차이가 없어보이거든요. Fangraphs에서는 포지션 차이 않두는거 맞는거죠?

    • KP 2013.09.08 01:46 Address Modify/Delete

      제가 글솜씨가 없어서 따지는 투로 글을 썼는데요,, 전혀 그렇게 생각하는건 아니구요,, 글솜씨가 없어서 그런거일뿐 오히려 답변 달아주셔서 감사하게 생각합니다,, 정말 감사합니다

    • BlogIcon FreeRedbird 2013.09.08 02:19 신고 Address Modify/Delete

      그것은 단지 계산순서의 차이일 뿐 별로 중요한 부분은 아니라고 봅니다만... 개념상 dWAR에 가깝다고 할 수는 있겠는데요. 어쨌든 Fangraphs 사이트는 실제로 oWAR 산출 도중에 이 포지션 조정 계산을 수행하고 있고요. 그러니 oWAR에서 이미 차이가 나고 있다고 보는게 맞습니다. dWAR는 같은 포지션의 수비수들끼리 리그 평균을 기준으로 수비력을 비교한 결과입니다.

    • KP 2013.09.08 03:41 Address Modify/Delete

      죄송한데 Fangraphs oWAR 계산에서 포지션 조정 계산이 어디 들어가있는지 알수 있을까요,,, 저는 이게 정말 궁금해서요

    • BlogIcon FreeRedbird 2013.09.12 14:13 신고 Address Modify/Delete

      지금 다시 확인해보니 oWAR에 합치지 않고 다 따로 계산하고 있네요. 아무 선수 페이지나 들어가 보시면 맨 마지막에 Value가 있는데요. Batting, Baserunning, Fielding, Replacement, Positional을 다 따로 표기해 놓았군요. Positional이 포지션 조정입니다.

      본문을 썼던 무렵에는 batting runs에 합쳐서 표기했던 것 같은데... 제 기억이 잘못된 것일지도 모르겠습니다.

  10. ㅇㅇ 2017.03.18 21:28 Address Modify/Delete Reply

    Replacement level 설정에 600/20 이라 적혀 있는데 20/600 아닌가요?

  11. 보트영섭 2018.12.07 04:44 Address Modify/Delete Reply

    한국 야구 팬사이트는 폐쇄됐나요?


Jon Lester의 2009년 시즌 기록을 예로 하여 WAR을 구해 보자.


투수에 대한 이전 포스팅
에서 우리는 투수의 퍼포먼스를 평가하는 여러 가지 스탯을 살펴본 바 있다. 이 스탯들은 모두 해당 투수가 얼마나 실점을 하는지를 9이닝당 비율로 표시한 것이다. 댓글을 통해 ERA와 FIP, BABIP에 대해 camomile님과 매우 유익한 토론이 진행되었으므로 투수의 평가에 대해 관심이 있으신 분들은 꼭 위의 링크를 눌러 댓글을 읽어보시기 바란다. 원래 세이버메트릭스는 열린 개념이므로 정해진 결론은 없으며, 선택은 물론 여러분 각자의 몫이다...

어쨌거나, ERA나 FIP, tRA 등과 같은 스탯은 9이닝당 실점 수준을 보여 주지만, 여기에는 실제로 해당 투수가 그 시즌에 몇 이닝을 던졌는지는 반영되지 않는다. 9이닝당 1실점을 하는 압도적인 선발투수라고 해도, 50이닝만을 던지고 부상으로 시즌아웃 되었다면, 결코 좋은 평가를 하기는 어려울 것이다. 즉, 투수의 가치(Value)를 평가하기 위해서는 그가 얼마나 많은 이닝을 책임져 주었는지가 반드시 고려되어야 한다.

여기에서는, Fangraphs의 투수 WAR(Wins Above Replacement Level)를 계산하는 방식을 모델로 하여 투수의 가치를 구하는 방법을 살펴볼 것이다. 늘 강조하듯이 이것은 절대적인 단 하나의 방법은 아니며, 현재 나와 있는 여러 가지 방법 중 (내가 보기에) 가장 그럴 듯하여 소개하는 것이다. 또한 Fangraphs가 꽤 양질의 데이터를 모두 공짜로 보여주고 있어서 누구나 쉽게 찾아볼 수 있다는 장점도 있다.

(참고: 타자의 WAR 계산은 이전 포스팅을 참고.)

이 글에서는 우선 선발투수만을 대상으로 하고자 하며, 구원투수는 다음 포스팅에서 다루게 될 것이다. 구원투수를 따로 다루는 이유는 구원투수의 WAR 계산시 LI를 반영하는 단계가 중간에 포함되므로 별도의 설명이 필요하기 때문이다. 안그래도 항상 글이 긴 편인데, 구원투수의 LI 이야기까지 하면 아무도 읽고싶지 않은 엄청난 길이가 되어버릴 듯하여 글을 분리하기로 하였다.

이제부터 2009년 Jon Lester의 기록을 가지고, 투수의 WAR를 구하는 방법을 차례차례 살펴보도록 하겠다.
Fangraphs는 이 과정을 무려 일곱 개의 글에 걸쳐 설명하고 있는데, 내가 이걸 이해하는 데에는 무척 오랜 시간이 걸렸다. 나는 어떻게든 이 포스팅 하나로 몽땅 설명을 해 보고자 한다. 그것도 일곱 개의 원문보다 더 쉽게 말이다. 이게 가능한 목표일지는 모르겠지만... -_-;;;;


1. 투수가 속해 있는 리그의 평균 RA를 산출

우선 구하고자 하는 것이 ERA가 아니라 RA임에 유의해야 한다. 모든 종류의 실점을 아우르는 것이다.

Lester는 AL에서 뛰고 있다. 2009년 AL 전체 기록을 보면, 20173 1/3 이닝에서 10793점을 득점 혹은 실점하였음을 알 수 있다. (이런 기록은 Baseball-Reference에서 쉽게 얻을 수 있다.) 우리가 원하는 것은 경기당 평균 실점, 좀 더 정확히 이야기하면 9이닝당 평균 실점이다. 아래와 같이 간단히 계산할 수 있다.

AL avg RA = 10793 / 20173.333333 * 9 = 4.82


2. 투수의 조정 RA 산출

먼저 투수의 평균 실점 수준을 나타내는 스탯을 하나 골라서 가져온다. Fangraphs는 FIP를 이용하고 있고, 나도 FIP를 선호하므로, 여기에서는 FIP를 사용하도록 하겠다. (ERA나 tRA 등을 이용하고자 하는 경우에 대해서는 조금 아래에서 설명을 따로 드리도록 하겠다.) Lester의 2009년 FIP는 3.15이다.

FIP는 ERA Scale의 스탯이므로, 이를 RA Scale로 바꾸어 주어야 한다. ERA와 RA 사이에는 0.92:1의 관계가 경험적으로 존재하므로, 3.15를 0.92로 나눠 주면 RA Scale이 된다.

다음은 구장 효과인데... 구장 효과는 계산 방법이 여러가지이고 계산 방법에 따라 결과도 조금씩 다르다. 일단은 Fangraphs에서 제시하는 2004-2008년 5년간의 득점 Park Factor를 이용하도록 하겠다. Red Sox의 경우는 1.03으로 되어 있다. (이것은 홈에서 절반을 플레이하고 원정에서 절반을 플레이한다는 것을 이미 반영한 Adjusted Park Factor이다.) 즉, Lester는 Red Sox에서 뛰게 됨으로 인해 1.03배 더 실점하는 페널티를 가지고 있는 것이므로, 이를 보정해 주기 위해 다시 1.03으로 나눠 주어야 한다.

이 두가지 단계를 계산해 주면...

Adjusted RA = 3.15 / 0.92 / 1.03 = 3.32

이 3.32라는 숫자의 의미는... 중립적인 구장에서 평균 수준의 팀 동료들이 수비를 하고 있고, 상대 타선 역시 평균 수준의 선수들로 채워져 있을 경우, Lester가 9이닝을 던지면 3.32점 실점할 것이라는 뜻이다.

* 주 : FIP보다 ERA를 더 선호하는 경우, 위의 계산에서 FIP 대신 ERA를 사용하여 동일한 방법으로 Adjusted RA를 얻으면 된다. tRA를 사용하고자 하는 경우, tRA는 이미 RA Scale의 스탯이므로 0.92로 나눠 줄 필요가 없다. tRA에 구장 효과만 반영해 주면 된다.


3. 게임 당 평균 투구 이닝 계산

Lester는 32게임에 나와 203 1/3 이닝을 던졌으므로, 게임당 평균 투구 이닝은 다음과 같다.

IP/G = 203.333333 / 32 = 6.35


4. Runs per Win 계산

이 부분이 가장 어려운 부분일 것 같은데... 보통의 상황에서는 10점 = 1승으로 대충 계산하면 별로 오차가 발생하지 않는다. 하지만, 투수는 팀의 실점에 미치는 영향이 워낙 크기 때문에, 어떤 투수가 마운드에 있는지에 따라 Run Scoring Environment가 바뀌고, 이에 따라 점수와 승수의 관계도 바뀌게 된다.

조금 더 쉽게 생각하면... Lester와 같은 좋은 투수는 실점을 덜 하게 되므로, 보통 투수가 마운드에 있을 때에 비해 득점을 덜 해도 승리를 할 수 있게 되는 것이다. 반대로 3류 투수가 마운드에 있다면, 소속팀이 승리를 하기 위해서는 더욱 많은 득점을 해야 할 것이다. 이러한 변화를 반영하는 것이다.

투수의 퍼포먼스에 따른 점수와 승수의 관계를 계산하는 방법은 역시 여러가지가 있으며, 대부분은 Pythagenpat과 같은 득점/실점과 승률의 관계로부터 계산식을 이끌어내게 된다. 그러나, Pythagenpat을 직접 사용할 경우 제곱근을 구해야 하는 등 계산식이 복잡해지므로, 다음과 같은 근사식을 사용한다.

[((상대 팀 이닝*상대 팀 실점수준)+(소속 팀 이닝*소속 팀 실점수준)/(상대 팀 이닝+소속 팀 이닝))+2] * 1.5

근사식도 너무 복잡해 보이지만... 예를 통해 보면 조금 쉬울 것이다. 이닝 및 실점수준은 모두 9이닝을 기준으로 한다는 것을 기억하자.

상대 팀의 수준은 천차만별이겠지만... 162게임의 긴 시즌을 치르다 보면 여러 상대를 만나게 되므로, 결국 리그 평균에 가까워질 것이라고 볼 수 있다. 따라서, 상대 팀은 9이닝 당 리그 평균인 4.82점을 실점할 것으로 볼 수 있다. 한편 소속 팀의 경우... Lester가 선발로 나온 경기에서 9이닝 중 Lester가 책임져 주는 이닝은 평균 6.35이닝이었다. 나머지 2.65이닝은 리그 평균 수준으로 실점한다고 보고 계산한다. (분석 대상인 투수를 제외하고는 모두 리그 평균을 가정한다. 이렇게 해서 팀 동료들의 활약으로 인해 이득이나 손해를 보는 부분을 제거하고자 하는 것이다.)

이렇게 하면, 상대 팀 9이닝 + Lester 6.35 이닝 + Lester의 동료 구원투수들 2.65이닝 = 총 18이닝이 분모가 된다. 계산을 해 보자.

Runs per Win = [(((9 * 4.82) + (6.35 * 3.32 + 2.65 * 4.82)) / 18) + 2] * 1.5 = 9.43

즉, Lester가 마운드에 있음으로 해서 9.43점 = 1승으로 바뀌는 것이다.


5. RAA/9 및 WAA/9, 기대 승률 계산

2번에서의 계산 결과 Lester는 9이닝 당 평균 3.32점을 실점하는 것으로 계산되었다. 한편, 리그 평균 투수들은 4.82점을 실점하므로, Lester는 리그 평균 투수에 비해 9이닝당 1.49점을 덜 내주는 것이 된다. (1.50이 아닌 이유는 소숫점 반올림 때문이다. 아래에 첨부한 엑셀파일 참고.) 이를 4번에서 계산한 9.43점 = 1승의 관계를 이용하여 환산하면, Lester는 리그 평균 투수에 비해 9이닝당 0.158승 소속팀에 더 기여하는 것이 된다. 리그 평균 투수는 이론적으로 승률이 5할일 것이므로, 팀 동료와 상대팀 선수들이 모두 평균 수준일 때 Lester 등판 시의 9이닝 당 기대 승률은 0.500 + 0.158 = 0.658이다.


6. Replacement Level

Replacement Level 팀은 .300 정도의 승률을 가지는 것으로 생각된다. 팀 승률이 .300이라고 해서 선수들이 모두 평균이 50%일 때 각각 30% 정도의 능력을 가지고 있는 것은 아니다. 실제로는 .300 타자, .300 투수, .300 수비의 팀은 승수효과에 의해 .300보다 훨씬 낮은 승률을 기록하게 되어 버리는 것이다.

.300의 팀 승률을 얻기 위해, 선발투수는 .380, 구원투수는 .470 정도의 능력이 요구된다. 이는 어느 정도 통계적으로도 검증된 수치이고... 이론적인 설명을 위해서는 Odds Ratio Method에 대한 배경지식이 필요한데... 이 이야기를 여기서 하게 되면 글이 완전히 산으로 가게 되므로... 이 부분은 추후 별도로 포스팅하도록 하겠다.

여기서는 일단 Tom Tango와 Fangraphs의 주장을 받아들여 Replacement Level의 투수의 승률이 .380인 것을 인정하고 넘어가도록 하자. 이것은, 소속 팀의 다른 동료들이 모두 리그 평균 수준이고, 상대 팀도 전부 리그 평균 수준의 선수들로 구성되어 있을 경우, Replacement Level 투수(예를 들어 AAAA 투수)가 선발 등판하여 9이닝을 던지면 .380의 승률을 기대할 수 있다는 의미이다.


7. WAR/9

9이닝당 Jon Lester의 기대 승률은 0.658이었다. 그리고 Replacement Level 선발투수의 기대 승률은 0.380이었다. 따라서, 9이닝을 기준으로 Lester는 Replacement Level 투수보다 0.658 - 0.380 = 0.278 더 기대 승률이 높다고 할 수 있다.


8. WAR

드디어 마지막 단계까지 왔다. 7번에서 얻은 9이닝 당 숫자를 Jon Lester가 던진 실제 이닝으로 환산하여 주면 되는 것이다. Lester는 203 1/3 이닝을 던졌으므로...

WAR = 0.278 * 203.333333 / 9 = 6.3

결국 2009년 시즌에, Jon Lester는 Replacement Level 투수에 비해 6.3승 더 팀에 기여한 것이다.


- NL 투수 계산하기 -

NL 투수는 AL 투수와 비교하여, 매 경기마다 타석에 들어선다는 중요한 특징이 있다. 거의 대부분의 경우, 투수들은 형편없는 타자들이므로, 타석에서는 팀에 오히려 피해를 입히게 된다. 이를 반영해 주어야 제대로 된 선수 가치의 계산이 가능할 것이다.

2009년 Tim Lincecum의 경우, 투구 내용만 가지고 보면 8.9 WAR의 시즌을 보냈지만, 타석에서 0.7승 만큼 오히려 팀에 해를 끼쳤으므로, 결국 최종 WAR는 8.9 - 0.7 = 8.2 가 되는 것이다.

첨부파일을 통하여 이를 확인하시기 바란다.


- 투수의 수비 -

투수의 수비력은 이 글을 쓰는 현재 WAR에 반영되고 있지 않고 있다. 투수의 UZR 데이터가 없기 때문이다. 수비가 좋은 투수와 좋지 않은 투수의 경우 이를 적절히 감안하여 주어야 할 것이다. 특별한 근거는 없으나 투수 수비의 영향은 가장 극단적인 경우 한 시즌에 최대 +/- 5 Runs 정도 되지 않을까 싶다.


첨부: 선발투수 WAR 계산의 예 (AL, NL 각 5명)


Today's Music : Pearl Jam - Given to Fly (Live)


위대한 밴드의, 위대한 곡의, 위대한 공연.
Posted by FreeRedbird

댓글을 달아 주세요

  1. BlogIcon aslkjdqwe 2011.10.06 20:29 신고 Address Modify/Delete Reply

    WAR 관련해서 궁금한 게 하나 있어요.
    선발투수 WAR을 구할 때 가령 A란 선발이 240이닝을 소화했을 때, WAR을 구하는 과정을 생각해보면
    빠지는 240이닝을 대체선수레벨선발로 대체하는 식으로 계산하는 것 같던데
    실제로 A란 선수가 빠졌을 때 빠지는 240이닝을 대체선수선발이 모두 메꿀 리는 없을테니 불펜소화 이닝이 늘어나게 되어 위의 계산과는 좀 다르지 않을까요? 제가 뭔가 잘못알고 있는 것 같기도 하고..;
    (표현이 잘 안되네요;)

    • BlogIcon FreeRedbird 2011.10.07 09:39 신고 Address Modify/Delete

      말씀하신 대로 한 시즌에 240이닝을 넘게 던지는 에이스 급 선발투수가 replacement level 투수로 대체된다면, 일부 이닝은 아마도 불펜이 소화하게 되겠죠. 감독이 대체선발에게 240이닝이나 던지도록 내버려 두지 않을 듯 합니다.

      다만, 이것을 반영할 수 있는 계산방법이 마땅치 않습니다. 240이닝 중에 얼만큼을 불펜이 가져갈 지도 알 수 없고, 불펜 안에서도 다시 그 이닝이 어떻게 배분되는지도 알 수 없기 때문이죠.

      딱히 방법도 없을 뿐 아니라, 그냥 계산 하시더라도 오차가 그닥 클 것 같지는 않습니다. Replacement level 선발이 상대적으로 조금 일찍 마운드에서 내려간다고 하면 아무래도 미들 릴리프 내지는 롱맨 등이 이어받게 되겠는데요. 얘네들은 보통 불펜에서 가장 못 던지는 애들이고, LI가 낮은 상황에 주로 등판하는 관계로 연간 WAR이 0에 가깝습니다. (즉, 얘네들도 어차피 거의 replacement level 투수들입니다.)

      Replacement Level은 일종의 동일한 비교 척도 라고 보시면 될 것 같습니다. 해당 선수가 던진 만큼을 대체 시켰을 때와의 차이를 서로 비교해 보고자 하는 것이지요. 일부 이닝이 불펜으로 가는 효과는 팀마다, 감독마다 다르게 나타나므로 비교가 어려울 듯 합니다.

  2. doosan 2012.05.07 20:43 Address Modify/Delete Reply

    Runs per win이란 것이 팀이 그만큼 득점을 해야 1승을 딴다. 이런 의미인건가요?
    10점 = 1승에서 그런것 같아 보이지는 않는데... 어렵네요

    • BlogIcon FreeRedbird 2012.05.08 13:17 신고 Address Modify/Delete

      투수의 퍼포먼스를 평가할 때 Runs per Win을 반영하는 이유는... 투수의 실력에 따라 Run Environment가 바뀌고, 이에 따라 승패가 갈리는 데 필요한 점수도 바뀌기 때문입니다. 에이스가 마운드에 있다면 4점만 내도 이길 확률이 높지만, 허접한 투수가 마운드에 있다면 6점을 내도 확신이 서지 않겠지요. 그런 차이를 반영해 주는 것입니다. 즉, RA9 3.5의 투수와 RA9 4.0의 투수는 단순히 9이닝당 0.5점의 차이가 나는 것이 아니라, 그보다 더 큰 차이가 나게 됩니다. 3.5 짜리 투수가 팀에게 이길 기회를 더 많이 주기 때문이죠.

  3. pitch 2012.07.23 11:22 Address Modify/Delete Reply

    수비나 운에 의해 이닝수도 달라질텐데 그런 건 어떻게 보정하고 있나요?

    • BlogIcon FreeRedbird 2012.07.23 13:12 신고 Address Modify/Delete

      수비에 의한 차이를 정확히 보정할 방법은 없습니다. 그래서 FIP와 같이 수비의 영향을 받지 않는 스탯을 베이스로 사용하는 것입니다.

      운에 의한 차이는 어떻게 할 방법이 없고요. 얼마만큼이 운에 의한 것인지 정확히 말할 수가 없습니다. 단지 투수의 입장에서는 "운"이나 마찬가지인 구장에 따른 차이를 Park Factor를 써서 보정하는 것입니다.

      이닝 수 자체를 조정하는 일은 없습니다. 특정 타구를 수비수가 처리해 줬다면 이닝이 더 빨리 종료되었을 것이라든지 하는 등의 경우가 있을 수 있지만, 이것을 계산에 반영하기는 어렵습니다.

      이닝 보다는 상대한 타자 수를 기준으로 삼는 쪽이 더 정확한 비교가 됩니다. 예를 들어 K/9 보다는 K/PA가 좀 더 좋은 스탯 입니다.

  4. yoon9298 2013.10.04 01:30 Address Modify/Delete Reply

    내셔널리그 투수들의 타격이 war에 감안되는 부분에 관해 질문이 있습니다. NL에서는 사실상 특수한 경우를 제외하면 모든 투수들이 반드시 타격에 들어서야되는데, 그렇다면 투수들의 타격 war는 대체선수 기준을 일반적인 야수의 타격이 아니라 같은 투수들의 타격에 비교하는것이 맞지 않은가 궁금합니다.

    구체적으로 예시를 들자면, 평균적인 대체선수급 NL투수들의 타석에서의 평균 득점 생산력이 1이고(산출기준은 중요치 않겠지요), 대체선수 수준의 야수들의 생산력이 2라고 가정하면 타석에서 1.5의 생산력을 가진 투수는 대체선수급 야수의 생산력보다 -0.5가 아닌 대체선수급 투수의 생산력보다 0.5가 +되므로 오히려 타격에서 평균적인 투수들보다 팀에 기여하고 있는 것이 아닌가 의문이 드네요.

  5. RENAK 2015.08.13 17:23 Address Modify/Delete Reply

    투수의 WAR 계산법을 찾던 중 이글을 우연히 보게되었습니다.

    그런데 WAA/9은 어떻게 구하는지 알수있을까요? 다른건 다 이해가 되는데 그건 이해가 난해하네요

  6. 삼팬 2015.10.14 21:02 Address Modify/Delete Reply

    스탯티즈 축하드립니다. http://www.statiz.co.kr/glossary.php

실점을 막는 것은 득점을 하는 것과 똑같이 중요하다. 점수를 덜 줘서 이기는 것이나 더 내서 이기는 것이나 마찬가지인 것이다. 아니... 실제로는 실점을 줄이는 쪽이 조금 더 유리하다. Pythagorean Expectation 포스팅을 기억하시는지? 실점을 줄이는 쪽이 득점을 더 하는 것보다 약간 기대 승률이 높게 나오는 것이다.

실점을 줄이는 것은 투수와 수비의 몫이다. 특히 야구는 투수놀음이라는 말이 흔히 쓰일 만큼, 투수의 중요성은 막대하다. 수비가 형편없어도, 투수가 상대타자를 모조리 탈삼진으로 돌려세우면 여전히 무실점으로 막아내는 것이 가능하다. 하지만, 투수가 형편없다면, 수비가 아무리 좋아도 안타를 한 개도 허용하지 않는 것은 불가능하다. 심지어 인플레이 된 공은 무조건 잡을 정도로 수비력이 좋더라도, 투수가 던지는 족족 홈런을 허용할 경우 어떻게 해 볼 도리가 없는 것이다.

따라서, 투수의 능력을 측정하는 방법으로 ERA, 즉 투수가 얼마나 점수(자책점)를 내주었는지를 살펴보게 된 것은 어찌보면 당연한 일이었다. ERA는 꽤 오랫동안 투수를 평가하는 척도로 널리 이용되었고, 지금도 WHIP와 함께 가장 흔히 사용되고 있다.

오늘은 ERA 및 ERA의 대체 스탯들을 살펴보게 될 것이다. 그동안 타자에 대해 많이 썼으나 투수에 대해서는 다소 소홀한 감이 있었기에, 투수에 대해 쓰고 싶었던 참에 마침 VEB에서 vivaelpujols의 잘 정리된 글을 보게 되었다. 각각의 개념에 익숙치 않은 분들을 위하여, 좀 더 자세히 설명해 보고자 한다.


1. ERA (Earned Run Average)

ERA를 모르시는 분들은 아마 거의 없으리라 생각되지만, 기초를 다지는 의미에서 다시 한 번 짚고 넘어가도록 하겠다. 먼저 ER(Earned Run, 자책점)에 대한 이해가 필요한데, 투수의 잘못으로 내준 점수를 자책점이라고 하고, 투수의 잘못이 아닌 실점을 비자책점이라고 한다. 안타나 홈런, 볼넷 등으로 내준 점수는 기본적으로 자책점이지만, 만약 주자가 수비수의 에러로 인해 출루한 경우에는 비자책점으로 분류한다. 에러는 투수의 잘못이 아니라는 것이다. 여기서 재미있는 것은 투수 본인의 에러로 점수가 난 경우에도 비자책점이 된다는 것이다. 공을 던지는 사람으로서의 투수와 야수로서의 투수를 구분하고 있다는 의미이다.

ERA는 9이닝당 자책점의 비율을 의미한다. 즉, 다음과 같이 계산된다.

ERA = ER * 9 / IP

ERA에 대한 비판은 여러 가지 관점에서 생각할 수 있다. 우선, ER을 계산하는 방식의 문제이다. 예를 들어, 에러로 주자가 출루한 후 적시타를 맞아 주자가 홈인했다면, 이는 비자책점이 된다. 하지만, 에러는 수비수의 잘못이더라도 이후 적시타를 맞은 것은 일정 부분 투수의 책임이 있다. 그럼에도 불구하고 이 점수는 그냥 비자책점이 될 뿐으로, 투수에게 책임을 묻지 않는다. 또한, 2사 만루 상황에서 구원투수가 등판하여 주자일소 3루타를 맞고 3실점한 후 후속타자를 아웃시켜 이닝을 마무리한 경우, 모든 실점의 책임은 주자 3명을 내보낸 앞의 투수에게만 전가될 뿐, 3루타를 맞은 구원투수는 무실점으로 기록된다. 2사 만루에서 불을 끄는 것이 그의 임무였고, 그는 임무에 실패했지만, ER은 계산되지 않고, 따라서 ERA도 전혀 나빠지지 않는다.

다음은 좀 더 근본적인 문제인데... 점수를 내 주지 않는 것이 투수 혼자의 공이 아니라는 점이다. 실점을 막는 것은 투수와 수비 모두의 공이다. 뛰어난 수비수들이 뒤에 있다면, 투수의 ERA가 낮아지는 것은 당연한 것이다. 즉 실점을 얼마나 했는가는 팀 전체의 스탯인데도, ERA는 마치 투수 혼자만의 스탯인 것처럼 취급한다.

그리고... 자책점과 비자책점을 가르는 주요한 변수인 "에러"에 대해서도 문제를 제기할 수 있다. 특정 타구가 에러인지 안타인지를 판단하는 것은 일정 부분 기록자의 주관이 개입된다. (내야안타는 특히 그렇다.) 또한, 수비수는 어려운 타구를 무리하게 건드려서 에러를 낼 수도 있지만, 그냥 보수적으로 수비하여 안타를 내줄 수도 있다. 같은 타구가 수비수의 능력과 성향에 따라 에러도 될 수 있고 안타도 될 수 있는 것이다. 투수의 능력과 상관없이 자책/비자책이 결정되고, 이를 통해 투수가 평가받는 것은 불합리하다고 할 수 있다.

혹은 투수에 따라 단지 운이 없어서 안타를 유난히 많이 맞아 실점을 많이 하는 경우도 있을 것이다. BABIP는 상당 부분이 운에 의해 좌우되고, BABIP가 높으면 아무래도 실점을 하기 쉬워지므로, 자책점과 비자책점을 아무리 잘 분리해 낸다고 해도 운의 개입은 피할 도리가 없다. 운이 없어 실점을 많이 했는데 ERA가 높다고 욕을 먹게 된다면 꽤나 억울할 것이다.


2. FIP (Fielding Independent Pitching)

FIP는 옛날에 블로그에서 이미 다룬 바 있으나, 다시 한 번 정리해 본다.

실점을 기준으로 투수를 평가하게 되면 "수비"와 "운"이라는 방해 요소가 섞이는 것을 피할 수가 없으므로, 이런 투수와 상관없는 요소를 완전히 제거해버린 새로운 스탯이 개발되었다. 바로 FIP이다. FIP는 Tom Tango에 의해 처음 개발되었고, 이후 여러 사람에 의해 개량되었다.

과거 BABIP에 대한 선구적인 연구로 유명해진 Voros McCracken의 경우 BABIP는 투수의 능력과 거의 아무런 상관이 없다는 극단적인 주장을 했었는데, 이후 여러 사람의 추가 연구에 의해 BABIP는 운, 수비의 능력, 투수의 능력, 구장 효과 등 다양한 요인에 의해 결정된다는 결과를 얻게 되었다. 이 중에서 가장 큰 영향을 끼치는 Factor는 역시 "운"으로 나타났다.

FIP는 타자가 방망이로 공을 맞춰서 인플레이 된 경우, 즉 BABIP의 영향을 받는 경우를 모두 무시한다. 여기서 "인플레이"라 함은 타구가 페어 지역에 떨어져서 수비가 개입하게 된 모든 경우를 말하는 것이다. (파울플라이는 파울 지역에 떨어진 공이지만 수비수가 잡아서 아웃 처리하였으므로 역시 인플레이로 간주한다.) 이런 부분을 모두 제거하고 나면, 남는 것은 수비수들이 공에 손을 댈래야 댈 수 없는 플레이들만 남게 된다. 바로 홈런, 볼넷, 사사구, 삼진이 그것이다. FIP는 이들 스탯만을 이용하여 아래와 같이 계산한다.

FIP = (13*HR + 3*(BB-IBB+HBP) - 2*K) / IP + C

여기에서 C는 FIP를 ERA와 유사한 Scale로 만들어 주기 위한 상수(Constant)이다. 이 상수는 대체로 3.20 부근의 값을 가지는데, 매년 조금씩 변화한다. C를 구하는 방법은 아래와 같다.

C = (9*lgER + 2*lgK - 13*lgHR - 3*(lgBB-lgIBB+lgHBP)) / lgIP

여기에서 lgER은 League Total ER을 의미하며, lgHR, lgBB 등도 마찬가지로 리그 전체 합계를 이용한다. 위와 아래의 식을 비교해 보면, 이렇게 C를 계산할 경우 리그 평균 ERA와 리그 평균 FIP는 항상 똑같은 값을 가지게 됨을 알 수 있다. 참고로, 2009년 메이저리그의 C값은 3.18이며, 리그 평균 ERA와 리그 평균 FIP는 모두 4.32였다. 이렇게 만들어 준 덕에, FIP는 ERA와 유사한 값을 가지게 되므로 한 눈에 알아보기가 쉽다. 3.00 ERA가 좋은 것처럼, 3.00 FIP도 좋은 것이다.

FIP의 문제는, 인플레이된 공이 어떻게 되었는지를 완전히 무시하는 것이다. 위에서 언급했듯이, 비록 BABIP의 가장 큰 요소는 "운"이지만, 투수의 능력도 분명 한 몫을 하고 있는 것이다. 우리가 상식적으로 알고 있듯이, 투수의 구위가 좋으면 타자들이 좋은 타구를 잘 만들어내지 못하는 것은 일정 부분 사실이다. ERA가 투수의 능력과 상관없는 부분을 지나치게 많이 포함하고 있다면, FIP는 반대로 투수의 능력이 실제로 작용하는 부분을 일부 무시한다는 결점을 가지고 있다. 또한, FIP에는 park adjust가 이루어지지 않았다는 것도 문제로 지적된다. 그럼에도 불구하고, 수비와 운이라는 가장 큰 노이즈 요소를 배제하였다는 점에서, FIP는 투수의 순수한 능력을 평가하는 좋은 잣대가 된다.

FIP는 FangraphsThe Hardball Times 에서 찾을 수 있다.


3. xFIP

xFIP는 기본적으로 FIP와 계산 방법이 같은데, 한 가지 중요한 차이가 있다. 위의 FIP 식에서 실제 피홈런 숫자를 넣는 대신 고정된 HR/FB 비율을 이용하여 계산된 이론적 피홈런 숫자를 넣는 것이다. 이렇게 하는 이유는... 볼넷과 삼진, 사사구는 투수의 능력에 의한 것이지만, 피홈런의 경우 "운"과 "구장 효과"가 많이 작용되는 점을 고려하여 이를 보정한 것이다. 일반적으로 HR/FB 비율은 0.11이 이용된다. 투수의 능력 이외의 요소가 작용하는 부분을 제거하고자 함에 있어서, FIP보다도 더욱 철저한 스탯이라고 할 수 있다.

xFIP는 The Hardball Time에서 찾을 수 있다. 참고로 Adam Wainwright의 페이지를 링크하였다.


4. tRA

tRA는 FIP의 약점인 "인플레이된 공을 완전히 배제하는 것"을 보완하고자 Graham MacAree가 개발한 스탯이다. tRA의 기본 컨셉은, 마치 wOBA로 공격력을 측정할 때와 같이, Run Expectancy로부터 각 이벤트의 Expected Run Value를 구하여 이를 9이닝(27아웃)에 대한 예상 실점으로 바꾸어 산출하는 것이다.

이 페이지는 Stat Corner의 tRA 설명 페이지이다. 이 페이지에는 2008년의 이벤트별 Run Value가 나와 있는데, 이를 보면 tRA에 사용되는 스탯 혹은 이벤트를 알 수 있다. 즉, 삼진, 볼넷, 사사구, 라인드라이브, 그라운드볼, 외야플라이, 내야플라이, 홈런 갯수가 계산에 사용되는 것이다. 각각의 스탯에 각각의 Run Value를 곱하여, 27아웃을 기록하는 동안 예상되는 Run Value의 합을 구하면 바로 9이닝 당 예상 실점이 된다. ERA가 9이닝당 자책점인 데 비해, tRA는 위의 이벤트 별 스탯을 바탕으로 9이닝당 예상 실점을 구하는 것이다. 이 과정에서, 수비의 수준과 홈구장 등은 모두 중립으로 조정된다.

이 tRA는 Stat Corner 및 Fangraphs에서 만날 수 있다.

중립적인 환경을 만들기 위해 조정을 실시하고, 타자의 방망이에 맞은 타구에 대한 투수의 영향력을 반영하고자 한 점에서, FIP보다 진보한 아이디어의 스탯이라고 할 수 있다. 그러나, Stat Corner와 Fangraphs에서 동일한 선수들을 비교해 보면, 같은 스탯임에도 불구하고 tRA가 서로 다르게 계산되어 있음을 발견하게 된다. 예를 들어, Chris Carpenter의 tRA는 Fangraphs에서 3.02, Stat Corner에서 2.77로 나온다. 이러한 차이가 발생하는 이유는, tRA가 라인드라이브, 그라운드볼, 플라이 등 인플레이 된 공을 어떻게 기록하느냐에 따라 달라질 수밖에 없기 때문이다. 타자가 친 공이 라인드라이브인지, 플라이인지, 그라운드볼인지를 결정하기 위해, Fangraphs는 BIS의 PbP 데이터를 이용하는 반면 Stat Corner는 MLB Gameday의 PbP 데이터를 이용한다. 특히 플라이볼과 라인드라이브의 구분에는 어느 정도 애매한 부분이 존재할 수밖에 없으므로, 기록자의 주관적 판단에 따라 기록이 달라지고, 결국 tRA 값이 영향을 받게 된다. FIP를 보완하기 위해 인플레이 된 결과물을 반영한 결과, 기록자의 주관적 판단이 개입되는 오차가 생긴 것이다. 이것이 tRA의 단점이다.


5. tRA*

tRA*는 tRA에 회귀분석을 적용한 스탯이다. 삼진 비율, 볼넷 비율, 사사구 비율, 그라운드볼 비율 등 모든 이벤트의 발생 비율에 대해서 해당 투수의 커리어 year-to-year correlation을 바탕으로 해당 시즌에 몇 명의 타자를 상대했는 지를 감안하여 적절한 수준의 regression을 해 주는 것이다. tRA*는 투수들 간의 퍼포먼스를 비교하기보다는 해당 투수가 앞으로 어떤 성적을 내줄 지를 예상하기 위한 목적으로 개발되었다.

tRA*는 Stat Corner에서 찾을 수 있다.



그럼 어떤 스탯이 투수를 평가하는 데 가장 좋은 스탯일까? 지금까지 살펴 보았듯이 단 하나의 정답은 없다. ERA에는 투수의 능력과 상관없는 다른 요소가 많이 개입되어 있다. FIP, xFIP는 투수의 능력 이외의 다른 것을 제거하려고 하다가 투수의 능력이 작용하는 부분까지 잘라내 버렸다. tRA는 이를 보완하려고 시도하였으나 대신 Play by Play 기록자의 주관이라는 새로운 노이즈가 추가되었다.

개인적으로는 이들 중 FIP 및 xFIP를 주로 참고하는 편이다. ERA에 포함되는 이런저런 외부 요소가 너무 많아서 도무지 신뢰할 수가 없기 때문이다. FIP에는 빠진 부분이 분명 존재하나, "운"이라는 요소를 배제하는 부분에서는 꽤 성공적인 스탯이라고 할 수 있다. 몇 가지의 Raw Stat만으로 쉽게 계산되는 것도 큰 장점이다. 또한 좋은 FIP를 받는 것(볼넷과 홈런을 덜 허용하고 삼진을 많이 잡는 것)이 수비의 질과 상관없이 실점을 막는 데 좋은 결과를 얻게 한다는 점은 부인할 수 없을 것이다.


투수에 관한 다음 포스팅에서는 투구 이닝 및 투수의 가치(Value: 투수의 WAR)에 대해 써 볼 예정이다.

(이 글은 한국야구팬사이트에서도 보실 수 있습니다.)


Today's Music : Lynyrd Skynyrd - Free Bird (Live)



이쯤에서 이 블로그와 뗄래야 뗄 수 없는 곡을 소개해야 할 것 같다. FreeRedbird라는 필명은 이 곡의 제목에서 온 것이다. Viva El Birdos에서 활동하기 위해 SB Nation에 가입하려고 할 때... 아이디를 뭘로 할까 고민하던 중 이 곡을 듣게 되었다. 결국 곡 제목을 아이디로 쓰기로 했고, Cardinals 팬이라는 정체성을 나타내기 위해 Red를 중간에 삽입하여 FreeRedbird가 탄생한 것이다. 그런데... 지나고 나서 생각해보니 FreeRedbird보다는 RedFreebird가 좀 더 낫지 않았을까 하는 후회가 들기도 한다. ^^

어쨌거나... Gary Rossington의 슬라이드 기타, 그리고 곡 중후반부에 이어지는 기타 3대의 현란한 연주가 잊을 수 없는 감동을 선사하는 명곡이다.

Posted by FreeRedbird

댓글을 달아 주세요

  1. camomile 2009.12.01 13:20 Address Modify/Delete Reply

    개인적으로 FIP는 투수스탯을 볼때 아예 배제하고 보는 스탯입니다. 인플레이상황에서 안타가 될 확률, 즉 BABIP가 모든 투수에게 동일하게 적용된다는 기본 가정부터 말이 안되는 스탯이기때문입니다. 제가 보기엔 FIP혹은 BABIP가 말하는 '운'이란 요소를 적용하려면 한 선수, 즉 그 선수의 커리어 내에서만 판단해야하는 것이죠. 전성기를 달리고 있는 A라는 투수의 BABIP 5년기록이 예를 들어 .258/.267/.245/.313/.263 이라고 가정할 경우 A의 4번째 시즌은 운이 나쁜 것이 맞습니다. 하지만 투구스타일이 틀린 B와 C 두 선수의 경우 B의 전성기 5년간 BABIP가 .258, C의 5년간 BABIP가 .313이라 해서 C가 B보다 운이 나쁜 투수였다고 말하는 것은 말도 안된다는 소리죠. 또한 D라는 투수의 전성기 5년간 BABIP가 .258이고 은퇴전 5년간 BABIP가 .300이라 해서 D의 전성기는 운이 좋았고 말년엔 운이 나빴다고 할 수 없는 것이죠. 투수마다 투구스타일에 따라 각각의 고유한 BABIP를 가지는데 리그전체 BABIP를 보고 각 투수의 그해스탯을 운이좋았다나빴다고 판단하는 것은 분명한 오류입니다. 그리고 삼진 많이 잡는 투수에 대한 과도한 고평가가 내재되어있는 스탯이기도 하구요. BABIP가 삼진율이 높으면 급격히 높아지는 스탯입니다. 즉, '9이닝당 삼진을 많이 잡는 투수일수록 운이 나쁜 투수'가 되는 것이죠. 계산식 자체에도 분명한 한계가 있는 스탯임에 틀립없지요.

    • BlogIcon FreeRedbird 2009.12.01 18:00 신고 Address Modify/Delete

      우선... 제가 늘 말씀드리는 바와 같이... 특정한 하나의 스탯만 가지고 선수를 평가할 수 있는 방법은 없습니다. 각 스탯의 장점과 한계를 파악하고 목적에 따라 그때그때 복합적으로 참고하는 것이 좋은 방법이 되겠지요.


      그냥 예를 들어서 말씀하신 숫자임은 잘 알고 있습니다만... BABIP .258과 같이 극단적으로 낮은 수치는 Hoyt Wilhelm(커리어 BABIP .253)이나 Ed Walsh(커리어 BABIP .260) 과 같은 옛날 투수들에게서나 흔히 볼 수 있을 뿐, 현재 활동중인 투수들의 BABIP 차이가 그렇게 크게 나타나는 일은 별로 없습니다...

      님께서는 서로 다른 시대와 리그에서 뛰었던 선수들 간의 절대적 비교 및 표준화에 관심이 많으신 것으로 생각합니다. 리그 평균 BABIP가 서로 다른 1950년대와 2000년대의 투수를 그냥 비교하여 단순히 운이 좋았다 나빴다 라고 이야기하는 것은 당연히 말도 안되는 일이죠. 비교를 위해서는 리그 평균을 고려한 조정이 있어야 할 것입니다.

      허나 같은 시대에 같이 활동하는 투수들의 BABIP 차이는 그다지 많이 나는 것으로 보이지 않습니다. 같은 시대를 살아가는 투수들끼리의 비교에서는 BABIP의 차이에 대해 어느 정도(절대적이라는 게 아니고 "어느 정도"임을 다시 강조합니다.) 실력과 상관없는 요소가 개입하고 있음을 인정해야 하지 않을까 생각됩니다.

      현역 투수들의 커리어 BABIP 분포에 대해서는 개인적으로 조금 더 research를 한 뒤 말씀드리죠. BABIP와 탈삼진 비율 간의 관계 역시 제가 직접 연구를 조금 하고 나서 답변을 드리겠습니다.

      BABIP가 투수와 아무 상관이 없다는 McCracken의 주장은 너무 극단적인 것임을 이미 본문에서 말씀 드렸습니다. 투수의 구위가 좋으면 타자가 범타를 많이 치는 것은 당연한 일이죠. 다만 제가 강조하고 싶은 것은 투수의 능력이 BABIP에 미치는 영향은 "제한적"이라는 것입니다.

      투수의 BABIP를 결정하는 데 있어 각 요소가 미치는 영향의 상대적 비율에 대해서는... Baseball Prospectus의 책 <Baseball between the Numbers>의 "When Does a Pitcher Earn an Earned Run" 챕터를 참고하시면 다음과 같이 나옵니다.

      Luck 44%
      Pitcher Ability 28%
      Defense 17%
      Park Effect 11%

      즉 투수의 능력이 28%이고, 투수 능력 이외의 부분이 72%인 것이죠. 이 숫자가 얼마나 정확한지는 모르겠습니다만... 단지 28%만 투수 고유의 능력이 반영되는 BABIP에 대해 "각각의 투수가 고유의 BABIP를 갖는다"고 하시면 비약이 되지 않을까요?? 투수의 능력과 상관없는 부분이 훨씬 크게 작용하니까요.

      FIP와 같이 인플레이 된 공을 모두 무시하게 되면... 이 28%를 잃어버리게 됩니다. 그만큼 부정확한 부분이 생기는 것은 인정합니다만, 투수가 컨트롤할 수 없는 나머지 72%를 제거함으로써 얻는 이득이 훨씬 크지 않을까요? 저는 그렇게 생각하기에 FIP를 즐겨 사용합니다.

      camomile님께서는 투수를 평가할 때 어떤 rating stat을 주로 사용하시는지요...??


      그리고.. 이것은 포스팅에 좀 시간이 걸릴 것 같습니다만... FIP는 사실 BABIP를 완전히 배제하는 스탯은 아닙니다. 단지 regression이 된 거죠. 인플레이된 공에 대한 평가는 다른 요소들의 앞에 붙어 있는 가중치(홈런에 13, 삼진에 -2, 볼넷 및 HBP에 3)에 사실 약간씩 녹아 들어 있습니다. 이것은 좀 방대한 이야기가 될 것 같기도 하고, 개인적으로 아직 정리가 안된 부분도 있어서요.. 나중에 별도의 글로 정리하고자 합니다.

  2. camomile 2009.12.02 12:00 Address Modify/Delete Reply

    긴~글을 적었는데, 남의 블로그에 와서 이렇게 긴 글을 댓글로 올린다는 자체가 약간 민망하기도 합니다.^^

    FIP의 주된 문제중 하나는 9인게임인 야구에서, 수비의 능력을 완전히 배제한다는 데 있습니다. 완전히 배제하기보다는 Replacement Revel의 수비를 상정하는 것이 더 합리적이라는 이야기죠. 수비의 능력을 완전히 배제함으로써 탈삼진형투수가 극도로 유리한 비정상적인 결과가 산출된다는 것이 굉장히 큰 문제입니다. 게임당이닝도 더 많고(IP/G), 9이닝당 홈런도 더 적고(HR/9), 9이닝당 볼넷도 더 적고(BB/9), 평균자책(ERA) 및 9이닝당 출루허용률(WHIP)에서도 압도적인 그렉 매덕스가 단지 삼진이 더 적다는 이유로, 보다 직접적으로 말하자면 인플레이상황을 더 많이 만든다는 이유로 FIP상에서 랜디 존슨에 비해 저평가를 받게된다는 것은 상식밖의 일입니다.

    저는 BABIP는 리그전체의 투수에게 동일한 값이 적용되어야하는 것이 아니라 투수에 따라 고유한 값을 가진다고 첫댓글에서 언급했는데요. 과연 그런지, 그것이 또한 직관적으로도 들어맞는지를 우선 검증하는 것이 필요하다고 생각합니다. 우선 인플레이상황에서 안타가 될 확률은 도대체 무엇에 의존하는지를 살펴봐야합니다. 일단 타구의 질을 들 수 있겠죠. 통계적으로 라인드라이브타구의 75%는 안타가 된다고 합니다. 그라운드볼은 25.2%, 플라이볼은 12.8%구요. 즉, 땅볼형투수는 플라이볼형투수에 비해 BABIP가 높을 가능성이 큽니다. 그렇다면 땅볼형투수는 플라이볼형 투수에 비해 BABIP 혹은 FIP에서 '운이 나쁜 투수'로 평가받을 확률이 높습니다. 직관적으로 봐도 플라이볼형투수는 홈런을 많이 허용하는 선수이므로, 점수를 허용할 확률이 땅볼형투수에 비해 더 높겠죠. 이 부분에서 FIP는 설명력이 아주 높은 스탯입니다.

    그렇다면 라인드라이브타구는 누가 결정하는가? 물론 타자의 영향이 매우 큽니다. 좋은 타자는 통계적으로도 LD%를 높게 유지하구요. 그 외 배드볼히터의 경우 나쁜공에도 뱃이 나가므로 LD%는 낮을 것이고, 반대로 선구안이 좋은 선수는 LD%가 높을것으로 예측됩니다. 실제로 선구안이 매우 좋다고 평가되는 푸홀스의 경우 커리어 LD%가 19.5%, 배드볼히터로 평가되는 게레로의 경우 12.5%군요. 전성기로 짤라서봐도 비슷합니다. 하지만 여기서 문제되는 것은 라인드라이브타구는 타자에게 전적으로 의존하는가?입니다. 만약 그렇다면, BABIP로서 리그 투수 전체의 일반적인 평균기준을 적용해서 각 투수마다 운이좋다나쁘다를 말할 수 있는 하나의 근거가 될수도 있겠고, FIP역시 스탯으로서 설명력이 매우높아질 수 있을 것입니다.

    그렇지만, 답은 라인드라이브타구에 투수의 능력이 개입될 여지가 있다는 겁니다. 각 투수의 투구스타일에 따라 고유한 BABIP를 가지게 되는 것이 이 답에 대한 근거가 될 수 있겠죠.

    Fangraph에서 BABIP순위를 살펴보면 BABIP와 운지수(ERA-FIP)는 거의 정비례관계를 가집니다. 즉, BABIP가 높을수록 그 투수는 운이 나쁘다고 보는 것이죠. FIP라는 스탯 자체가 BABIP를 기본개념으로 해서 만들어진 스탯이므로 당연하다 하겠습니다.

    이제 투수들을 BB/9를 기준으로 유형화해보겠습니다. 상식적으로 생각해볼때, 볼넷이 많은 투수가 BABIP가 높을까요 볼넷이 적은 투수가 BABIP가 높을까요? 당연히, 볼넷이 적은 투수가 BABIP가 높을수밖에 없습니다. 볼넷이 많은, 즉 제구가 나쁜 투수의 경우 스트라이크비율이 떨어지게되며 타자들은 그 투수의 스트라이크보다 볼을 쳐서 인플레이상황을 만들 확률이 높아지게 되고, 따라서 범타의 비율도 증가하게되는 것이죠. 그렇다면 볼넷이 많은 투수는 항상 BABIP가 낮고 볼넷이 적은 투수는 항상 BABIP가 높을까요? 당연히, 그렇지 않습니다. 볼넷이 많더라도 구위가 좋은 투수의 경우에는 볼을 던지더라도 타자들에게 효과적인 유인구로 받아들여지게되고, BABIP도 그만큼 낮출수있겠죠. (ex. 전성기의 박찬호, 배리 지토) 하지만 볼넷이 많으면서 구위도 형편없는 투수의 경우엔 볼은 유인구로서의 기능을 못하게되고 타자들은 스트라이크만 골라서 치게되므로 오히려 BABIP가 높아지게됩니다.

    볼넷이 적고 구위가 좋은 투수의 경우 자신의 구위를 믿고 가운데로 공격적피칭을 하는 경우가 많습니다. 이런 투수의 경우 피안타율도 낮고 삼진율도 높지만 한번맞게되면 좋은타구가 나올 가능성(LD%)이 높아지게 되죠. 즉, BABIP는 높아지게 됩니다.(ex. 전성기의 랜디 존슨, 커트 실링) 아마 삼진이 많아지게 되므로 BABIP((H-HR)/(AB-K-HR+SF))는 확실히 높아지게 되겠죠. 예외적으로, 볼넷이 적은데도 불구하고 BABIP까지 낮은 경우가 있는데, 제구혹은 공의 무브먼트가 매우 좋아 스트라이크존의 구석으로 공을 꽂아넣는 선수들이 이에 해당합니다.(ex. 전성기의 그레그 매덕스, 페드로 마르티네즈) 뭐 타자가 맞춰봐야 범타밖에 되지 않으니 BABIP는 낮을 수 밖에 없겠죠.

    위의 직관적 가정을 바탕으로 Fangraph에서 최근 5년간 BABIP순위를 보면서 한번 분석해보도록합시다. 최근의 기준으로 BABIP는 .300이상이 300미만보다 더 많습니다. 일단 .300이상을 BABIP가 높은선수, .300미만을 낮은선수라고 가정하고, 첫 번째, BABIP.300미만의 선수중 BB/9가 2.00이 안되는 선수를 A타입, 두 번째, BABIP.300이상의 선수중 BB/9가 3.00이 넘는 선수, 그 중에서도 BB/K가 2.00미만이며 HR/9가 1.00이 넘는 선수를 B타입이라 가정한후 이들을 가려보겠습니다. A타입 선수는 제구가 좋은데도 BABIP가 낮은 예외적인 경우이고, B타입 선수는 제구가 좋지 않으면서 구위가 나쁘지도 않은데 BABIP가 높은 예외적인 경우입니다. “제구혹은 무브먼트가 너무 좋아서 BABIP가 낮을 수 밖에 없는 선수”는 일단 제외하겠습니다.

    2005: A - 페드로 마르티네즈, 존 갈랜드, 앤디 페팃, 요한 산타나, 제프 위버, 크리스 카펜터, 바톨로 콜론, 브래드 래드키, 카를로스 실바, 존 리버, 랜디 존슨, 그레그 매덕스, 마크 벌리 / B - A.J 버넷, 맷 클레멘트, 존 래키
    2006: A - 로이 할라데이, 요한 산타나, 크리스 카펜터, 데이빗 부쉬, 그레그 매덕스, 마이크 무시나, 댄 하렌 / B - 비센테 파디야, 에릭 베다드,
    2007: A - 제임스 쉴즈 / B - 켈빔 에스코바르, 스캇 카즈미어
    2008: A - 리키 놀라스코, 제세 리치, 데릭 로, 폴 버드, 그레그 매덕스, 제임스 쉴즈, 로이 할라데이 / B - 맷 케인, 에딘손 볼퀘즈, 길 메쉬, 랜디 울프, 팀 린스컴, 펠릭스 에르난데스, 채드 빌링슬리, A.J 버넷
    2009: A - 테드 릴리, 크리스 카펜터, 댄 하렌, 마크 벌리, 조엘 피네이로, 하비에르 바스케스 / B - 호르헤 델라 로사

    보통 80명 내외의 선발투수중 연평균 10명 정도의 예외 선수가 나오는데요. 사실상 A타입의 선수의 경우 아까 얘기했던 제구가 너무 좋아 스트라이크존의 구석으로 공을 던지기 때문에 BB/9가 낮은데도 BABIP가 낮은 경우까지 생각한다면 순수한 예외선수는 8명도 안된다고 봐야겠지요. 05년의 페드로, 페팃, 산타나, 카펜터, 매덕스, 벌리 06년의 할라데이, 산타나, 카펜터, 매덕스, 하렌 07년의 쉴즈 08년의 매덕스, 쉴즈, 할라데이 09년의 카펜터, 하렌, 벌리 정도가 “제구혹은 무브먼트가 너무 좋은 경우”에 해당하는 투수라고 보입니다. 할라데이, 산타나, 매덕스, 카펜터, 하렌, 벌리는 예외 선수 명단에 꾸준히 들고 있는 것을 보면 BABIP가 투구스타일에 따라 고유한 값을 가진다는 가정이 더더욱 맞아떨어진다고 보여지네요. 나머지 예외선수들은 그야말로 BABIP 혹은 FIP가 얘기하는 운이 좋았던/나빴던 선수라고 보여지구요.

    이처럼 라인드라이브의 확률, 나아가서 BABIP에 투수가 미치는 영향도 상당하구요. 이에 따라 FIP라는 스탯은 ERA를 궁극적으로 대체할수 없는 스탯이라고 생각합니다. 제가 이런 의문을 가지게 된 첫 번째 이유는 94,95의 매덕스보다 01~04의 랜디가 FIP가 훨씬 좋다는 점, 99페드로가 00페드로에 비해 FIP가 훨씬 좋다는 점 때문이죠. 조정방어율 구하는 공식으로 조정FIP를 구해봐도 마찬가지구요. 00페드로의 경우 사실 지켜보는 입장에서 입이 다물어지지않는 퍼포먼스를 보여줬죠. 끝도 없는 삼자범퇴, 무시무시한 포심과 체인지업은 쳐봐야 범타, 당연히 BABIP가 낮게 나올수밖에 없는 상황인데도 BABIP나 FIP상에서는 단지 운이 좋은 투수로 치부되는 점, 게임당 8이닝을 먹고 53경기 출장에 고작 54개의 볼넷을 내주고 12개의 홈런만 맞았으며 역시 줄창 던져대는 투심은 쳤다하면 범타, BABIP가 높아질 수가 없었던 94.95의 매덕스가 FIP에서는 운좋은 투수로 치부되는 점은 정말 상식밖이라 생각합니다. (그것도 94년의 ERA-FIP는 -0.83, 95년의 ERA-FIP는 -0.63 FIP에 따르면 94.95의 매덕스는 2년 연속으로 무지막지하게 운좋은 투수였다는 것이죠)

    저는 아직도 ERA를 궁극적으로 대체할 스탯은 없다고 보이며, 피OPS를 보조적으로 보고, 또한 그 해 최고의 투수를 평가하는데는 리그및시대조정된 Pitching Runs, 혹은 PRAR을 사용합니다. 물론 K/9, BB/9, K/BB, HR/9, BABIP 같은 경우 이처럼 투수의 스타일을 알려주는데 도움이 되죠. 하지만 Fangraph처럼 FIP를 기준으로 투수의 시즌공헌도(WAR)를 평가하는건 상당히 문제가 있다고 생각합니다. FIP로 보면 95년 최고의 투수는 도끼네 매덕스가 아니라 시애틀의 랜디 존슨이 되는데 이게 과연 투수의 능력을 더 정확히 보여주는 잣대인지 매우 의문이 드네요.(조정FIP로 봐도 95매덕스 187, 95랜디 226입니다.) ERA가 문제많다많다하지만 당해투수의 퍼포먼스를 이정도까지 왜곡하지는 않거든요.

    • BlogIcon FreeRedbird 2009.12.02 19:04 신고 Address Modify/Delete

      민망해하실 필요는 없습니다. ^^ 사실 camomile님과 같이 좋은 의견을 주시는 분들에게 Viva El Birdos의 Fanpost와 같은 게시판을 내어 드리고 싶은데요... 아쉽게도 티스토리가 게시판 기능을 지원하지 않는 것 같습니다. 제로보드를 붙이는 것도 불가능하고... 이런 논의가 그냥 댓글 속에 파묻혀 버려서 좀 더 많은 사람들이 볼 수 없는 것이 너무 안타깝네요. 혹 국내에 블로그와 게시판을 동시에 지원하는 서비스가 있나요?? 좋은 곳이 있다면 이사를 고려할지도 모르겠습니다.

      어쨌거나... 본론으로 돌아가서... 남겨주신 글을 무척 흥미롭게 잘 읽었습니다. 라인드라이브의 영향 같은 것은 이미 공감하고 있는 부분이기도 합니다.

      일단 FIP는 수비의 능력을 배제하는 것이 아니고 수비를 리그 평균으로 regression하는 것입니다. 모든 투수의 등 뒤에 똑같은 수준의 수비수들이 있다고 생각했을 때의 퍼포먼스를 계산하는 것이죠. (또한 여기서 가정되는 것은 Replacement Level 수비수가 아니고 리그 평균 수비수 입니다.)

      Maddux와 Big Unit 간의 비교에서.. IP/G는 FIP나 ERA와 같은 레이팅 스탯과는 무관합니다. WAR나 VORP와 같이 Value를 구할 때 문제가 될 수 있겠지요.

      FIP에서 각 이벤트에 붙어 있는 계수(홈런 13, 볼넷 3, 삼진 -2)는 각 이벤트의 Run Expectancy로부터 산출된 것입니다. 소숫점으로 되어 있는 것을 정수화하는 과정에서 약간의 오차가 생길 수는 있습니다만, 탈삼진 투수를 특별히 과대평가하지는 않습니다. FIP가 좋다는 것은 상대 공격의 Run Expectancy를 떨어뜨리므로, 실점을 덜 하게 될 확률이 높아지는 것이죠.

      제가 볼 때는 Big Unit이 과대평가된 것이 아니고, Maddux가 과소평가된 것입니다. 아무리 봐도 Maddux는 다른 투수들에 비해 범타를 유도하는 능력이 뛰어났던 것 같은데, FIP에서 이를 적절히 반영해 주고 있지 않기 때문이죠. Maddux와 Big Unit의 비교에는 FIP 뿐 아니라 이러한 범타 유도 능력, 그리고 수비수들의 능력이 실점에 어떠한 영향을 미쳤는지까지 종합적으로 고려되어야 할 것입니다. 물론 얼마간의 "운"도 있었겠죠. 측정이 어렵지만 말입니다.

      라인드라이브 비율, 즉 LD%는 어느 정도 투수 고유의 수치를 가지는 것이 사실입니다. 그리고 말씀하신 대로 BABIP가 LD%의 영향을 받는 것도 사실이죠. 이렇게 보면 BABIP에 투수가 어느 정도 영향을 미치고 있는 것이 사실이고(저는 이것을 부인한 적이 한 번도 없습니다.), 따라서 FIP의 약점이 됩니다. 문제는 "얼마나 영향을 주는가" 입니다.

      Baseball Prospectus의 2009년 연구 결과를 보겠습니다. 대상은 2003-08년의 투수들 입니다.

      http://www.baseballprospectus.com/article.php?articleid=8932

      투수 스탯의 year to year correlation은 다음과 같이 나와 있습니다.
      K/PA 0.7686
      UIBB(고의사구가 아닌 볼넷)/PA 0.6682
      HR/PA 0.3769
      BABIP 0.2242
      투수 BABIP - 소속팀 수비 BABIP 0.1490

      만약 BABIP가 투수 고유의 skill이라면, 각 투수들의 year to year correlation이 높게 나타나야 할 것입니다. 투수별로 자기 커리어 내에서 BABIP의 편차가 크지 않아야 한다는 것이죠.

      그러나, 보시다시피 BABIP의 year to year correlation은 .2242로 낮은 편이며, 특히 수비의 영향을 배제하기 위해 소속팀 수비 BABIP를 빼 줄 경우 correlation은 0.15 수준으로 떨어집니다. 이 정도면 "미미한 상관관계"밖에 없다고 표현해도 될 것 같습니다. 0.15의 correlation을 가지는 스탯에 대해 "투수마다 고유의 숫자를 가진다"고 표현하는 것은 무리가 아닐까요?? 저는 Maddux와 같은 투수는 정말 특별한 예외의 case라고 생각합니다.

      반면, K 비율이나 BB 비율은 상관관계가 매우 높게 나타납니다. HR 비율의 경우 K나 BB보다는 약하지만 BABIP에 비하면 여전히 우수한 상관관계를 보여주고 있습니다. 이를 바탕으로 볼 때, BABIP를 포기하고 이보다 훨씬 투수 고유의 능력을 잘 보여주는 K, BB, HR 비율을 이용하여 산출하는 FIP가 다른 스탯들에 비해 우수하다고 보는 것이 충분히 합리적이지 않을까요? (HR비율의 correlation이 비교적 낮은 것이 신경쓰이시면 xFIP를 이용하시면 되지요.)

      이왕이면 BABIP에 미치는 투수의 약한 영향력도 고려해 주면 더욱 좋을 것입니다. 그래서 LD%를 포함하는 tRA가 개발되었습니다. 하지만, 본문에서 지적한 바와 같이 PbP 데이터를 기록하는 사람의 주관이 포함된다는 새로운 문제가 나타나게 됩니다. 만약 GB와 LD, FB를 무 자르듯 명확히 구분할 수 있다면, tRA가 가장 좋은 스탯이 되겠지요.

      참고로.. 첫 댓글에서 "삼진율이 높으면 BABIP가 급격히 증가"하고 다음 댓글에서 "볼넷이 적으면 BABIP가 높다"고 말씀하셨는데요.. 역시 Baseball Prospectus의 연구결과를 보면... BABIP와 삼진 비율 사이에는 -0.138의 미미한 역 상관관계가 있으며(삼진율이 높으면 BABIP가 내려가는 매우 약한 상관관계가 존재), 볼넷 비율과 BABIP 사이에는 -0.002로 아무 상관관계가 없습니다.
      http://www.baseball-analysis.com/article.php?articleid=9595

      ERA나 WHIP, 피OPS 등은 투수의 능력을 평가하는 유용한 도구가 되기에는 부족함이 너무 많습니다. ERA에 대해서는 이미 본문에서 네 가지의 중요한 문제점을 말씀 드렸습니다. 한 가지 예를 더 들어보죠. 8회 2사 만루에서 투수의 실투로 인해 2루타를 맞고 3실점하면, 에러와 투수교체가 없었다는 가정 하에 3 ER이 됩니다. 만약 9회말 동점 상황에서 2사 만루였고, 똑같이 투수가 실투하여 2루타성 타구를 맞았다면, 이번에는 1점이 나는 순간 게임이 끝나기 때문에 1실점만 한 것으로 처리되어 1 ER이 됩니다. 만약 앞의 두 경우에 있어서 중간에 수비 에러가 하나 끼어 있었다면, 똑같이 실투로 2루타를 맞았더라도 이번에는 0 ER이 됩니다. 투수는 이 모든 경우에 똑같이 실투를 하여 2루타를 맞았지만, 자책점은 제각기 다르고, 투수에 대한 평가도 모두 다르게 됩니다. 이런 엉터리 스탯이 과연 투수의 퍼포먼스를 제대로 평가할 수 있을까요? 만약 "상황" 혹은 Sequence라는 변수를 반영하고 싶으시다면 차라리 WPA가 대안이 될 수 있을 것입니다.

      WHIP은 볼넷, 1루타, 2루타, 3루타, 홈런을 모두 똑같이 취급하고, 게다가 고의사구와 보통 볼넷도 똑같이 취급합니다. 이게 얼마나 문제가 많은 접근법인지는 설명을 드리지 않아도 될 것 같습니다...

      피OPS는 OPS와 동일한 문제를 안고 있습니다. 1) 출루율과 장타율을 1:1로 반영하는 것, 2) 출루율 계산시 WHIP와 동일한 문제가 발생하는 것(모든 출루 이벤트를 똑같이 취급), 3) 장타율 계산시 안타의 가치가 타자주자가 진루한 베이스 숫자에 비례한다고 가정하는 것... 이렇게 세 가지 문제가 발생하죠. 2)와 3)이 상쇄되면 좋겠지만 안타깝게도 그렇게 되지 않습니다. 차라리 피wOBA나 피EqA가 나을 듯 합니다.


      ps. 선구안과 LD%의 상관관계는 잘 이해가 되지 않는데요.. Fangraphs에 의하면 Vladimir Guerrero의 커리어 LD%는 19.2%입니다. 또다른 배드볼 히터인 Garciaparra의 커리어 LD%는 21.8%로 Pujols보다도 높습니다. 선구안과 BB%는 밀접한 관계가 있겠지만... LD%와 관계가 있을지는 의문입니다. (이것은 나중에 시간 될 때 제가 직접 엑셀을 돌려 보도록 하지요...)

  3. camomile 2009.12.03 00:17 Address Modify/Delete Reply

    말씀대로 조정된 피wOBA나 피EqA를 제공해주는 사이트가 있다면 저는 피OPS보다 피wOBA,피EqA를 보조적으로 사용하겠습니다. 또한 LD% 게레로에 대한 건 제가 실수를 했네요. 죄송합니다.

    ERA나 WHIP가 당면한 문제점이 많은 것은 저도 인정하는 바입니다. 하지만, 이 두 스탯은 리그 전체 투수에 동일하게 적용되는 문제점입니다. ERA의 경우 '자책점'이라는 개념에 대한 갑론을박으로 일부에서는 ERA보다 RA(평균실점률)을 사용하기도 하지요.

    하지만, FIP의 문제점은 리그 투수들에게 동일하게 적용되지 않습니다. FIP로 투수를 평가하기 위해서는 투수의 스탯이 쌓이면 쌓일수록 그 투수의 커리어 ERA와 커리어 FIP는 수렴해야 정상입니다. 하지만 톰 글래빈 같은 투수의 경우 매년 FIP에 비해 상당히 낮은 ERA를 보이고 있습니다. 커트 실링의 경우 매년 FIP에 비해 상당히 높은 ERA를 기록하고 있구요. 글래빈은 매년 그렇게 운이 좋았던 것일까요? 실링은 매년 그렇게 운이 나빴을까요? 과연 BABIP에 투수가 미치는 영향이 미미한 수준으로 봐야하나요? 유인구를 많이 섞는 글래빈의 경우 범타유인률이 높아 BABIP를 낮게 유지할 수 있었으며, 무시무시한 구위의 포심과 스플리터로 타자와 정면승부를 고집했던 실링은 잘맞은 타구가 나올확률이 높아 BABIP를 높게 유지할 수 있다고 보는것이 더 옳지 않을까요?

    여기 또 한명의 선발투수가 있습니다. 이름은 랜디 존슨이라고 하죠. 이 선수는 초창기에는 A급 구위를 가졌으나 B~C급의 제구력을 가진 선수였습니다. 하지만 이 선수는 1995년을 기점으로 원래 A급이었던 구위가 A++급으로 올라갔고(K/9 10.0이상->12.0이상) 제구는 급격히 좋아졌습니다. (BB/9 3.0~7.0 -> 3.0미만) 제가 앞글에서 가정한 바 대로 이 선수의 BABIP를 예측해보죠. 이 선수는 95년 전에는 구위는 좋지만 제구가 딸려서 볼넷도 많이 주고, 타자들은 이 선수의 볼을 치다가 범타가 될 확률이 높아질 것 같네요. BABIP는 따라서 낮겠군요. 95년 이후의 이 선수는 제구도 좋고 구위는 메이저리그 올타임으로 따져도 5손가락안에 들 선수지요. 주구장창 자신의 구위를 믿고 정면승부를 할 가능성이 높겠군요. 타자들은 거의 손도 못대겠지만, 일단 맞으면 잘맞은 타구가 될 가능성이 높을것 같군요. BABIP는 높지 않을까요?

    실제로 랜디존슨이 풀타임을 뛴 89년부터 94년까지의 BABIP변화는 293,258,286,286,283,296입니다. 95년 이후 전성기의 마지막이라고 평가되는 04년까지의 BABIP변화는 321,313,291,333,306,336,328,300,357,283입니다. 이상하지 않습니까?

    Freeredbird님께서는 FIP상에서 그렉 매덕스는 과소평가되었다고 하셨는데, 제가 보기에는 매덕스 뿐만 아니라 글래빈, 전성기의 지토도 마찬가지입니다. 일일이 찾아보면 더 많은 선수가 나올 것 같네요. FIP로 투수를 평가한다면, 이런 선수들은 어떻게 구제하나요? 모든 선수를 일관된 잣대로 평가할 수가 없는데, 과연 그 Tool이 유용할 지 의문입니다.

    또한, 득점과의 Correlation 등 세이버매트리션들은 여러가지 각도에서 회귀분석을 하고 있는데요. 저는 Correlation이 높고, RMSE가 낮다고 해서 더 합리적인 스탯이라고 생각하지 않습니다. 왜냐하면 리그 전체 데이타로 분석해봐야 개별 선수관점에서 보면 분명히 달라지게되있거든요. 대표적 타격스탯인 Runs Created. 이제는 문제점이 너무 많은 스탯이기도 하지만, 그 많은 문제점 중 하나가 바로 준족의 선수가치를 완전히 무시하고 있다는 것이죠. 도루-도실의 even point 계산은 물론 득점과의 Correlation을 통해서 산출해냈겠지만, 사실 팀전체 RC를 구해봐도 도루의 가치는 도실에 의해 무의미해집니다. 개인적 관점에서 본다면 더더욱 그렇죠. 다른 스탯이 모두 같은 A와 B의 선수중 A는 1도루 0도실, B는 70도루 25도실을 했다고 가정시 RC상에서는 A선수가 B선수보다 높게되죠. 하지만 진짜 선수의 가치는 누가 더 높을까요? A,B 출루시 후속타자의 더블플레이확률, 후속타자 단타시 A,B의 추가베이스진루현황, A,B 출루시 배터리의 집중력 분산 및 투수의 멘탈에 미치는 영향, 실제 B도루시 포수의 송구에러...일일이 따져보지않아도 A보다 B가 더 가치있는 선수임에 분명하지만, RC에서는 그것을 반영하지 못하죠. 득점과 도루간 Correlation이 극히 미미하기때문에 EqA보다 wOBA의 Correlation이 더 높고 RMSE가 더 낮다는 것도 이해되는 것이죠. 하지만 제가 생각하기에 "선수개인"을 평가하는데 있어서 EqA는 wOBA보다 더 좋은 스탯입니다. 게다가 EqA는 도루-도실의 이븐포인트를 RC나 XR과 달리 합리적으로 잡고 있죠. 즉, 준족인 선수에 대한 가치를 더 높게 평가하고 있습니다. 치환시 발생하는 문제점을 없애기위해 치환하지 않고 단순한 RawEqA로 봐도 EqA는 상당히 합리적인 스탯이죠. 말이 좀 딴데로 갔는데, 세이버상에서의 다중회귀분석은 방법론상으로 적절치못하다는 것은 아니지만, 선수개인의 평가차원에서 그것을 그대로 적용하는 것은 빠뜨리는 부분이 많다는 것입니다. 세이버가 득세하는 최근에도 스몰볼은 여전히 야구의 큰 부분을 차지하고 있습니다. 희생번트, 도루, 힛앤런 같은 작전들이 큰 틀에서 보면 팀승률에 도움이 되지않을지몰라도 당시 경기상황, 즉 투수가 왼손투수인지 오른손투수인지, 다음 타자의 수준이 어떻게 되는지, 주자의 주루플레이가 평균이상인지, 포수의 어깨 및 포구능력이 어떻게 되는지에 따라 팀승률에 결정적인 역할을 할 수 있다고 생각됩니다.

    뭐 잠깐 산으로 갔지만, 결론은 BABIP는 통계적 결론에도 불구하고 투수에 의해 상당한 부분이 통제된다고 생각합니다. 따라서 FIP로 투수를 평가했을때, 분명히 그로 인해 피해를 보는 투수가 존재하므로 기존의 스탯을 대체할만큼 유용한 스탯이라고 보기에는 무리가 있다는 것이 제 주장입니다.

    • camomile 2009.12.03 00:24 Address Modify/Delete

      사족입니다만 우리의 소중한 리그 NO.1 Absolute Ace Chris Carpenter 역시 FIP의 가장 큰 피해자 중 하나라고 확신합니다.

    • BlogIcon FreeRedbird 2009.12.05 01:43 신고 Address Modify/Delete

      FIP 하나로만 투수를 평가한다면, 삼진, 볼넷, 홈런(플라이볼) 이외에 BABIP를 낮게 유지할 수 있는 다른 능력을 가지고 있는 투수일수록 본의아니게 피해를 입게 되겠지요. 그렇기 때문에 저는 LD%를 계산에 반영하는 tRA를 가장 중요한 보조 스탯으로 사용합니다. (아.. 본문에서 빼먹었는데.. tRA는 ERA가 아니라 RA Scale의 스탯입니다.)

      "모든 선수를 일관된 잣대로 평가할 수 없는데, 과연 그 Tool이 유용할 지 의문"이라고 하셨습니다만...
      모든 투수에게 공정하고 모든 투수에게 공평한 스탯이 존재하나요? ERA가 모든 투수에게 공정한가요? ERA나 WHIP이 FIP보다 공정하다고 볼 수 있는 근거가 무엇인지 잘 모르겠습니다. (FIP가 심지어 WHIP과 비교되게 되다니 불쌍하다는 생각도 드네요... ㅎㅎㅎ)

      ERA의 무수히 많은 문제점은 이미 여러 번 말씀드렸으니 더 이상 반복하지는 않겠습니다만... ERA의 특성상 수비력이 좋은 팀에서 뛰는 투수가 그렇지 않은 투수에 비해 실점을 덜 하게 되어 유리할 수밖에 없는데... 이것은 너무나도 불공평한 것이지 않은가요? 앞의 댓글에서 보여드린 것처럼 이전 투수가 내보낸 주자는 아무리 많이 홈으로 들여보내도 본인에게는 아무런 영향이 없는데, 이것이 과연 공정한 규칙인가요? 저에게 어느 쪽이 덜 불공정한 스탯인지를 물으신다면.. 역시 FIP의 손을 들어 주겠습니다.

      WHIP의 경우는 볼넷, 1루타, 2루타, 3루타, 홈런을 모두 동일하게 취급하므로... 볼넷 100개를 내준 투수와 1루타 100개를 맞은 투수, 홈런 100개를 맞은 투수가 모두 똑같은 WHIP을 가지게 됩니다. Run Value로 보면 홈런의 가치는 볼넷이나 1루타보다 3배 이상 많은데요... WHIP에서는 모두 동일한 가치를 가지는 것처럼 같은 값으로 regression 되어 버립니다. 즉... WHIP는 장타를 많이 얻어맞는 한심한 투수에게 유리한 스탯인 것입니다. 저는 ERA에 대해 매우 비판적이기는 해도 투수를 볼 때 참고 스탯으로 같이 활용하고 있습니다만... WHIP는 거의 쓸모 없는 스탯으로 생각하여 참고하지 않습니다. 참, 저도 ERA보다는 RA를 더 중시하는 쪽이기도 합니다.


      투수의 탈삼진 능력과 BABIP의 관계에 대해 말씀하신 가정은 저도 일리가 있다고 생각했기에, 제 나름대로 어설프게나마 검증을 시도해 보았습니다. 먼저 Baesball-Reference에서 1990년부터 2009년까지 20년 동안 1000IP 이상을 던진 투수 211명의 스탯을 다운받아서 K/9와 BB/9, BABIP사이의 상관관계를 구해 보았습니다. 그 결과는 이전 댓글에서 말씀드린 Baseball Reference의 결과와 거의 동일했습니다. K/9와 BABIP 사이에는 무척 미미한 음의 상관관계가 있었고(K/9가 높아지면 BABIP가 아주 조금씩 떨어진다는 거죠. 어차피 상관계수가 0.17에 불과하고 결정계수가 0.03이어서 설명력 자체가 별로 없습니다만.) BB/9와 BABIP 사이의 상관관계는 다중상관계수 0.003으로 전혀 아무런 상관이 없었습니다.

      여기까지 한 뒤에, 이것은 전체 리그를 대상으로 한 계산결과이고, 개별 투수들을 대상으로 하면 뭔가 다른 결과를 얻을 수 있지 않을까 라는 생각이 들었습니다. 말씀하신 Randy Johnson의 예처럼 말입니다. 그래서, 위의 1000IP 이상 투수들 211명 중에서 투구 이닝 수 상위 15명을 대상으로 각 투수의 커리어 내에서 다시 K/9와 BABIP의 관계에 대해 회귀분석을 시도해 보았습니다. 211명을 전부 다 하기에는 시간이 없어서요...

      분석대상 15명의 명단은 다음과 같습니다.

      Greg Maddux, Tom Glavine, Randy Johnson, Roger Clemens, Mike Mussina, Jamie Moyer, David Wells, Curt Schilling, Kenny Rogers, John Smoltz, Kevin Brown, Andy Pettitte, Pedro Martinez, Livan Hernandez, Chuck Finley

      실제로는 Tim Wakefield가 12위인데 너클볼러는 너무 특수한 케이스인것 같아 제외하였고, 대신 16위인 Finley를 넣었습니다. 모두들 쟁쟁한 이름들이죠... 마침 투구 스타일도 제각각이고.. 좋은 샘플들이라고 생각합니다.

      이들 각각의 커리어에서 50이닝 이하를 던진 해는 제외하고 year to year correlation을 구해 본 결과, 말씀하신 것과 같은 K/9와 BABIP 사이의 양의 상관관계, 즉 탈삼진 능력이 향상되면 BABIP가 올라간다는 것이 확인되는 투수는 Big Unit과 Smoltz 두 명 뿐이었습니다. Greg Maddux와 Livan Hernandez의 경우는 반대로 상당히 의미있는 음의 상관관계가 도출되었고요... 나머지 11명은 유의미한 상관관계를 찾을 수 없었습니다. Kevin Brown 같은 경우는 커리어에서 Randy Johnson 이상으로 드라마틱한 K/9 비율의 변화를 보였습니다만(4점대의 K/9에서 시작하여 9까지 올라갔다가 다시 서서히 내려옵니다) 상관계수가 0.08에 불과할 만큼 아무런 유의미한 관계를 도출하지 못했습니다. camomile님의 가설은 매력적입니다만, 아쉽게도 통계적으로 검증이 잘 되지는 않는 것 같습니다. Randy Johnson이 마침 제안하신 가설과 잘 들어맞는 예였던 것이지요.


      사실 똑같은 것은 아니지만, 비슷한 연구 결과가 있습니다. Tango/Litchman/Dolphin의 <The Book>에서 고의사구에 관한 챕터를 보시면 투수가 그냥 승부를 하는 경우와 Pitch Around하는 경우를 비교한 데이터가 있습니다. 이들도 "투수가 정면승부하지 않으면 타자가 제대로 맞추는 경우가 적을 것이다"라는 기대를 가지고 계산했으나 결과는 전혀 그렇지 않았습니다. 기대와 달리 그냥 승부할 때나 Pitch Around할 때나 거의 똑같았던 것이죠.

      Correlation과 RMSE가 모든 것을 설명해주지는 못합니다. 통계는 결국 도구일 뿐이지 그 자체가 목적인 것도 아니고요. 하지만 적어도 현 시점에서는 매우 유용한 접근 방법으로 널리 공인되어 있는 방법입니다. 절대적인 Best는 아니더라도 우리가 생각할 수 있는 수준의 합리적 접근이라고 생각이 되고요. 이것마저 부인하신다면 우리가 어떤 방법으로 야구의 통계적인 데이터를 분석하고 일반적인 결론을 도출하려는 시도를 할 수 있는지 잘 모르겠습니다. 이전 댓글에서 K/9의 연간 상관계수가 0.7686이고 수비를 뺀 BABIP의 연간 상관계수가 0.1490이라고 말씀 드렸습니다. 이는 K/9가 BABIP에 비해 0.7686/0.1490=5.16배 더 정확히 투수 고유의 능력을 잘 보여준다는 의미는 절대 아닙니다. 하지만, 이정도로 큰 상관계수의 차이가 존재한다면, 투수의 K/9에 대한 controlability는 BABIP에 대한 controlability에 비해 현저히 높다고 말해도 되는 것이 아닐까요? 적어도 이정도를 인정할 수는 있을 것 같은데요...

      중간에 RC를 비판하신 부분은 동감합니다. 물론 EqA가 wOBA보다 더 좋은 스탯이라는 부분만 빼고요. ^^ 저는 어디까지나 계속 wOBA의 편입니다.

      다만... 세이버메트릭스의 득세에도 불구하고 스몰볼이 여전히 야구의 큰 부분을 차지하고 있다고 한다면.. 그 득세하고 있는 세이버메트릭스가 잘못된 것입니다. 스몰볼을 무시하고 폄하하는 것은 세이버메트릭스 커뮤니티가 OBP를 무조건 신성한 스탯으로 떠받들던 한 10년 전 쯤의 이야기입니다. 희생번트가 무조건 나쁘다는 것도 그 시절의 주류 이론이었죠.

      Moneyball 책에 묘사된 세이버메트릭스가 그런 것일 수도 있겠네요. 책에서 워낙 스카우트와 스몰볼을 쓰레기 취급하고 있으니까요... 확실히 Oakland에서 Jeremy Giambi가 리드오프를 치던 시절의 세이버메트릭스는 실제로 그런 면이 있었고... 어쨌든 Billy Bean 단장의 Oakland Athletics가 계속 플레이오프 진출에 성공하고 Moneyball 책도 대박을 치면서 그런 이미지가 굳어진 측면도 있습니다.

      하지만 제가 블로그와 여러 게시판을 통해 공유하고자 하는 세이버메트릭스는 그런 편견 덩어리가 아닙니다. 최근에는 희생번트나 도루와 같은 플레이에 대해, 이전보다 훨씬 객관적인 시각에서 조명이 이루어지고 있습니다. 예를 들어, 다시 Tom Tango를 인용하자면, 주자가 1루에 나가서 도루가 가능한 상황이 되면, 타석에 들어선 타자의 wOBA는 평균 0.015 상승합니다. 1루주자로 인해 수비가 흔들리는 증거인 것이죠.

      역시 논의가 산으로 갔습니다만, 저는 역시 BABIP가 통계적 결론과 상관없이 투수에 의해 상당 부분 통제가 가능하다는 님의 결론에 동의해 드릴 수 없습니다. 이 문제는 McCracken이 BABIP에 대해 BP에 글을 쓴 이후 지금까지 약 10년 동안 세이버메트릭스 커뮤니티에서 가장 활발히 논의된 주제이지만, 앞의 댓글에서 보여드린 2009년 BP 연구에서 보시는 바와 같이 여전히 "BABIP에 대해 투수가 미치는 영향은 작다"는 것이 대세입니다. 남의 이야기를 무조건 신뢰하지는 않기에, 그리고 님의 가설이 설득력이 있다고 생각했기에, 저도 저 나름대로 통계적 검증을 시도해 보았습니만, 저 역시 투수가 BABIP의 상당히 큰 부분을 통제할 수 있다는 아무런 증거를 얻지 못했습니다. 또한, 투수가 BABIP에 미치는 영향은 제한적이므로, FIP는 충분히 유용한 스탯이며, ERA와 비교해도 상대적으로 공정한 스탯이라고 생각합니다.


      포스팅이 아니라 댓글을 달기 위해 이렇게 데이터를 잔뜩 받아서 분석하고, 며칠 동안 생각을 하게 될 줄은 몰랐습니다. 다만 님의 주장하시는 바에 동의를 해 드리기 어려운 것은 안타깝네요. ㅎㅎㅎ 저로서는 댓글을 통한 논쟁을 거치면서 오히려 FIP와 tRA를 주로 참고하는 제 방법에 오히려 더 신뢰를 가지게 되었습니다. ^^ 저와는 많은 부분에서 관점이 다르시지만 그래도 저는 님의 의견을 존중합니다. 언젠가는 제가 틀린 것으로 판명이 날 수도 있는 것이겠지요.

      우리나라는 세이버메트릭스 인구가 별로 없다보니 이런 토론을 할 기회도 찾기 어려운 것 같습니다. 앞으로도 계속 관심 가져 주시고 좋은 의견 부탁 드립니다. ^^

  4. camomile 2009.12.07 00:19 Address Modify/Delete Reply

    제가 WHIP를 보조적으로 사용하는 이유는 WHIP만큼 투수의 도미넌트함을 그대로 보여주는 지표가 없다고 생각하기 때문입니다. 경기보다보면 아 이선수 정말 잘한다는 느낌을 받는데 보통 WHIP가 굉장히 낮은 경우가 많더라구요. 즉, WHIP가 극히 낮은 선수(<1.0)는 운이나 이런 것보다 자신의 능력으로 도미넌트한 스탯을 찍는 경우가 많은데 보통 투수들의 경우 WHIP가 1이하로 떨어지면 대부분 자신의 커리어 BABIP보다 상당히 낮은 시즌BABIP를 기록하는데 이는 WHIP가 낮은 시즌의 그 투수는 스스로 안타를 억제할 수 있을만큼 도미넌트했다고 볼 수도 있겠지요.

    또한 BABIP는 단순히 BB/9, K/9등과 회귀분석을 돌려 상관관계를 보는 것 보다는 투수를 BB/9.K/9,피안타율,HR/9,WHIP 등을 기준으로 유형화해서 살펴봐야될 것 같아요. 실제로 구위가 어느정도 되면서 제구가 좋지 않은 투수를 AVG<.240, BB/9>3.50으로 유형화해서 살펴보니 총 35번의 시즌 중 29회(82.9%)가 자신의 커리어BABIP보다 낮은 BABIP를 기록했구요.(참고로 제 표본은 Freeredbird님의 표본투수+Al Leiter, David Cone, Mike Hampton, Park Chan Ho, Nomo Hideo, C.C. Sabathia, Cliff Lee, Tim Lincecum, Josh Beckett, Roy Halladay, Chris Carpenter, Brandon Webb, Jake Peavy, Roy Oswalt, John Lackey, Ben Sheets, Brad Penny, Barry Zito, Tim Hudson, A.J. Burnett, Carlos Zambrano, Johan Santana, Dan Haren, Javier Vasquez입니다.) 압도적으로 도미넌트한 시즌(WHIP<=1.0)을 보낸 투수는 그해 자신의 커리어BABIP보다 보통 낮은 BABIP를 기록한 경우가 많더군요.(23회중 20회, 87.0%)

    제가 뜻하는 바가 제대로 전달되었는지 모르겠는데(말주변이 없어서;;) 즉 각 스탯의 추세를 보면서 상관관계를 따지는 것 보다 투수를 스탯에 따라 유형화해야된다는 것이죠. BB/9가 낮은 투수, 높은 투수로 유형화할 것은 아니고 두 투수가 BB/9가 낮더라도 K/9, 피안타율, WHIP등에 따라 전혀 다른 투수가 된다는 것이죠.

    원초적으로 한결같이 BABIP가 낮은 투수와 한결같이 BABIP가 높은 투수가 있다면 당연히 의심을 해봐야하는 것이 아닌가 싶네요. 하지만 저도 이번 토론을 통해 FIP를 완전 배제하고 보는 스탯이 아니라 상당히 참고할만한 스탯이라는 점에는 공감을 하게 되었네요. 역시 팀수비에 따른 운이란 요소는 배제를 하는것이 당연하니까요.

    하지만 95 매덕스와 95 랜디는 FIP에 따르면 시즌을 100회 돌릴 경우 95 랜디가 95 매덕스보다 더 좋은 성적을 올릴 가능성이 높다고 보는 것인데 상당히 동의하기 힘드네요. 페드로 역시 시즌을 100회 돌리면 99년이 00년보다 훨씬 압도적인 성적을 거둔다는 것인데 과연?? 이란 생각이 듭니다. 페드로가 00년 세운 MLB 올타임 WHIP, 피안타율, 피출루율은 운에의한 것이었다는 것인데 글쎄요.

    암튼 Freeredbird님이 말씀하신 것처럼 좋은 토론이었구요. 질문하나 드리고 싶은게 있는데요. Fangraph의 WPA계산시 인플레이된후 유격수가 잡아서 1루수에게 어시스트를 한 경우, +되는 것은 투수가 아니라 유격수와 1루수인가요?

    • BlogIcon FreeRedbird 2009.12.07 11:26 신고 Address Modify/Delete

      그렇군요. WHIP가 한 눈에 "힐끗" 보기에는 쓸모가 있을 지도 모르겠네요. 물론 저는 WHIP 특유의 모든 이벤트를 똑같은 가치로 취급하는 regression 외에도 WHIP가 결국 피안타율과 BABIP에 큰 영향을 받는다는 것 때문에 거부감이 있습니다만... 나름 활용할 여지도 있을 것 같습니다.

      말씀하신 내용은 제 입장에서는 정반대로 생각하는 것도 가능합니다. 특정 시즌에 어떤 이유로 인해 BABIP가 낮다 보니 피안타율이 낮고(AVG <.240) 따라서 WHIP도 낮고, 도미넌트한 시즌을 보냈다고 인과를 뒤집어 해석할 수도 있는 것이죠. 이런 부분은 좀 더 연구가 필요한 것 같습니다. 그리고, 말씀하신 것처럼 스탯에 따라 투수를 유형화하는 것은 좋은 아이디어인 것 같습니다.

      시즌을 100번 돌리면 어느 쪽이 더 성적이 좋을까... 역사에 if가 없으니 알 수 없지만... 저라면 그래도 FIP가 낮은 쪽에 걸겠습니다. ^^ 이거 OOTP라도 가지고 실험을 해 볼까 하는 생각도 드네요. 물론 선수의 능력치를 어떻게 세팅하느냐에 따라 결과가 달라질 것 같아서 객관적 실험이 어렵겠지만 말입니다...

      WPA에 대해서는 저도 좀 더 살펴보고 답을 드리겠습니다.

    • BlogIcon FreeRedbird 2009.12.30 04:24 신고 Address Modify/Delete

      Fangraphs의 WPA 계산에서는 수비수에게 WPA가 가지 않으며, 오직 타자와 투수에게만 적용합니다. 이렇게 되면 공격측은 그렇다 치더라도... 수비쪽은 투수와 수비 간에 책임을 나누는 문제가 생기게 됩니다.

      HBP나 BB, K, HR, WP 등과 같은 플레이의 경우 아무 문제가 없습니다만... "잡을 수 있을 것 같은 공인데 수비수가 잡지 못한 안타"라든지, "잡을 수 있는 공을 놓친 에러"의 경우, 상당 부분 수비에게 책임이 있을 것입니다. 혹은 "매우 어려운 타구였으나 뛰어난 수비로 아웃 처리한 경우", 역시 상당 부분 수비에게 공이 있겠지요. 하지만 이렇게 책임 혹은 공을 투수와 수비 사이에서 나누는 것은 주관적인 판단의 영역이므로, Fangraphs는 모든 상황을 아예 100% 투수 책임으로 돌림으로써 주관의 개입을 배제해 버린 것이지요.

      투수 입장에서 한 시즌을 풀로 뛰다 보면 수비 덕분에 WPA에서 이득을 보는 때도 있고 손해를 보는 때도 있을 것이니 어느 정도는 상쇄될 것 같습니다만... 결국 좋은 수비수들과 같은 팀에서 뛰고 있다면 아무래도 WPA 계산에서도 이득을 보겠지요. 좋은 수비수들이 호수비로 아웃을 더 많이 만들어내지만, 그 공은 모두 투수에게 돌아가도록 되어 있으니까요...

  5. asd 2012.07.24 02:40 Address Modify/Delete Reply

    라인드라이브 비율, 팝업 비율 같은 경우는 투수가 상당부분 제어 가능한 영역인가요?

  6. k 2012.09.14 19:22 Address Modify/Delete Reply

    Expected Run Value라는 건 모든 투수에게 동일하게 적용되는 건가요?
    페드로처럼 출루를 매우 적게 허용하는 투수와 지토처럼 항상 주자를 쌓아놓는 듯한 투수는 똑같이 홈런을 하나 맞더라도 파생되는 실점이 차이가 날 것 같은데

    • BlogIcon FreeRedbird 2012.09.17 13:32 신고 Address Modify/Delete

      각 event의 run value는 리그 전체 기준이므로 모든 투수에게 똑같이 적용됩니다. Pedro와 Zito의 차이는 event별 run value의 차이가 아니라, event 자체의 발생 빈도에서 나타나게 됩니다. Zito는 Pedro보다 볼넷을 더 많이 허용하고, 라인드라이브도 더 많이 허용하므로, 당연히 주자도 더 많이 내보내고 실점도 더 많이 하게 되는 것입니다.


NLDS 2차전, 9회말 투아웃에서... Holliday가 공을 떨어뜨리는 장면.
다시 봐도 참 씁쓸하다...



Holliday가 저 공을 잡았다면, 물론 2차전은 Cardinals의 승리가 되었을 것이고, NLDS는 1-1이 되어 그 향방을 알 수 없게 되었을 것이다. 하지만, 한편으로 생각해 보면, 이 에러 뒤에도 Cardinals에게는 아직 기회가 있었다. 다음 타자를 아웃으로 처리하면 그만이었던 것이다. 하지만 Ryan Franklin은 후속타자들을 모두 출루시켜 결국 역전을 허용하고 말았다. 과연 Holliday의 에러는 얼마나 치명적인 피해를 입힌 것일까? Holliday 때문에 졌다고 말해도 되는 것일까?


아래의 논의는 Tom Tango 외 2인의 <The Book> 중 1장 "Toolshed" 편의 도움을 많이 받았음을 밝혀둔다.


1. 24가지의 상황

타자가 타석에 들어서서, 투수가 초구를 던지기 직전의 상황을 생각해 보자. 물론 도루와 같은 주루플레이도 일어나기 전이다. 얼마나 많은 상황이 가능할까?

우선 아웃 카운트를 생각할 수 있을 것이다. 노아웃, 1아웃, 2아웃의 세 가지가 있다. 3아웃에는 타자가 타석에 들어서지 않으므로 고려 대상이 아니다.

다음으로 어떤 누상에 주자가 있는지의 여부를 생각할 수 있을 것이다. 각각의 누상에 주자가 있을 수도 있고 없을 수도 있으므로, 1루, 2루, 3루에 대해 각각 "주자 있음"과 "주자 없음"의 두 가지 경우가 존재하는 셈이다.

아웃카운트와 주자에 대해 경우의 수를 계산해 보면,

3 x 2 x 2 x 2 = 24

이것이 타자가 타석에 들어섰을 때, 가능한 모든 상황의 갯수이다.


2. 24가지의 상황에 대한 Run Expectancy (기대 득점)

Tom Tango와 동료들은 1999년부터 2002년까지 4년간의 메이저리그 경기 기록을 모두 모아서, 위의 24가지 상황별로 정리하였다. 그리고, 각각의 상황에서, 해당 이닝이 3아웃으로 종료될 때까지 공격측이 득점한 점수를 모두 모아 보았다.

예를 들어, 무사 주자 1루의 상황은 4년 동안 44,552번 등장했는데, 이 상황 이후 해당 이닝이 종료될 때까지 공격측이 득점한 점수를 모두 더했더니 42,432점이었다. 그렇다면, 무사 주자 1루에서의 득점 평균은 아래와 같이 구할 수 있을 것이다.

42,432 / 44,552 = 0.953

이것이 바로 무사 주자 1루 상황의 기대 득점, 즉 Run Expectancy 이다. 철저하게 귀납적으로 계산된 결과임을 기억하자.

24개의 상황에 대해 모두 계산하여 표를 만든 결과는 아래와 같다.
원본 링크

RE 99-02 0 1 2
Empty 0.555 0.297 0.117
1st 0.953 0.573 0.251
2nd 1.189 0.725 0.344
3rd 1.482 0.983 0.387
1st_2nd 1.573 0.971 0.466
1st_3rd 1.904 1.243 0.538
2nd_3rd 2.052 1.467 0.634
Loaded 2.417 1.65 0.815




3. 홈런 1개의 Run Value, 아웃 1개의 Run Value

이제, 홈런이나 아웃과 같은 개별 사건이 공격측의 득점에 어떤 영향을 미치는지를 살펴보자.

무사에 주자 없는 상황에서, 타자가 타석에 들어섰다. 이 이닝에서 공격측의 평균 득점, 혹은 이 상황의 기대 득점은 위의 표에서 알 수 있듯이 0.555 이다. 이 때, 타자가 솔로 홈런을 쳤다면, 공격측은 1점을 득점하고, 상황은 아까와 똑같은 "무사 주자 없음"으로 돌아간다. 이 상황에서 순수한 기대 득점은 여전히 0.555 이지만, 이미 1점을 득점했으므로 이제 기대 득점은 0.555 + 1 = 1.555가 된다.

이 경우 순수한 홈런의 득점 가치(Run Value)는 어떻게 될까? 홈런의 "순수한 가치"는 해당 상황의 메이저리그 평균, 즉 보통의 타자가 보통의 방법으로 공격했을 때보다 몇 점이나 더 팀 득점에 "기여" 했는지를 평가하는 것이므로, "기말 기대 득점 - 기초 기대 득점 = 해당 사건의 순수한 가치"로 계산할 수 있다. 따라서, 이 경우는 1.555 - 0.555 = 1 이다. "솔로 홈런이 1점이니 당연한 결과가 아닌가?" 라고 생각하시는 분들이 계시겠지만... 이렇게 계산 결과와 상식이 일치하는 경우는 사실 얼마 되지 않는다.

이번에는 2사 주자 1, 3루인 상황을 가정해 보자. 이 상황의 Run Expectancy는 위의 표에서 알 수 있듯이 0.538 이다. 여기에서 타자가 3점 홈런을 쳤다면, 공격측은 3점을 득점하고 상황은 2사 주자 없음으로 바뀐다. "2사 주자 없음"의 기대 득점은 위의 표에서 0.117 이므로, 기말 기대 득점은 3 + 0.117 = 3.117 이다. 이 경우 순수한 홈런의 가치는?   3.117 (기말 기대 득점) - 0.538 (기초 기대 득점) = 2.579 이다.

3점 홈런을 쳤는데 왜 홈런의 가치가 3점이 아니고 2.579 일까? 아까 무사 주자 없음에서 솔로 홈런을 쳤을 때는 정확히 1점의 가치가 있다고 했는데... 도대체 무슨 차이가 있는 것일까?

무사 주자 없음의 상황에서 솔로 홈런을 치면 그 뒤에도 무사 주자 없음으로 같은 상황이 된다. 즉 점수가 났다는 것 이외에는 바뀐 것이 없는 것이다. 하지만, 2사 주자 1,3루에서 보통의 타자가 보통의 방법으로 공격을 했을 경우 평균적으로 0.538점을 득점하는 데 반해서, 3점 홈런을 친 후 2사 주자 없음으로 바뀌면 이제부터 기대할 수 있는 추가득점은 0.117점으로 크게 줄어든다. 메이저리그는 이 상황에서 평균 0.538점을 득점하지만, 홈런으로 인해 3점을 득점한 후 평균 0.117점을 추가득점하는 상황으로 바뀐 것이다. 위에서 이야기했듯이, "순수한 가치"는 평균적인 상황에 비해 팀 득점에 얼마나 기여를 했는지를 나타내는 것이므로, 기말에서 기초를 뺀 2.579가 이 경우의 순수한 3점 홈런의 가치가 된다.

이런 방법으로, 24가지의 상황에 대해 홈런의 순수한 가치를 모두 계산할 수 있을 것이다. 또한, 메이저리그에서 실제로 홈런이 발생한 상황이 24가지의 상황 중 어디에 해당하는지를 일일이 통계를 낸다면, 가중 평균을 구할 수 있을 것이다.

예를 들면, 1999-2002년의 4년 동안 무사 주자 없음 상황에서의 솔로 홈런은 5518번 나왔으며, 이 경우 솔로 홈런의 Run Value는 1 이다. 한편, 2사 주자 1,3루 상황에서의 3점 홈런은 312번 나왔으며, 이 경우 3점 홈런의 Run Value는 2.579 이다. 이런 식으로 24개의 상황을 전부 조사해서 가중 평균을 구하면 아래와 같이 계산할 수 있을 것이다.

[(1 x 5518) + ... + (2.579 x 312) + ... ] / (전체 홈런 수) = 1.397

24개의 모든 상황에 대한 표는 <The Book>에 실려 있으므로 참고하시기 바란다.

아래는 Tom Tango에 의한 Run Value 가중평균 계산 결과 중 일부를 소개한 것이다.

홈런   1.397
3루타   1.070
2루타   0.776
1루타   0.475
에러로 출루   0.508
몸에 맞는 공   0.352
볼넷(고의사구 제외)   0.323
폭투   0.266
도루 성공   0.175
일반적인 아웃 1개   -0.299
삼진아웃   -0.301
도루실패   -0.467



4. Scoring Distribution (득점 분포)

Tom Tango와 그의 동료들은 여기에서 그치지 않고, 지금까지 얻은 결과들을 바탕으로 Markov 연쇄모형(Markov Chains)을 이용하여 24개의 상황에 대한 기대 득점의 분포를 계산하였다. Markov Chains에 대한 자세한 설명을 여기서 다루는 것은 내 능력을 완전히 벗어나는 것으로... 관심 있으신 분들은 통계학 혹은 계량경제학 관련 서적이나 위키피디아 영문 링크를 참고하시기 바란다. 한글로 된 좋은 링크를 소개하기 위해 열심히 웹서핑을 했으나 찾는 데 실패했다. -_-;;; 솔직히 나 자신도 Markov 연쇄모형을 제대로 이해하고 있는 것 같지가 않다...

24개의 상황에 대한 표를 여기에 소개하기는 타이핑하기도 너무 힘들거니와 저작권법 위반이 될 것이다. 간단히 한 가지 경우만 소개하자면... 게임 당 평균 5점씩 득점하는 리그를 가정할 때, 무사 1, 2루에서의 기대 득점 분포는 다음과 같다.

0점 : 35.3%, 1점 : 22.0%, 2점 : 16.2%, 3점 : 13.1%, 4점 : 7.0%, 5점 이상 : 6.3%

Markov 연쇄모형의 강력함은 가정을 바꾸는 것에 따라서 계산 결과를 자유자재로 바꿀 수 있다는 것이다. 위의 경우에서, 보다 강력한 투수가 마운드에 등장하여 공격 팀의 득점 예상 수준이 게임당 5점에서 게임당 3.2점으로 떨어졌다고 하자. (아주 쉽게 말해 ERA 5.0인 투수를 ERA 3.2인 투수로 바꿨다는 의미이다. 물론 ERA라는 개념 자체가 갖는 근본적 문제가 있지만... 일단 여기서는 이정도로 넘어가자. 이것은 ERA 4.6인 투수를 ERA 2.94인 투수로 바꿨다는 의미이다. 왜냐하면, 실점과 자책점 사이에는 대략 "실점 x 0.92 = 자책점" 의 관계가 성립하기 때문이다.) 이렇게 투수를 바꾸면, 무사 1, 2루에서 기대 득점의 분포는 아래와 같이 변하게 된다.

0점 : 41.7%, 1점 : 22.8%, 2점 : 16.2%, 3점 : 11.0%, 4점 : 5.0%, 5점 이상 : 3.4%

확실히, 득점 특히 다득점 확률이 감소하고 있음을 알 수 있다.

타자를 리그 평균 타자에서 Albert Pujols로 바꾸는 등의 변화에 대해서도, 마찬가지로 득점 분포의 변화를 계산해 낼 수 있다.


5. Win Expectancy (기대 승률)

야구에서 이기기 위한 방법은 간단하다. 경기가 끝날 때까지 상대 팀보다 더 많이 득점하면 된다. 그렇다면, 특정 이닝의 특정 상황에서 홈팀이 이길 확률을 구하려면 어떻게 해야 할까? 현재 스코어를 고려하여, 경기가 끝날 때까지 홈팀이 원정팀보다 많이 득점할 확률을 계산하면 될 것이다. 앞에서 살펴본 Markov 연쇄모형을 이용하면, 어떠한 상황이라도 계산이 가능하다.

Win Expectancy의 표는 1회초부터 9회말까지 18개의 이닝에 대하여 각각 24개의 상황별로 홈팀의 승리 확률을 구한 것이다. 여기에 다 적기에는 너무 방대한데다가, 그 자체가 저작권법에 저촉되는 행위가 될 것이다. Tom Tango 자신이 인터넷에 공개한 샘플(6회초)만 옮겨 본다.

샘플 페이지 원본

Win Expectancy, by Game State

Inning: 6, Top

1B 2B 3B Out -4 -3 -2 -1 Tie 1 2 3 4
0 0.089 0.146 0.230 0.348 0.500 0.651 0.769 0.854 0.911
1 0.097 0.158 0.249 0.375 0.534 0.690 0.802 0.879 0.929
2 0.103 0.167 0.263 0.394 0.560 0.717 0.825 0.896 0.941
1B 0 0.078 0.128 0.204 0.310 0.448 0.594 0.717 0.812 0.881
1B 1 0.089 0.145 0.230 0.347 0.498 0.649 0.766 0.852 0.910
1B 2 0.099 0.161 0.253 0.380 0.542 0.697 0.808 0.884 0.932
2B 0 0.069 0.114 0.182 0.280 0.410 0.557 0.689 0.793 0.868
2B 1 0.083 0.136 0.216 0.327 0.473 0.625 0.749 0.840 0.902
2B 2 0.095 0.155 0.244 0.368 0.526 0.682 0.797 0.876 0.928
3B 0 0.058 0.098 0.158 0.247 0.369 0.517 0.662 0.774 0.856
3B 1 0.071 0.118 0.189 0.291 0.427 0.582 0.719 0.820 0.889
3B 2 0.093 0.152 0.240 0.362 0.519 0.675 0.793 0.873 0.926
1B 2B 0 0.062 0.102 0.164 0.253 0.372 0.506 0.633 0.742 0.827
1B 2B 1 0.078 0.127 0.202 0.308 0.445 0.590 0.711 0.806 0.877
1B 2B 2 0.092 0.151 0.238 0.358 0.513 0.665 0.780 0.862 0.917
1B 3B 0 0.051 0.085 0.139 0.218 0.327 0.463 0.602 0.720 0.813
1B 3B 1 0.067 0.111 0.178 0.274 0.402 0.548 0.682 0.786 0.864
1B 3B 2 0.089 0.146 0.231 0.349 0.500 0.652 0.770 0.855 0.912
2B 3B 0 0.046 0.078 0.127 0.201 0.303 0.431 0.569 0.695 0.795
2B 3B 1 0.062 0.102 0.165 0.255 0.377 0.517 0.652 0.764 0.848
2B 3B 2 0.087 0.143 0.226 0.341 0.490 0.639 0.757 0.845 0.906
1B 2B 3B 0 0.042 0.071 0.116 0.183 0.277 0.395 0.523 0.644 0.748
1B 2B 3B 1 0.060 0.099 0.159 0.245 0.362 0.495 0.622 0.731 0.818
1B 2B 3B 2 0.084 0.137 0.217 0.328 0.471 0.617 0.733 0.823 0.888

이 표는 홈팀의 입장에서 만들어진 것이다. 즉, 6회초에 동점이고 무사에 주자가 없는 경우(위 표의 빨간색 글씨), 홈팀이 이 경기를 이길 확률은 정확히 0.5 이다. 하지만, 홈팀이 원정팀에게 1점 뒤진 상태에서 2사 3루의 상황을 맞이한 경우(위 표의 파란색 글씨), 홈팀이 최종적으로 이 경기를 이길 확률은 0.362 로 내려간다.

이 표는 평균 5점을 득점하는 리그를 기준으로 만들어진 것이며, 양 팀 선수들의 능력이 모두 똑같다고 가정한 것이다. 투수와 타자의 능력, 야수들의 수비력, 구장 효과 등을 감안하여 보정해 주면, 더욱 정확도가 올라가게 된다.


6. 다시 처음으로 돌아가서... Holliday의 에러는 얼마나 치명적이었나???

이제 위에서 본 Win Expectancy를 바탕으로, NLDS 2차전에서의 Matt Holliday의 에러가 얼마나 치명적이었는지를 살펴보자.

Fangraphs는 매 게임별로 순간순간 Win Expectancy가 어떻게 변했는지를 거의 실시간으로 보여주는 훌륭한 시스템을 가지고 있다. 게다가 이 기대 승률은 리그 평균 득점을 반영하여 보정도 되어 있다. (이 사이트의 장점이나 활용도를 열거하자면 적어도 100가지는 꼽을 수 있을 것이다.)

NLDS 2차전의 기대 승률이 어떻게 변했는지 play by play로 보도록 하자. 여기를 클릭...!!

표를 보는 방법은 다음과 같다. 표에서 "WE" 열에 나타난 퍼센티지가 해당 플레이가 끝난 직후의 홈팀 기대 승률이다. 즉, 1회초가 시작되고 Julio Lugo가 아웃된 직후의 홈팀 기대 승률은 52.1%이며, Ryan과 Pujols까지 삼자범퇴 된 직후의 홈팀 기대 승률은 54.5%까지 올라가 있는 것이다.

이제 쭉... 내려가서 9회말로 가 보자. Manny Ramirez가 아웃되어 2사 주자 없음의 상황이 되고 James Loney가 타석에 들어섰을 때, Dodgers가 이길 확률은 4.1%에 불과하였다. 여기서 Loney는 좌익수 쪽으로 평범한 라인드라이브성 플라이를 날렸는데, Holliday가 이 공을 잡지 못하고 에러를 내면서 2루까지 출루하게 된다. 이 사건 직후 Dodgers가 이길 확률은 13.3%로 올라갔다. 이 숫자에 주목하시기 바란다. 치명적인 에러를 범했음에도 불구하고, Cardinals가 이길 확률은 여전히 86.7%로 매우 높은 상태였다는 것이다...!!!!  이렇게 높은 확률을 누가 다 까먹었을까? Ryan Franklin이다.

Holliday의 에러로 인해 Cardinals의 승리 확률은 95.9%에서 86.7%로 9.2% 낮아졌을 뿐이다. 여전히 아웃카운트 하나만 잡으면 끝나는 상황이라는 것은 변화가 없었다. 하지만 Franklin은 이후 네 명의 타자를 상대로 아웃을 전혀 잡지 못하고 볼넷 2개와 안타 2개를 내주면서 결국 역전을 허용하고 말았던 것이다.

아래의 그래프는 역시 Fangraphs에서 제공하는, 실시간 기대 승률 변화 그래프이다.


(그림을 클릭하면 크게 볼 수 있음)

9회 중간쯤에 있는, Cardinals 쪽으로 가장 경기가 기울었을 때가 바로 Ramirez 아웃 직후이다. 그 뒤에 살짝 올라간 부분이 바로 Holliday의 에러로 인해 경기가 Dodgers 쪽으로 약간 이동한 것이다. 나머지는 모두 Franklin의 공(?) 이다.

나는 여기에서 Franklin 한 명에게 책임을 뒤집어 씌우거나, Holliday가 잘했다고 칭찬하고자 하는 것이 아니다. 야구는 팀 경기이다. 예를 들어 Cardinals 타선이 2점 정도 더 득점했더라면, 9회에 2점을 주고도 여전히 이길 수 있었을 것이다. 패배의 책임은 팀 전체에게 있는 것이다.

팬의 입장에서 비싼 몸값의 스타 플레이어가 평범한 공을 놓치는 것을 보는 것은 물론 열받는 일이지만, 그 에러의 피해를 기대 승률의 측면에서 보자면 생각보다 훨씬 작은 것이었다. "그래도 Holliday가 공을 잡았다면 게임이 끝나는 것이지 않았는가???"라고 끝까지 주장하시는 분들께는... "만약 Franklin이 Loney를 삼진 처리했다면 애초에 에러가 발생할 리도 없지 않았겠는가??" 라고 반문하고 싶다. 다시 한 번 강조하지만, 패배의 책임은 팀 전체에게 있다. 굳이 가장 책임이 큰 한 명을 꼽으라면 주저하지 않고 Franklin을 선택하겠지만... 누구든 한 명에게만 모든 책임을 뒤집어씌우고 비난하는 것은 전혀 옳지 못하다.


이 글은 한국야구팬사이트에서도 보실 수 있습니다.


Today's Music : Thin Lizzy - The Boys Are Back in Town (Live)

https://www.youtube.com/watch?v=1FmPhJkdTwU

대중음악 역사상 최고의 명곡 중 하나이자, 최고의 라이브 퍼포먼스 중 하나...
(동영상을 직접 붙였더니 RSS Feed에 문제가 생기는 것 같아서... 그냥 링크를 걸었다.)
Posted by FreeRedbird

댓글을 달아 주세요

  1. BlogIcon Q1 2009.10.22 02:36 신고 Address Modify/Delete Reply

    기대치가 다른 거죠 뭐.. 프랭클린한테 삼진을 기대하는 거랑 할러데이한테 에러 안 하기를 요구하는 거랑...
    심리적으로모든 사람한테 후자가 타격이 더 큰 거 같아요.. 특히 팬들에게는요 ^^;;

    • BlogIcon FreeRedbird 2009.10.22 16:01 신고 Address Modify/Delete

      네.. 기대치가 다른 것도 사실이죠. 암튼 Franklin은 묘하게도 계약 연장 직후부터 삽질 모드로 돌아서서.. 단장 속이 많이 탔을 것 같습니다. 결국 포스트시즌까지도 삽질만 계속 했네요...

      에러는 에러고, Holliday는 계약할 수 있었으면 좋겠습니다...

  2. camomile 2009.10.27 13:23 Address Modify/Delete Reply

    세이버는 세이버일 뿐, 실질적으로 프랭클린의 멘탈에 할러데이의 에러가 영향을 크게 미쳤다고 봅니다. 클러치 에러 이후 투수가 무너지는 것은 야구 경기를 보다보면 흔히 볼 수 있는 일이죠. 게다가 무대는 포스트 시즌. 마운드엔 처음으로 포스트시즌에 서는 투수. 드라마가 일어날 수 있는 상황이 만들어져 있었던 것이죠.

    이래서 수비력이 중요한 것 같습니다. 눈에 보이는 실점 외에 팀사기, 팀 멘탈에 미치는 영향이 엄청나니깐요.

    • BlogIcon FreeRedbird 2009.10.27 16:01 신고 Address Modify/Delete

      아마도 정신적인 데미지 때문에, Holliday의 에러 이후 Cardinals의 승리 확률은 위에서 계산된 결과보다는 분명히 낮았을 것이라고 생각됩니다. 물론 얼마나 낮아졌는지를 측정할 수 있는 방법은 없겠습니다만...

      개인적으로는 Holliday의 에러 직후 어느 쪽이 이길 것이냐에 베팅을 한다고 하면 그래도 역시 Cards 쪽을 선택했을 것 같습니다. 야구는 분명히 멘탈 스포츠입니다만, 확률의 게임이기도 합니다. 저는 확률 쪽을 더 신뢰합니다. ^^

인터넷의 발달이 가져온 가장 큰 변화는 역시 정보의 홍수라고 해야 할 것이다. 집에 앉아서 컴퓨터만 켜도, 예전 같으면 상상조차 할 수 없는 엄청난 정보에 접근할 수 있게 된 것이다. 늘어난 것은 정보의 양 뿐이 아니다. 정보의 전달 속도와 정보의 질 역시 이전과 비교할 수 없을 정도로 높아졌다. 지극히 진부한 표현이지만, 이정도라면 가히 "혁명"이라는 단어가 어울린다고 생각한다.

야구에 있어서도, 비슷한 정보의 혁명이 일어나고 있다. 단지 약간의 웹서핑을 통해, 우리는 이전에는 극소수의 전문가들만이 얻을 수 있었던 통계 데이터에 얼마든지 접근할 수 있는 것이다. 예를 들어, 메이저리그의 Raw Data를 원한다면 Baseball-ReferenceRetrosheet를 방문하면 된다. 플레이어의 가치(Value)를 평가할 수 있도록 2차적으로 가공된 자료를 원한다면, FangraphsBaseball Prospectus, The Hardball Times와 같은 훌륭한 사이트들이 있다. 어떤 마이너리거를 메이저리그에 콜업하면 얼마나 좋은 성적을 낼 지 궁금한가? Minor League Splits가 적절한 예상치를 대답해 줄 것이다. 여기까지 열거한 사이트들은 가장 대표적인 곳들일 뿐, 조금 더 웹서핑을 열심히 한다면 정말 매일매일 읽기만 해도 모자랄 만큼 풍성한 자료를 찾아낼 수 있다.

이런 데이터가 거의 대부분 공짜로 제공되고 있다는 것은 정말 엄청난 일이다. 인터넷 만세라도 부르고 싶은 심정이 될 만큼 말이다. 특히 Fangraphs나 Retrosheet의 모든 자료가 100%무료라는 사실은 놀라움을 넘어서 충격의 수준이다.

몇 년 전만 해도, 사정은 이렇게 좋지 않았다. 위의 사이트들 중 상당수가 존재하지도 않았을 뿐 아니라... 데이터의 공개 수준도 지금과 같지 않았던 것이다. 예를 들어...UZR을 개발한 Mitchel Lichtman은 2년 동안 Cardinals에 고용되어 일한 적이 있었는데, 그 기간 동안에는 UZR 데이터를 Cardinals 구단이 독점하였고, 일반에 전혀 공개되지 않았다. 하지만... Cardinals와의 계약이 끝난 지금... Lichtman은 Fangraphs 사이트를 통해 UZR 데이터를 전세계 모든 네티즌에게 무료로 공개하고 있다. 올 시즌 500이닝 이상 출장한 메이저리그 유격수 중 누가 가장 뛰어난 수비를 보여주고 있는지 궁금한가? 여기를 클릭해 보시기 바란다. 세이버메트릭스에 대해 별다른 지식이 없더라도, 결과값은 이렇게 쉽게 무료로 공유가 되는 것이다. 그들은 분명 특정 구단과 계약하거나 사이트를 유료화하여 돈을 벌 수도 있겠지만, 이렇게 정보의 개방을 선택하고 있다.

놀라움은 이런 정보의 개방성에서 그치지 않는다. 예를들어... Tom Tango나 MiTchel Lichtman 등이 운영하는 Inside The Book에서는 Tango, Lichtman, Sean Smith와 같이 현재 활발히 활동하고 있고 영향력도 막대한 유명 세이버메트리션들과 언제든 토론을 할 수 있다. Fangraphs의 블로그에서도 수많은 사람들이 세이버메트릭스의 아이디어나 계산식에 대해 열띤 토론을 벌이는 모습을 쉽게 볼 수 있다. 새롭게 연구된 내용들은 거의 항상 인터넷에 공개되고 공유되며, 야구와 세이버메트릭스를 사랑하는 여러 아마추어 네티즌들과 함께 토론을 벌이고, 그 과정을 통해 계속 업그레이드 된다. 세이버메트릭스는 완성된 답이 아니라 진화해 나가는 진행형이며, 그 과정에 누구든 참여할 수 있는 interactive한 세계이다.

이미 만들어져 있는 세이버메트릭스 계산식에 따른 결과값만을 찾아보는 것이 지루하고 심심하다면, 그럼 직접 계산해 보면 된다. 위의 사이트들을 잘 뒤져보고, 구글과 위키디피아에서 약간의 웹서핑을 추가로 한다면, 여러 스탯들이 어떻게 개발되고 어떠한 방법으로 계산되는지를 알 수 있다. 계산 방법을 이해했다면 이제 직접 계산하는 노가다는 엑셀에게 맡기면 된다. 물론 Baseball Prospectus에서 만든 복잡한 스탯들의 경우 계산이 어렵긴 하나, 요즘 유행하는 wOBA나 FIP, BABIP 등은 누구나 집에서 어렵지 않게 계산이 가능하다.


이를 과거의 야구 지식, 이를테면 스카우팅과 비교해 보자. 스카우팅은 고도의 훈련과 노력이 필요한 전문적인 분야이다. 스카우트가 되기 위해서는 체계적인 트레이닝을 받아야 하며, 집에서 혼자 해서 좋은 스카우트가 되는 것은 거의 불가능하다. 경험이 중요한 분야이기에, 스카우트들은 한때나마 선수생활을 했던 사람들인 경우가 많다. 각 플레이어에 대한 스카우팅 리포트는 대개 비밀 문서이고, 인터넷에 있다고 해도 거의 유로 정보이다. 요컨대, 우리와 같은 일반 아마추어 팬들이 쉽게 접근할 수 없는, 그들만의 고급 정보라는 것이다.

하지만, 세이버메트릭스의 문은 누구에게나 열려 있다. 위에서 소개한 사이트들을 비롯하여 수많은 사이트에서 언제든지 무료로 스탯을 얻을 수 있고, 엑셀만 조금 다룰 수 있다면 누구나 직접 계산까지 해 볼 수가 있다. 게다가 인터넷의 블로그와 게시판을 통해 직접 참여하여 의견을 주고받을 수도 있다. 약간의 관심만 있다면 누구나 참여하고 즐길 수 있다는 점에서, 정말 민주적이고 개방된 분야라고 할 수 있을 듯하다. 누구나 어렵지 않게 참여할 수 있으니 나처럼 운동신경이 전혀 없고 야구선수로서의 경험도 없는 완전 아마추어라도 얼마든지 즐길 수가 있는 것 아니겠는가...


* 이 글은 한국야구팬사이트에서도 보실 수 있습니다.

Posted by FreeRedbird

댓글을 달아 주세요

  1. BlogIcon 반바스틴 2009.10.07 14:40 Address Modify/Delete Reply

    정말 저런 자료가 공짜라는것에 대해 놀라움을 금치못합니다

    어느정도 지식만있으면 저사이트에서 몇시간동안 있을수있으니.... 뭐 그래도 개인역량에 달린문제이긴하지만요

    • BlogIcon FreeRedbird 2009.10.07 18:24 신고 Address Modify/Delete

      Retrosheet 같은 경우는 메이저리그 모든 게임의 기록을 통째로 보관하고 있으니까요.. 시즌 전체 게임 자료를 받으면 거의 무한대로 활용이 가능합니다. 이론적인 배경이 필요하시다면 The Hardball Times와 Inside the Book에 도움이 될 만한 좋은 글이 많으니 참고하세요...

(주: 이 글의 내용 및 첨부된 계산 파일은 일부 오류를 포함하고 있으므로, 내용을 수정하여 다시 올린 새 글을 참고하시기 바란다.)

 


Chase Utley : 2008년 NL MVP 투표에서는 고작 15위에 머물렀지만, WAR로 보면 Pujols에 이어 메이저리그 전체 2위였다. 올 시즌 타자 WAR 리스트에서도 Pujols와 Hanley Ramirez에 이어 3위를 달리고 있지만, MVP 투표에서는 또 10위권 밖으로 밀려날 것이다. 항상 실력에 비해 충분한 인정을 받지 못하고 있는, 심각하게 저평가된 플레이어이다.


타자가 팀의 득점에 기여하는 방법은 크게 보아 공격(타격), 수비, 주루가 있을 것이다. 그래서 좋은 타자를 이야기할 때 "공, 수, 주 3박자를 두루 갖췄다"는 표현을 사용하기도 한다.

각각의 타자에 대해서 이러한 득점 기여의 정도가 어느 정도인지를 측정하기 위해, 지금까지 공격, 수비, 주루의 측면을 차례로 검토해 왔다. 또한 비교 대상으로서 절대적 기준이 되는 Replacement Level 및 수비 포지션에 따른 조정 수준에 대해서도 살펴본 바 있다. 이 글을 쓸 때까지 다소 시간 간격이 있었으므로... 다시 한번씩 훑어 보시면 이해에 도움이 되시리라고 생각하여 링크를 걸어 본다.

1. 타격 기여 수준 : wOBA 및 wRAA
2. 비교의 절대적 기준 : Replacement Level
3. 수비 기여 수준 : UZR, TZ
4. 포지션별 차이 : Positional Adjustment
5. 주루 기여 수준 : 도루 성공과 실패

이를 종합하면 특정 타자의 전체 기여 수준, 혹은 그의 가치(Value)를 계산할 수 있는데, 이것이 바로 RAR(Runs Above Replacement level) 및 WAR(Wins Above Replacement level) 이다.

먼저 RAR을 구해 보면... 위의 다섯 가지를 차례로 더해 주면 된다.

RAR = wRAA + Replacement Level + UZR + Positional Adjusment + SB/CS Runs

이제 RAR을 WAR로 환산해야 하는데... 원칙적으로는 팀 전체 득점과 실점에 대해 해당 플레이이어의 RAR이 미치는 점수 변화 정도를 가지고 Pythagorean Expectation의 식에 넣어서 계산하는 것이 맞지만... Pythagorean 관련 포스팅에서 언급한 바와 같이, "10점 득점 = 1승"의 단순한 계산 방법이 의외로 높은 정확도를 가지므로, 계산의 편의를 위해 이를 활용하는 것이 좋을 것이다. 즉, 아래와 같이 쉽게 계산할 수 있다.

WAR = RAR/10

이제부터 실제 예를 통해서 자세히 살펴보자.
계산에 필요한 Raw Data는 Retrosheet, Baseball-Reference, Fangraphs의 세 사이트에서 얻었으며, 이후의 모든 계산은 직접 하였다. 계산에 사용한 엑셀 sheet를 첨부하였으므로, 계산 결과를 쉽게 확인하실 수 있을 것이다.


아래는 Chase Utley의 2008년 성적이다.

공격 : 159 G, 607 AB, 707 PA, 99 1B, 41 2B, 4 3B, 33 HR, 50 NIBB, 14 IBB, 27 HBP, 5 RBOE
수비 : 20.2 UZR
주루 : 14 SB, 2 CS


(NIBB : 고의사구가 아닌 볼넷, IBB : 고의사구, RBOE : 에러로 인해 타자가 출루한 경우)

순서에 따라 차례차례 계산해 보면...

1-1. Park Adjust

먼저 wOBA를 계산하기에 앞서서, 구장으로 인한 효과를 보정해 주는 것이 계산의 신뢰도를 높이는 데 도움이 될 것이다. Park Factor를 계산하는 방법은 여러 가지가 있고, 개인적으로는 어떤 방법이 가장 좋은지 아직 결론을 내리지 못하고 있다. 일단 여기서는 Fantasy411의 2006-08년 Park Factor를 빌려와서 사용하도록 하겠다. (단, RBOE의 Park Factor는 어디에서도 얻을 수가 없었다. 어차피 Utley의 RBOE가 5에 불과하여 Park Factor가 있더라도 그다지 영향은 없었겠지만...)



정밀한 조정을 위해서는 Utley의 경기별 홈구장을 일일이 찾아서 계산해야겠지만... 너무 품이 많이 들므로, 다음과 같은 간단한 방법을 사용하였다. 1) 타석의 절반은 홈, 절반은 원정에서 기록한 것으로 본다. 2) 원정구장들의 평균 Park Factor는 100이다. (실제로는 홈구장을 뺀 15개 NL 구장의 평균이므로 100에 근접한 값일 것이나, 큰 오차는 없으리라고 본다) 3) 따라서, 홈 구장 Park Factor의 50%를 Raw Stat에 적용하여 보정한다.

이렇게 조정한 Utley의 성적은 아래와 같다.
707 PA, 98 1B, 41 2B, 4 3B, 29 HR, 51 NIBB, 13 IBB, 27 HBP, 5 RBOE

홈런이 줄어든 것이 눈에 띈다. 나머지 기록은 거의 변화 없음을 알 수 있다.

1-2. wOBA 및 wRAA 계산

이전의 포스팅에서 wOBA를 소개할 때에 비하여, 지금은 wOBA를 더욱 신뢰하게 되었다. 최근 THT의 Colin Wyers가 수행한 연구에 의하면, 90년대 및 2000년대의 메이저리그 기록을 가지고 분석할 경우 wOBA가 EqA보다도 정확도가 좀 더 높은 것으로 나타났기 때문이다. 현재 세이버메트릭스 진영에서 득점 기여 수준을 측정하는 가장 우수한 스탯으로 여겨지는 wOBA와 EqA의 승부(둘 다 실제 득점과의 correlation이 0.97로 매우 높으므로, 정말 뛰어난 스탯들이다)에서 wOBA가 근소하게나마 더 우수한 것으로 판명되었기 때문에, 타자의 공격 기여도를 측정함에 있어 wOBA를 근간으로 삼는 것은 현재로서는 최선의 방법이라고 생각된다. 또한, wOBA가 EqA보다 훨씬 계산식이 간단하고 이해하기 쉽다는 것도 큰 장점이다.

계산식 및 이론적 근거는 이전의 포스팅을 참고하시고... Park Factor를 적용한 기록을 가지고 Utley의 wOBA를 계산한 결과는 다음과 같다. (앞에 첨부한 엑셀 sheet 참조)

(Park Adjusted) wOBA = 0.382

한편, 2008년 NL 전체 타격 기록을 가지고 구한 리그 평균 wOBA는 0.330이므로, 이를 이용하여 Utley의 wRAA를 구하면 다음과 같다. (엑셀 sheet 참조)

wRAA = 32.05 Runs

즉, 2008년 시즌의 Chase Utley는 NL 평균 타자에 비해 팀 득점에 32.05점 더 기여했다는 의미가 된다.


2. wRAA를 Batting RAR로 : Replacement Level의 설정

wRAA는 Runs Above Average라는 단어의 의미에서도 알 수 있듯이 리그 평균과 비교하는 스탯이므로, 이를 Replacement Level과의 비교로 조정하여 RAR(Runs Above Replacement leve)로 만들 필요가 있다. 이전부터 한 시즌을 기준으로 리그 평균 수준의 주전 선수와 Replacement Level의 땜빵 선수 차이에는 20점 혹은 2승 정도의 차이가 난다는 경험적 분석 결과들이 있었는데, 작년 말에 THT에 게재된 Sean Smith의 뛰어난 연구는 이를 다시 한 번 확인시켜 주었다. 즉, 600 PA를 기준으로 리그 평균과 Replacement Level의 사이에는 20점(20 Runs)의 기여 수준 격차가 있다는 것이다. 이러한 격차를 wRAA 값에 더해주면, RAR로 쉽게 환산된다.

Utley의 경우로 돌아가면, Utley는 707 PA를 기록했으므로, 707 PA에서 평균과 Replacement Level의 격차를 계산해 보면...

600/20 x 707 = 23.57 Runs

이 값이 Utley의 Replacenemt Level 값이 된다.


3. 수비 기여 수준 : UZR

이전의 포스팅에서 ZR을 개선한 합리적인 스탯으로 UZR, TZ(TZR), +/-를 소개한 바 있다. 그 포스팅에서 언급한 바와 같이, +/-는 유료 정보이며 연말에 발표되고, TZ의 경우 현역 메이저리거들에 대한 데이터는 아직 작업중인 상태여서 조회가 되지 않으므로, 현재로서는 UZR이 거의 유일한 선택이라고 할 수 있다. UZR은 Fangraphs에 거의 실시간으로 계속 업데이트 되므로, 지난 시즌의 결과물 뿐 아니라 현재 진행중인 시즌에 대해서도 누구가 쉽고 빠르게 정보를 얻을 수 있다. 뿐만 아니라, TZ의 창시자인 Sean Smith조차 UZR이 가장 뛰어난 수비 스탯이라고 인정하고 있으므로, TZ나 +/- 대신 UZR을 쓰는 것이 그다지 나쁜 선택은 아닐 것 같다.

여담이지만, 2000년대 초중반에 Cardinals는 UZR의 창시자인 MGL(Mitchel Lichtman)에게 상당히 큰 돈을 주고 UZR 데이터를 독점한 바 있다. UZR이 Fangraphs에 공개될 수 있었던 것은 이러한 독점 계약이 종료되었기 때문이다. 이런 것으로 보면 Cardinals도 이전부터 세이버메트릭스에 상당한 관심과 이해가 있었던 것 같다.

다시 본론으로 돌아가서... Utley는 2루에서 20.2 Runs, 1루에서 0.4 Runs를 기록하였으므로, 이를 간단히 더해주면 된다.

UZR = 20.6 Runs

이는 Utley가 2008년 시즌에 수비를 통해 실점을 20.6점 방지하는 정도의 기여를 했음을 의미한다.


4. Positional Adjustment

이전의 포스팅에도 있지만, 다시 한 번 포지션별 조정 점수를 정리해 보면 아래와 같다.

포수 : +12.5 Runs
유격수 : +7.5 Runs
중견수, 2루수, 3루수 : +2.5 Runs
좌익수, 우익수 : -7.5 Runs
1루수 : -12.5 Runs
지명타자 : -17.5 Runs


이 조정 점수는 162게임의 풀 시즌을 기준으로 만들어진 것임에 유의해야 한다. 162게임을 이닝으로 환산하면 1,458 이닝이 되므로, 실제 수비에 참가한 이닝을 1458로 나눠서 위의 조정 점수를 곱해 주면 실제 해당 시즌의 조정 점수가 될 것이다.

Utley는 2008년에 2루에서 1395 2/3 이닝, 1루에서 14이닝을 뛰었다. 따라서...

((2.5x1392.67) + (-12.5x14)) / 1458 = 2.27 Runs

이 점수가 Utley의 수비 포지션에 따른 최종 조정 점수가 된다.


5. 주루플레이의 기여 수준: 도루 성공과 실패

이전의 포스팅에서 밝힌 바와 같이, 도루 성공은 0.175, 도루 실패는 -0.467점의 가치를 지닌다. 개인적으로 그 밖의 주루 스탯에 대해 아직 신뢰하지 않고 있는 관계로, 단지 도루 성공과 실패만을 계산할 것이다.

Utley는 2008년에 14 SB, 2 CS를 기록하였으므로...

14x0.175 - 2x0.467 = 1.52 Runs

도루를 통해 1.52점 만큼 팀 득점에 기여하였다는 결론을 얻을 수 있다.


6. RAR 및 WAR의 산출

이제 모든 구성 요소의 계산을 다 했으므로, 지금까지 나온 값을 모두 더하면 타자의 총 기여 수준, 혹은 그의 가치(Value)가 된다.

RAR = 32.05(타격) + 23.57(Replacement Level) + 20.6(수비) + 2.27(포지션 조정) + 1.52(도루)
      = 80.01


득점 10점은 1승과 동일하므로,

WAR = RAR/10 = 8.0

즉, 거칠게 표현하자면, 2008년 Chase Utley는 8승짜리 플레이어였다는 것이다.

2008년 Phillies는 92승 70패를 기록하였는데, 만약 Utley 대신 1년 내내 Tadahito Iguchi나 Eric Brunett과 같은 Replacement Level 플레이어들로 2루를 돌려막기 했다면, Phillies는 아마도 84승 78패를 기록했을 것이라는 이야기이다. 이런 성적으로는 플레이오프에 나갈 수 없었을 것이고, 따라서 월드시리즈 우승도 할 수 없었을 것이다. 이것이 바로 진정한 스타 플레이어 한 명의 위력이다.

Fangraphs의 Utley 페이지를 보면, 2008년 그의 WAR를 8.1로 계산하고 있다. Fangraphs의 로직은 이 글에서 내가 설명해 온 바와 동일하다고 보면 된다. 0.1의 오차는 타격 기여도 계산에서 생겨난 것인데, 아마도 wOBA 계산 방법이 약간 다르고, Park Factor의 적용에도 차이가 있을 것으로 추정된다. 또한, Fangraphs는 주루를 따로 표시하지 않고, 타격에 합산하여 놓고 있다.


한편, 첨부된 엑셀 파일에는 작년 AL MVP였던 Dustin Pedroia의 WAR도 계산되어 있다. 다만, 이쪽은 Fangraphs가 6.6 WAR로 계산했는데 반해 엑셀 sheet에서는 5.8이 되어서, 차이가 0.8로 제법 크게 나타나고 있다. 실제 계산된 값을 보시면 알 수 있듯이 타격 기여 수준을 빼고는 값이 완전히 동일하므로... 역시 Park Factor의 차이가 작용하고 있는 것으로 추정된다. (Fangraphs는 어떤 Park Factor를 적용하고 있는지 명시하지 않고 있다.) 또한, schedule의 차이를 고려한 플러스 점수가 있는 것 같기도 하다. AL 동부에 속해 있는 Red Sox는 아무래도 Phillies보다는 강한 팀들을 상대로 게임을 하게 되므로, 이를 보정해 주었을 가능성이 있다. 이러한 schedule에 의한 보정이 어떻게 이루어지는지 파악이 될 경우에는, 여기에 추가로 업데이트를 하고자 한다.

Posted by FreeRedbird

댓글을 달아 주세요

  1. BlogIcon 반바스틴 2009.09.16 10:01 Address Modify/Delete Reply

    저는 좌익과 1루중에 어느포지션이 더 쉬운포지션일까 고민해왔는데 세이버에서는 간단히도 1루수가 훨씬 쉬운(?)걸로 판단하는군요

    저는 좌익이 더 편하지않을까 생각이 되었는데... 좌익과 우익의 차이도 없는것도 좀 놀랍군요

    • BlogIcon FreeRedbird 2009.09.16 14:20 신고 Address Modify/Delete

      포지션에 의한 조정 점수는 통계적 연구 결과가 누적됨에 따라 조금씩 변경되어 왔으며, 현재는 위에 언급한 수치가 대세입니다. 물론 약간의 이견이 존재하여, Sean Smith 같은 경우는 위의 수치에서 포수가 +10, 1루수가 -10으로 조정되어야 한다고 주장하기도 합니다. 이렇게 되면 1루수와 좌익수의 차이가 줄어들죠. 하지만 여전히 좌익수가 1루수보다 조금 더 어려운 포지션이라고 보는 점은 변함없습니다.

      우익수와 좌익수는... 선수 개개인으로 보면 차이가 조금씩 존재합니다. 아무래도 특정 선수의 수비 범위(range)라는 것이 전후좌우가 모두 동일하지 않기 때문에, 어떤 외야수는 왼쪽으로 잘 움직이고, 어떤 외야수는 오른쪽으로 잘 움직이는 등의 차이가 존재하죠. 따라서 개개인을 놓고 보면 좌익수와 우익수 중에 좀 더 적합한 포지션이 존재합니다. 또한 3루로 뛰는 주자를 잡기 위해 강한 어깨를 가진 외야수가 우익수 자리에 선호되죠. 하지만.. 개개인이 아니라 집합적으로 놓고 보면, 좌익수와 우익수의 수비적 가치 혹은 수비 난이도는 거의 동일하다고 볼 수 있습니다.

  2. BlogIcon 박상혁 2012.07.23 11:08 신고 Address Modify/Delete Reply

    이런글을 이제서야 보게되었네요.
    WAR에 대한 궁금증이 많이 풀렸습니다.
    ^^ 감사합니다.

수비력은 예나 지금이나 측정하기가 매우 어려운 능력이다. 이전의 글에서 UZR이나 +/- 같은 최신 수비 스탯을 소개한 바 있지만, 객관성과 정확도에 대해서는 여전히 논란의 여지가 남아 있는 것이 사실이다. 어떤 타구에 대해 "어느 수비수가 처리해야 할 책임이 있는가"의 문제는 결국 일정 부분 주관이 개입할 수밖에 없기 때문이다. 이런 부분들에 대해 모두가 동의하기는 어려울 것이다.


그런데... 세이버메트릭스의 입장에서, 수비보다도 더 미개척으로 남아 있는 분야가 있다. 바로 주루 능력이다.

"무슨 소리냐...!! 도루성공/실패가 있지 않느냐???" 라는 반론이 나올 수도 있다. 그러나, 주루 능력은 단순히 도루 능력을 의미하지 않는다. 이를테면, 타자가 동일한 1루타를 쳤을 때, 1루에 있던 주자가 2루까지 가느냐 3루까지 가느냐의 차이가 있을 것이다. 똑같은 외야 플라이에서 3루 주자가 홈에 뛰어들 수 있느냐 없느냐의 차이도 있다. 타자의 잘 맞은 라인드라이브가 외야수의 호수비에 걸려 아웃 되었을 때, 주자가 무사히 원래의 베이스로 귀환하느냐와 귀환하지 못하고 병살 처리되느냐의 차이도 있을 것이다. 이러한 상황들은 무수히 많다. 도대체 어떻게 이 모든 것을 평가할 수 있을 것인가...??

Tom Tango는 <The Book>에서 도루 성공과 실패의 득점 가치(Run Values)를 아래와 같이 도출한 바 있다.

도루 성공 : 0.175 Runs
도루 실패 : -0.467


다른 스탯에서도 설명했듯이 여기서 가치가 0.175 라는 것은... 주자가 도루에 성공하면 해당 이닝에서 공격측의 득점 기대값은 0.175점 높아진다는 것이다. 반대로 실패하면 아웃카운트가 늘어나면서 0.467점 낮아진다는 의미가 된다.

WPA와 같은 개념에 익숙하신 분이라면 원래 가치라는 것이 이렇게 간단하게 한마디로 표현되지 않는다는 것을 이미 알 것이다. 원칙적으로, 모든 도루의 가치는 동일하지 않다. 2루 도루와 3루 도루는, 팀 득점에 미치는 영향이 다를 수밖에 없다. 무사에서의 도루와 2사에서의 도루도 역시 가치가 다르며, 1회 0-0 동점에 하는 도루와 9회 3-2 1점차 리드에서 하는 도루도 가치가 다르다. 위의 0.175는 이러한 모든 상황을 평균하였을 때 도루의 가치이다. 162게임의 긴 시즌을 뛰다 보면 다양한 상황에서 도루를 시도하게 되므로, 평균을 가지고 접근하는 것도 나쁘지 않다고 본다.

도루 성공과 실패가 위와 같은 득점 가치를 갖는다면, 평균적으로 도루 성공률이 72.7%를 넘지 않으면 오히려 소속팀에 해를 끼치게 된다는 의미가 된다. 만약 한 시즌에 100개의 도루를 성공시키더라도, 도루 실패가 38개 이상 된다면, 도루 시도를 아예 전혀 안 하느니만 못하다는 것이다.


그럼 도루는 그렇다 치고... 다른 주루 능력치는 어떻게 평가해야 할까?
솔직한 내 생각은... 이건 정말 아직 답이 없다는 것이다.  -_-;;;

세이버매트릭스의 대표적인 오타쿠 집단 중 하나인 Baseball Prospectus는 나름의 통계적 분석을 통해, 주루플레이를 측정하는 스탯을 개발했다. 도루 및 상황별 진루 능력을 각각 평가하여 EqGAR, EqSBR, EqAAR 등을 산출하고, 이를 모두 더해서 EqBRR을 계산하는 것인데... 2008년 기록을 보면 Ichiro Suzuki와 Willy Taveras가 메이저리그에서 가장 뛰어난 주자였던 것으로 나온다. 반면 현재까지의 2009년 시즌에서는 Michael Bourn이 압도적으로 우수한 주루플레이를 해 오고 있는 것으로 되어 있다.

문제는... 이 스탯을 얼마나 신뢰할 수 있을까 라는 점이다. 어떤 상황이 진루를 해야 하는 상황인지 아닌지 같은 것은 수비 스탯에서 어떤 타구가 어느 수비수가 책임져야 할 것인지를 결정하는 것보다도 훨씬 더 주관적인 판단이 개입될 수밖에 없는 것이다. 게다가, 그들이 어떻게 계산했는지 자세히 살펴보고 싶지만 계산식이 비공개여서 알 수도 없다. 개인적으로 Baseball Prospectus의 독창적인 스탯들을 별로 좋아하지 않는 편인데, 너무 분위기가 덕후스럽고 계산 방법이 베일에 가려져 있는 경우가 많기 때문이다. 이는 그들의 책인 <Baseball inside the Numbers>를 읽어도 마찬가지인데, 계산식이나 방법은 소개해 주지 않고 결과만 보여 줘서 당혹감을 느낄 때가 많다. (게다가, 지난 번 EqA에서 보았듯이, 설사 계산 결과를 알려주더라도 너무 복잡해서 직접 계산을 통한 활용이 불가능하다...)

** 추가 수정(09/11/18) : 몇 달 동안 여러 세이버메트릭스 커뮤니티에서 EqBRR에 대한 평가를 살펴본 후 지금은 생각이 조금 바뀌었다. EqBRR은 꽤 쓸만한 스탯인 것 같다. 앞으로 주루플레이에 대한 스탯이 필요할 경우는 때에 따라 EqBRR을 사용할 계획이다. 위의 문단은 조금 지나치게 비판적이었던 것 같다. 물론 여전히 BP의 일부 스탯들(WARP, FRAR 등)은 인정하기가 참 어렵지만...


참고로, Fangraphs 에서는 명시되어 있지 않으나, 실제로는 플레이어 페이지에서 Value 항목의 "Batting"에 도루성공과 실패가 반영되어 있다. 그 밖의 주루 능력은 아직까지는 포함하지 않고 있다.

예를 들어 Fangraphs에서 Ichiro의 성적을 보면...  2007년 그의 Batting Value는 25.9 Runs로 나와 있다. 이 수치에는 Park Factor 뿐 아니라, 그 해에 기록한 37 도루 성공/8 도루 실패도 반영되어 있는 것이다. Fangraphs의 데이터를 참고할 때에는 이러한 부분을 고려하시기 바란다.


여기까지 해서, 타자의 공격력과 수비력, 주루 능력을 살펴보는 방법을 차례로 모두 알아보았으며, 비교 대상이 되는 Replacement에 대해서도 살펴 보았다. 또한, 각 수비 포지션에 따른 Positional Adjustment의 방법에 대해서도 알아 보았다. 다음 세이버메트릭스 포스팅은 타자를 전체적으로 평가하는 종합편이 될 것이다.

Posted by FreeRedbird

댓글을 달아 주세요

  1. 쵱휴여 2012.05.14 08:32 Address Modify/Delete Reply

    안녕하세요. 좋은글 많이 보면서 많이 배워가고 있습니다.

    우선 팬그라프에 Spd라는 수치가 보이네요. 빌 제임스가 고안한 것을 팬그라프 버젼으로 바꿨다고 하며 도루성공률, 도루 시도 빈도, 3루타 비율, 득점 비율을 기초로 계산된다고 하는데, 아마 이미 알고 계실것 같습니다.

    혹시 Spd가 어느 정도 믿을만한 수치인지 세이버 커뮤니티의 의견이나 주인장님의 생각이 있으신지, 그리고 EqBRR과 비교할때 어느쪽이 더 나은 스탯으로 평가받는지 이런 저런 내용을 알고 싶습니다~

    좋은 하루 되세요~

    • BlogIcon FreeRedbird 2012.05.14 13:31 신고 Address Modify/Delete

      안녕하세요.

      Spd는 다소 오래된 스탯으로 도루성공율이나 3루타 비율 이외에도 주루플레이를 평가할 수 있는 항목이 많기에, 정확하지는 않습니다. 참고용 정도로만 생각하시면 됩니다.

      보다 많은 항목을 평가하고 있는 EqBRR이나, Fangraphs가 "BsR"이라는 이름으로 제공하고 있는 UBR을 이용하심이 더 낫겠습니다.



Pujols vs A-Rod : 전통의 떡밥

우리나라의 MLB 게시판에서... 가장 흔한 낚시질은 "Pujols와 A-Rod 중 누가 더 대단한 선수일까?" 와 같은 비교글이다.
오래된 떡밥임에도 불구하고 언제나 효과 만점이어서, 수많은 MLB 팬들이 이런 저런 근거를 대 가며 싸우게 되기 마련이다. 비록 A-Rod의 약물 복용 사실이 드러난 뒤에는 낚시질의 효과가 좀 떨어지기는 했지만, 그래도 여전히 매력적인 떡밥임은 틀림없다.

위의 논쟁에서 A-Rod 편을 드는 사람들이 주로 하는 이야기가 바로 "3루수는 1루수보다 수비하기가 훨씬 어려운 포지션이므로, 1루수가 아무리 잘해봤자 3루수를 따라올 수 없다"는 식의 주장이다. 정말 그럴까? 3루가 1루보다 수비하기 어려운 것은 정설로 되어 있지만, 문제는 과연 얼마만큼 어려운가이다.

세이버메트릭스 진영에서는 이러한 문제에 대해서도 많은 연구가 있어 왔다. 각 포지션 별로 수비의 난이도를 평가하여, 선수를 평가할 때 포지션에 따라 조정을 해 주는 것이다. 이를 Positional Adjustment라고 한다.

Adjustment 값에 대한 연구는 주로 두 개 이상의 포지션을 오랫동안 소화한 선수들이 각 포지션에서 상대적으로 어느 정도의 수비 능력을 보였는가를 비교함으로써 이루어졌다. 예를 들어, 어떤 선수가 좌익수로 기용될 때에는 +5 Runs의 좋은 수비수였는데, 팀 사정에 따라 이 선수를 중견수로 기용하였더니 -5의 수비수가 되었다고 하면, 이 경우 좌익수와 중견수의 난이도 차이는 10 Runs인 셈이다. 수 년에 걸쳐 이런 경우를 모두 모아서 평균을 구해 보면 포지션별 상대적 난이도를 얻을 수 있을 것이다.

이 값은 시대에 따라, 연구자에 따라 조금씩 다른데... 여기에는 현대 메이저리그에 대한 Tom Tango의 값을 소개한다. (단, 162게임에 대한 점수임에 유의해야 한다.)

포수 : +12.5 Runs
유격수 : +7.5 Runs
중견수, 2루수, 3루수 : +2.5 Runs
좌익수, 우익수 : -7.5 Runs
1루수 : -12.5 Runs
지명타자 : -17.5 Runs



예를 들어, 리그 평균 수준의 유격수와 리그 평균 수준의 우익수는 한 시즌에 15점 정도의 수비 기여도가 차이나는 것이다. 혹은 유격수가 우익수에 비해 시즌 당 15점 정도의 차이가 날 만큼 수비하기 더 어려운 포지션이라고 말할 수도 있겠다.

이 값은 Sean Smith에 의해 검증되었으며, 상당히 정확한 것으로 나타났다. 다만, Sean Smith는 포수와 1루수에 대해 각각 +10, -10을 적용할 것을 제안하고 있다. 자세한 내용은 아래 글을 참고하시기 바란다.
http://www.hardballtimes.com/main/article/replacement-level-article/

이에 대하여 원작자인 Tom Tango가 답변한 내용은 아래 글 참조.
http://www.insidethebook.com/ee/index.php/site/article/replacement_level_using_forecasted_players/


여기서 문제가 되는 것이 DH의 경우이다. DH는 실제로 수비를 하지 않으므로 위와 같은 비교 연구가 불가능하기 때문이다. -17.5의 수치는 이론적으로 나온 것으로... Tom Tango는 지명타자를 "수비가 나쁜 1루수"로 간주하여 그를 풀타임 1루수로 기용할 경우 일반 1루수에 비해 1승(10점) 만큼 팀에 더 피해를 입힌다고 보았다. 이렇게 하면 지명타자의 Positional Adjustment가 -12.5 - 10 = -22.5가 되어야 할 것이다. 하지만, 그가 <The Book>에서 밝힌 연구결과와 같이, 어떤 선수가 DH로 뛰게 되면 오히려 수비를 할 때에 비해 일정 수준 타격능력이 떨어지게 되는 현상이 발견되었다. 수비를 안하고 벤치에 앉아 있기만 해서 몸이 안 풀려서 그런 것인지는 잘 모르겠으나, 대부분의 DH들은 수비수로 뛸 때보다 타격이 분명히 약화되었다. 이를 감안하여, "DH로 뛴다는 것의 어려움"을 고려하여 +5점을 해 줘서, 최종적으로 DH의 Positional Adjustment는 -17.5가 된 것이다.


이제 원래의 떡밥으로 돌아가자. A-Rod는 3루수이므로 1루수인 Pujols보다 수비에서 무조건 우월한가?

Fangraphs를 참고하면,
A-Rod의 2006-08 3년간의 UZR/150은 각각 -12.4, 2.3, -3.2이므로, 3년 평균 값은 -4.3이다.
반면 Pujols의 경우는 2006년부터 2008년까지 각각 4.5, 16.0, 8.5의 UZR/150 값을 나타내고 있다. 3년 평균 값은 9.7이다.

두 선수에게 Positional Adjustment를 적용하여 보자.
위에서 소개한 값은 162게임에 대한 값이었음을 다시 한번 상기하자. 여기서 우리는 150게임에 대한 수비 스탯인 UZR/150을 이용하고 있으므로, 150게임에 맞게 조정하여 주어야 한다. 이렇게 조정하면 3루수는 +2.3, 1루수는 -11.6이 된다.

A-Rod는 3루수이므로 -4.3에 2.3점을 더해 주어서 최종 결과는 -2 이다.
Pujols는 1루수이므로 9.7에서 11.6점을 빼 주어서 최종 결과는 -1.9 이다.

아주 근소한 차이로 Pujols의 승리이다. 하지만 그 차이는 150게임에서 0.1점에 불과하므로, 무시해도 좋을 수준일 것이다. 결국 수비 공헌도로 보자면, A-Rod와 Pujols는 같다고 보아도 무방하다. 이렇게 해서, A-Rod는 3루수이므로 1루수인 Pujols보다 무조건 뛰어나다는 식의 주장은 전혀 근거없는 억측임을 알 수 있다.


여기까지 해서, 우리는 타격에서의 공헌 정도, 수비에서의 공헌 정도, 그리고 포지션에 따른 조정 점수에 대해 알아보았다. 그리고 비교의 기준이 되는 Replacement Level에 대해서도 알아보았다. 이제 주루플레이 부분만 검토하고 나면, 특정 타자가 실제로 팀에 몇 점, 혹은 몇 승을 올릴 수 있도록 기여하는지 계량할 수 있을 것이다.
Posted by FreeRedbird

댓글을 달아 주세요

  1. 먹곰 2009.11.12 02:06 Address Modify/Delete Reply

    09년 에이로드 선수 펜그래프서 포지셔널 수치가 0.8 밖에 안되는데요...


    162경기 기준으로 3루수가 2.5인데


    올해 130경기 정도뛴 에이로드 선수 포지셔널이 왜 0.8 밖에 안되는지 알 수 있을까요??

    • BlogIcon FreeRedbird 2009.11.12 13:40 신고 Address Modify/Delete

      그것은 A-Rod가 일부 게임에서 DH로 나왔기 때문입니다.

      한번 계산을 해 보겠습니다.

      http://www.baseball-reference.com/players/r/rodrial01.shtml
      위의 페이지를 보면... A-Rod는 2009 시즌에 3루수로 116게임/974.1이닝을 뛰었고, DH로 9게임에 나왔다고 되어 있습니다. 이닝으로 되어 있어야 정확한데... 게임 수만 표시되어 있네요.

      3루수는 162게임 당 포지션 조정이 +2.5이므로... 1게임을 9이닝이라고 하면 1,458이닝 당 +2.5로 계산할 수 있습니다. 그러므로, 974.1이닝에 대한 포지션 조정 점수는 974.3333333 * 2.5 / 1458 = 1.67 이 됩니다.

      한편, DH는 162게임 혹은 1,458이닝 당 -17.5 입니다. 그런데 A-Rod가 DH로 나온 게임 수만 있고 이닝 정보가 없습니다. 만약 9게임 모두 9이닝을 풀로 뛰었다고 하면 81이닝이 되므로, -17.5 * 81 / 1458 = -0.97 이 됩니다.

      이렇게 계산해서.. 1.67 - 0.97 = 0.7 이 A-Rod의 최종 Positional Adjustment가 되는 것입니다. 그런데, Fangraphs는 0.8로 계산하고 있으므로.. 실제로는 DH로 뛴 이닝이 81이닝이 되지 않을 것 같습니다. DH로 나온 9게임 중에는 대타로 나오거나, 반대로 중간에 교체된 게임이 있을 것으로 생각되네요. 계산을 해 보면, DH 이닝이 81이 아니라 76이닝 정도로 줄어들면 Positional Adjustment가 0.8이 됩니다. 이제 이해가 되시는지요? ^^

  2. 바보./ 2011.04.07 00:52 Address Modify/Delete Reply

    논점이 뭔지를 모르네...
    지금 이글의 요지는 공헌도에 따라 평가를 하는거잖어.
    근데 떡밥의 요지는 공헌도가 아니라 체력적인 부분과 운용면이란거야.

    지금 너의 논리는 수비꽝인 포수와 GG중에서도 최상급 1루수가 세이버메트릭스가 주장하는 수치가 똑같다고 결국 양선수가 똑같은 선수라고 하는 꼴이야.

    예를 들어줄께, 잘생각해봐. 세이버메트릭스 상의 공헌도가 같은 포수와 1루수가있다치자.
    그 두선수의 타격스탯은 로드와 푸돌이의 스탯이라고 대입해보고.
    그럼 네가 감독이라면 공헌도는 같지만 포수를 뽑을래? 1루수를 뽑을래?
    (전제로 양선수다 발전가능성은 없고, 무조건 그 스탯과 수비율로만 가는거고)

    아마 100이면 80은 포수를 뽑을걸. 일단 1루수는 포수로 전향하는게 진짜 가능성없는 일이지만 포수는 1루수로 전향하는게 쉽거든. 물론 극단적으로 포수와 1루수르 예로 들었지만 1루와 3루수의 경우도 이와 마찬가지지. 공헌도를 따지기전에 요하는 체력적 문제와 부상의 문제가 훨씬많단다. 이게 문제니까 1루와 3루수를 비교하는거지.

    기본적으로 논점은 뭔지나 알고서 따져야지;;; 논점도 모르고 비판하는 꼴이란;;;참;;;무식한 짓이지.

    본인이 본인입으로 서두에 얼만큼 어려운가를 말해놓고, 뒤에선 공헌도 얘기를 하는 놈이 어딨냐....스탯따지기 전에 국어공부나 하고와라.

  3. BlogIcon FreeRedbird 2011.04.08 12:01 신고 Address Modify/Delete Reply

    위에 댓글을 남기신 "바보" 님께서 친절하게 또 댓글을 하나 더 남겨 주셨었는데. 제가 장문의 댓글을 쓰는 과정에서 시스템 오류로 삭제가 되어 버렸네요. 이건 정말 죄송합니다.

    워낙 주옥같은 댓글이라 마침 저장해 둔 게 있으니 여기다 다시 남겨 드리겠습니다.

    바보. 2011/04/08 00:32 댓글주소 수정/삭제 댓글쓰기

    이건 내가 꼬여서 그런가...본인의 무식함을 전혀 인정을 안하는거 같넼ㅋㅋㅋㅋ
    그리고 야구란 종목이 통계의 스포츠란 점에서 수치를 부정할순없지만
    밑도 끝도 없이 논점도 모른체 지가 유리한 스탯만 나열해서 세이버메트릭스 놈들을 신봉하는 애들은 정말이지 대책없는 빠돌이라고 밖에는 생각이안되...ㅉㅉㅉ

타격 스탯과 Replacement Level에 이어, 이번에는 수비 스탯을 살펴보고자 한다.


1. FPct : Fielding Percentage

가장 단순하고 오랜 역사를 가지고 있으나 그만큼 엉성한 스탯이다. 단순히 해당 수비수가 얼마나 에러를 안 내고 수비했는지를 보여준다. 식은 아래와 같다.

FPct = (A+PO)/(A+PO+E)
A: Assists(다른 곳에서 아웃이 될 수 있도록 공을 던져준 것)
PO: Putouts(수비수 스스로 아웃을 기록한 것)
E: Error

당연히 에러를 안 내는 것이 좋은 수비이기는 하나... 에러를 안 내는 것이 전부가 아니라는 게 문제이다. 예를 들어, 수비수가 아무 것도 안 하고 가만히 서 있기만 해도 위의 식에 의하면 1.000으로 퍼펙트한 FPct를 얻을 수 있다. 날아오는 공에 손대지 않고 계속 가만히 있으면 모든 공이 다 안타로 처리될 뿐, 수비수의 에러가 되지는 않기 때문이다. 즉, 이 스탯은 단지 에러 발생만을 체크할 뿐, 수비수가 얼마나 넓은 범위를 커버하고 있는지 등에 대해서는 알 길이 없다.


2. RF : Range Factor

RF는 Bill James의 작품이다. FPct와는 달리 수비수가 실제로 얼마나 아웃을 만들기 위한 플레이에 관여했는지를 측정하기 위해 만들어졌다. 식은 아래와 같다.

RF = (PO+A)*9/Inn
Inn: Innings Played

단순한 식으로 계산이 쉽다는 막강한 장점이 있긴 한데... 너무 단순하다는 것도 문제가 된다. 실제로 몇 번의 수비 기회가 있었는지를 따지지 않고 결과적으로 아웃이 되거나 어시스트가 된 숫자만을 따지다 보니... 단지 우연히 많은 공이 자신에게 날아왔을 뿐인 수비수의 경우 본의 아니게(?) 좋은 RF 값을 가지게 된다. 게다가, 이름에서 알 수 있듯이 수비수의 수비 범위(Range)를 평가하기 위해 고안되었음에도 불구하고, 병살과 같이 Range와 별 상관없는 아웃을 구분하지 않음으로써 오차를 발생시키고 있다.


3. ZR : Zone Rating

Zone Rating은 80년대 말에 STAT,Inc.의 John Dewan에 의해 개발되었으며, 이후 2000년대 초반이 될 때까지 거의 유일한 "쓸만한 수비 스탯"으로 널리 사용되어 왔다.

먼저 아래의 그림을 보자.

(그림을 클릭하면 크게 볼 수 있음)

우선 필드를 C~X까지 22개의 구역으로 나눈다. (A, B, Y, Z는 파울지역이다)
다음 수비수의 포지션에 따라 각 구역을 "할당"한다.

내야와 외야를 나눠서 보는데, 내야수는 그라운드볼에만 책임이 있는 것으로 간주한다.
1루수는 V~X, 2루수는 O~T, 유격수는 H~L, 3루수는 C~F 지역으로 굴러가는 그라운드볼에 대해 각각 책임을 져야 하는 것이다. 여기서 G, N, U 등의 구역은 아무에게도 책임이 없음을 알 수 있다. 즉, 수비가 어찌할 수 없는 타구가 있다는 점을 인정하는 것이다.

한편, 외야수의 경우는 일정 거리 이상 날아간 라인드라이브와 플라이볼에 대해 책임이 있는 것으로 본다. 좌익수와 우익수는 그들의 구역으로 날아간 공 중에서 280~340 ft 사이에 떨어지는 라인드라이브와, 200 ft 이상 날아간 플라이볼을 처리해야 한다. 중견수는 자기 구역에 떨어지는 공 중에서 300~370 ft의 라인드라이브와 200 ft 이상의 플라이볼을 처리해야 한다. 이들의 수비 구역은 좌익수의 경우 F~H의 라인드라이브와 C~I의 플라이볼, 중견수의 경우 L~O의 라인드라이브와 K~P의 플라이볼, 우익수의 경우 S~U의 라인드라이브와 R~X의 플라이볼이다. 역시 내야와 마찬가지로, 외야에도 아무에게도 책임이 없는 J, Q 구역이 존재한다.

ZR은 기본적으로 각각의 수비수가 자신의 수비 구역에 떨어지는 공 중에서 얼마만큼을 아웃으로 처리했는가의 비율이 된다. 즉,

ZR = 자기 구역에서 아웃 처리한 공/자기 구역에 떨어진 공

그런데 수비 쉬프트 같은 것이 존재하므로, 어떤 때에는 자기 구역이 아닌 곳에서도 아웃을 잡아낼 때가 있을 것이다. 이런 경우는 자기 구역에서 아웃을 처리한 것처럼 간주하여 계산한다. 즉, 자기 구역 이외의 필드에서 아웃을 1개 잡았다면, 분모와 분자에 모두 1을 더해주는 것이다. 이런 방식은 여러 문제점을 야기하는데... 다른 구역에서 아웃을 잡을 정도로 수비 범위가 넓은 수비수가 그 능력을 충분히 인정받지 못하는 결과를 낳게 된다.

그리고, 수비수는 자기 책임 구역 내의 한 점에 서 있다가 공이 날아오면 그 쪽을 향해 뛰어가는 것이므로, 수비수의 정면으로 날아오는 공을 잡는 것과 자기 책임 구역의 맨 구석까지 뛰어가서 다이빙 캐치로 공을 잡는 것은 수비 난이도에 있어서 차원이 다르다고 할 수 있다. 그러나, ZR에서는 이러한 부분이 전혀 고려되지 않는다.

ZR에 대한 자세한 설명은 아래 링크를 참조.
http://www.baseballthinkfactory.org/files/dialed_in/discussion/what_is_zone_rating/


4. UZR : Ultimate Zone Rating

UZR은 ZR의 단점을 보완하기 위하여 Mitchel Lichtman이 개발한 것이다. 그는 인터넷에서 "MGL"이라는 필명으로 잘 알려져 있으며, <The Book>의 공동 저자이기도 하다.


(그림을 클릭하면 크게 볼 수 있음)

UZR은 위의 다이어그램에서 64개의 구역(Zone)을 이용한다. 이것은 모든 페어 지역과 1, 3루 주변의 파울 지역을 포함하는 것이다. 내야수는 그라운드볼에만 책임이 있고, 라인드라이브와 플라이볼은 외야수의 몫이라는 점은 기존의 ZR와 동일하다. 그러나, ZR과 비교하여 가장 큰 차이는, ZR이 단순히 어떤 지역에 날아간 타구의 갯수만을 가지고 계산하는 데 비해, UZR은 특정 구역에 떨어진 공이 얼마만큼의 가치를 가지는가를 점수로 환산한 값(Average Run Value)을 반영하여 계산한다는 것이다. (여기에는 각 구역에 떨어지는 공에 대하여 수비 난이도가 제각기 다르다는, 어찌보면 당연한 생각이 들어가 있다.) 따라서, ZR이 단순히 0과 1 사이의 값을 가지는 데 비해, UZR은 점수(Runs)로 나타나게 된다. 리그 평균은 0점이며, 마이너스는 평균 이하, 플러스는 평균 이상을 의미한다.

예를 들어, Yankees의 Derek Jeter는 2005년 AL 유격수 골드글러브를 수상하였다. 그러나, UZR에 의하면 그의 2005년 유격수 수비는 -12.6으로 나타나고 있는데, 이는 Jeter의 좋지 않은 수비로 인해 평균적인 유격수에 비해 2005년 시즌에 소속팀이 12.6점 더 실점하게 만들었다는 의미이다. Jeter는 오랜 세월동안 세이버메트리션들의 단골 공격대상이었는데, 이는 UZR로 보아도 별로 다르지 않다.

UZR은 2000년대 초에 창안된 이후 MGL 본인에 의해 몇 가지 중요한 부분들이 보완되어 왔는데, 이를테면 구장 효과(park effect)를 적용하여 보정하고, 좌타/우타의 타구 방향이 다른 것을 적용하였으며, 타구의 속도까지 측정하여 반영하였다. 뿐만 아니라, 투수의 그라운드볼/플라이볼 성향이 미치는 영향도 고려하였고, 특정 주자와 아웃의 상황에 따라 타자의 타격 방향이 영향을 받는 것(예를 들어 무사 주자 없음일 때와 무사 주자 1루일 때 타구의 경향이 달라지는 것 등)까지도 반영시켰다. 이쯤되면 꽤 훌륭하게 업그레이드가 된 셈이다. 다만 포수의 수비에 대해서는 아직 좀 부족한 부분이 있는데... 이쪽으로는 Tom Tango 등에 의해 현재도 활발하게 연구가 진행되고 있다.

업그레이드 UZR에 대해서는 아래 참조.
http://www.baseballthinkfactory.org/files/primate_studies/discussion/lichtman_2003-03-14_0/
http://www.baseballthinkfactory.org/files/primate_studies/discussion/lichtman_2003-03-21_0/


5. TZ (혹은 TZR) : Total Zone

Total Zone은 Sean Smith에 의해 탄생하였다. Sean Smith는 대표적인 플레이어 퍼포먼스 예상 툴인 CHONE Projection으로 특히 유명하다.

TZ도 Zone Rating을 개량하고자 하는 시도에 의해 탄생한 것이다. 타구가 누구의 수비 구역에 떨어졌는지, 그리고 해당 수비수가 그 공을 처리했는지가 주 관심 대상이 된다. 그 결과값은 UZR과 유사하게 리그 평균 수비수에 비해 몇 점이나 더 실점을 막았는지, 혹은 실점을 허용했는지를 숫자로 표시해 준다. 어느 해의 TZ값이 +10이라면 1년 동안 수비를 통해 팀이 실점을 10점 덜 하도록 기여했다는 의미이다.

Sean Smith는 그의 사이트(Baseball Projection)에서 TZ를 바로 확인할 수 있도록 작업중이라고 하는데... 아직 완성되지 않은 것 같다. 그는 Retrosheet의 게임 데이터를 가지고 1956년부터 지금까지의 모든 플레이어에 대해 TZ 값을 계산하는 엽기적인 노가다를 하고 있는데, 노가다의 내용에 대해서는 아래 링크를 참고하기 바란다.
http://www.hardballtimes.com/main/article/measuring-defense-for-players-back-to-1956/

노가다의 결과가 궁금하지 않은가? 1986년까지의 결과가 입력되어 있는 아래 엑셀 파일을 받아서 직접 확인해 보기 바란다. 이런 엄청난 파일이 작성자 본인에 의해 인터넷에 공짜로 공개되어 있다는 것은 정말 감동적인 일이 아닐 수 없다.

한편, Sean Smith는 마이너리그 플레이어들에 대해서도 TZ를 적용하는 방대한 작업을 수행하였는데, 그 결과물은 THT의 동료 세이버메트리션인 Jeff Sackmann의 사이트인 Minor League Splits에서 확인할 수 있다.

TZ는 UZR과의 통계적 상관 관계가 괜찮은 편으로 나타나고 있다. 재미있는 것은 Sean Smith 자신도 UZR이 가장 나은 수비 스탯이라고 생각한다는 점이다.
http://www.hardballtimes.com/main/article/measuring-defense-for-players-back-to-1956/


* 참고 : 이후 확인해 본 결과 Sean Smith가 노가다를 완료하여 1871년부터 2008년까지의 모든 자료를 사이트에 업로드해 놓은 것을 발견하였다. PbP 데이터가 없는 1953년 이전 자료에 대해서는 assist, putout, error 등으로 추정했다고 한다. 위의 링크를 클릭하여 Babe Ruth나 Rogers Hornsby와 같은 전설 속의 인물들을 만나 보시기 바란다. 이런 엄청난 자료를 공짜로 접할 수 있는 게 그저 황송할 따름이다...



6. John Dewan's +/- System(Fielding Bible)

ZR의 창시자인 John Dewan은 누구보다도 ZR의 한계를 스스로 잘 알고 있었으므로, 그것을 개량하고자 하는 노력을 계속하게 된다. 그렇게 해서 ZR의 업그레이드 버전으로 내놓은 것이 바로 Plus/Minus System이다.

이 시스템의 기본적인 원리는 UZR과 동일하다. 즉, 각 수비수가 책임을 지게 되는 "영역"이 존재하지만, ZR과 달리 영역의 내부는 동일하지 않으며, 수비하기 쉬운 지역과 어려운 지역이 존재한다. 쉬운 지역에 떨어진 공을 처리하지 못하면 감점되고, 어려운 지역의 공을 처리하면 점수를 얻게 된다. 이 점수는 UZR이나 TZ에서와 마찬가지로, 1년동안 소속팀의 실점을 줄이거나 늘리는 데에 얼마나 기여했는가를 의미한다. 리그 평균은 여기에서도 0점이다.

문제는... 이것이 유료 정보라는 것이다. 인터넷에 샘플로 공개되어 있는 자료는 2005 시즌이 마지막이다. 게다가 시즌이 끝나고 나면 1년간의 데이터를 모아서 자료가 발간되는 구조이므로, 돈을 주고 구해 볼 생각이 있어도 시즌 중의 데이터를 실시간으로 확인하기는 어려울 것이다.

시스템의 기본적인 원리에 대해서는 아래 참조. 이 사이트에서 샘플 자료도 볼 수 있다.
http://www.billjamesonline.net/fieldingbible/overview.asp



정리.

수비 스탯은 타격이나 투수 스탯에 비해 종류도 적고, 여전히 논란의 여지가 많이 남아 있다. UZR이나 TZ, +/- 등에서는 타구의 종류가 상당히 중요하게 취급되는데, 그라운드볼이 아닌 어떤 타구가 라인드라이브인지 플라이볼인지 결정할 때에는 일정 부분 기록자의 주관이 들어갈 수밖에 없다. 각 수비수가 어떤 구역에 책임이 있는지를 설정하는 부분에 대해서도 역시 이견이 있을 수 있으리라고 본다. 게다가, 외야수의 송구 능력이라든지, 포수의 수비 능력 등에 대해서는 어떤 수비 스탯도 아직 명확한 답을 내놓지 못하고 있다.

이러한 여러가지 불완전한 부분에도 불구하고, 수비 스탯은 분명 참고할 만한 가치가 있다. 좋은 수비수와 나쁜 수비수의 차이가 존재함은 명백하다. 과연 특정 수비수의 수비 능력이 리그 평균에 비해 어느 정도인지, 우리가 할 수 있는 범위 안에서 최선을 다해서 사실에 가깝다고 믿어지는 값을 도출하는 것이다.

앞에서 소개한 여러 스탯 중에서, 나는 UZR을 즐겨 사용한다. RF나 ZR은 아쉬운 점이 너무 많으며, TZ나 +/-의 경우는 실시간으로 현재와 과거의 기록을 조회하는 일이 불가능하다. 반면 UZR은 Fangraphs에 가면 2002년부터 오늘까지의 데이터를 무료로 조회할 수 있다. 이쯤 되면 UZR은 선택이라기보다는 필수라고 해야 할 것이다. 다른 대안이 없으니 말이다...

Fangraphs에서 특히 매력적인 것은 UZR/150인데, 해당 포지션에서 한 시즌에 150게임을 뛴다고 가정하고 그에 맞춰 조정한 값을 나타내는 것이다.


추가 정보 : 수비에 대한 또 다른 자료로 David Pinto의 PMR(Probabilistic Model of Range)이라는 것이 있다. 그래프로 수비수의 능력을 보여주는데... 재미있으므로 여기도 한 번 들러 보시길 권한다.
http://www.baseballmusings.com/archives/018666.php

추가 정보 2 : Baseball Prospectus는 FRAR, FRAA와 같은 자체적인 수비 스탯을 가지고 있다. BP 사이트의 정의에 의하면 이들도 역시 특정 수비수의 책임 구역에 떨어지는 공을 그 수비수가 얼마나 처리했느냐를 가지고 계산하는 것으로 되어 있는데, UZR이나 +/- 보다는 신뢰도가 다소 떨어지는 것으로 여겨지고 있다.
Posted by FreeRedbird

댓글을 달아 주세요

  1. BlogIcon lecter 2009.08.30 09:49 Address Modify/Delete Reply

    TZ는 처음 보는 스탯인데 다들 구하는 개념은 비슷하군요. 특히 Sean Smith의 노가다 엑섹 파일 잘 봤습니다 -_-

    • BlogIcon FreeRedbird 2009.08.31 17:18 신고 Address Modify/Delete

      UZR과 TZ, +/-의 기본적인 아이디어는 동일합니다. 물론 세부적으로 들어가면 데이터를 수집하고 가공하는 부분에 있어 조금씩 차이가 있지만요...
      인터넷은 정보의 접근성이라는 측면에서 정말 위대한 성취라고 생각이 됩니다. 약간의 웹서핑을 통해 이전에는 상상도 못하던 정보를 얻게 되죠... 이렇게 공짜 정보를 많이 이용할 수 있는 덕에 저도 블로그를 운영할 수 있는 것 같습니다.

  2. 홈런강탈 2010.03.05 16:29 Address Modify/Delete Reply

    팀으로 볼때는 숫자가 커지기 때문에 투수들의 BIPA(Defeff와 비슷한)나 이보다 관련성은 다르지만 ERA-FIP를 참고하는 것도 괜찮다는 생각을 했었는데요. 잠깐 팬그래프의 팀 UZR과 이를 비교해 보니까 비교적 유사한 점도 있었지만 역시 참고일 뿐이라는 생각이 들더군요. 물론 UZR이 수비를 정확히 측정한다고 볼수는 없지만요.
    단 BIPA나 FIP/ERA ,UZR의 미국, 한국 1위는 동일했습니다. 매리너스와 SK 와이번스. 한국야구에서는 UZR을 볼 수 없으니까 이런걸 보게되네요 ㅋ

    • BlogIcon FreeRedbird 2010.03.05 16:45 신고 Address Modify/Delete

      역시 국내야구에 PbP 데이터가 부실하다는 것이 수비스탯의 발전을 저해하는 주 원인이 되고 있습니다. 제가 최근에 한국야구팬사이트의 댓글에서 한번 언급을 했는데요... 당장 PbP 데이터가 생겨날 것 같지 않으니 차라리 Tom Tango가 만드는 Fan Scouting을 모방해서 우리가 직접 점수를 매겨 봄이 어떨까 합니다. 팬 한 명의 시각은 거의 전혀 공신력이 없습니다만, 예를들어 50명이 투표한 수비 능력은 꽤 신뢰할 만 합니다. (투표자가 많은 경우 Fan Scouting의 결과는 UZR이나 +/-와 제법 연관성이 높게 나타납니다.)

    • BlogIcon 홈런강탈 2010.03.06 00:42 Address Modify/Delete

      파크나 파울볼등의 커뮤니티나 많은 경기를 본 관중을 대상으로 타팀 선수들을 투표하는 방식이 되면 괜찮을 것 같다는 생각도 하네요. 저도 그런 생각을 해봤었는데 공신력도 그렇지만 그자체로 의미가 하네요.

      앞으로 PbP데이터나 WAR의 이벤트의 가치를 통계내 볼수 있을 만큼 야구시장의 크기가 커졌으면 좋겠다는 생각이 더 들긴 합니다 ㅎ

      글구 Statiz.co.kr 게시판에 WOBA,FIP 위주의 방향으로 바뀐다는 글이 올라왔더라구요. 이미 보셨을지도 모르지만 나중에 보시고 의견 남겨주시면 저도 배우는게 있을듯 ㅋ

  3. BlogIcon 다짱 2010.11.29 10:52 Address Modify/Delete Reply

    데이터가 꽤 많네요~ 잘보고갑니다

    UZ의 개념을 확인하려다가 URZ의 개념까지 알고가네요

  4. BlogIcon aslkjdqwe 2011.10.15 02:08 신고 Address Modify/Delete Reply

    UZR이나 TZ같은 스탯은 똑같은 능력을 가진 좋은 수비수지만 '우연히' 처리할 타구가 많아지면 더 높은 값을 가지게 되는 거 맞죠?

    • BlogIcon FreeRedbird 2011.10.15 00:15 신고 Address Modify/Delete

      이 글은 지금 다시 읽어보니 좀 수정할 필요가 있어 보이네요.. Total Zone이나 +/-에 대한 설명은 보충이 필요한 것 같습니다. 일부 잘못된 서술도 있는 듯 하고요...

      말씀하신 것처럼 우연히 타구가 그쪽으로 많이 날아가는 바람에 혜택을 볼 수도 있습니다. UZR은 이런 부분을 최소화하기 위해 타구의 방향에 일반적으로 영향을 미치는 변수들 - 투수의 좌완/우완 여부, 타자의 좌타/우타 여부, 투수의 그라운드볼 성향 등 - 을 고려하여 보정을 해 줍니다. 그렇다고 하더라도, 우연히 많은 타구가 몰려서 숫자가 왜곡될 가능성을 배제할 수는 없죠. 따라서, 샘플 사이즈가 중요해집니다. 샘플이 많으면 많을 수록 왜곡의 가능성은 적어지겠지요. 수비스탯을 볼 때 1년 데이터보다는 최근 3년 평균 등을 참고하는 것도 샘플사이즈의 문제 때문입니다.

  5. ㅇㅇ 2012.07.04 21:33 Address Modify/Delete Reply

    현재 UZR의 경우는 수비 쉬프트에 대해서 어떻게 처리할까요?
    뛰어난 수비수가 아님에도 좋은 쉬프트 덕분에 높은 수치를 기록할 가능성도 있지 않을까요?

    • BlogIcon FreeRedbird 2012.07.05 02:11 신고 Address Modify/Delete

      쉬프트는 현재 쉬프트의 정의 자체가 불명확하여 (얼만큼 이동하면 쉬프트일까요?) 수비 스탯에 반영하기가 어려울 것 같습니다. 결국 말씀하신 것처럼 노이즈를 증가시키고 있을 것 같은데요...

  6. 홈런왕 2012.07.24 23:39 Address Modify/Delete Reply

    DRS가 플러스/마이너스(필딩바이블)를 기반으로 한 수치죠?
    레퍼런스가 근래 토털존을 DRS로 교체했네요.
    UZR과 비교한다면 어떤가요?

    • BlogIcon FreeRedbird 2012.07.30 01:36 신고 Address Modify/Delete

      DRS와 UZR은 계산방법이 조금 다릅니다만, 근본이 되는 아이디어는 거의 동일합니다.

      +/-는 각 수비수가 같은 포지션의 평균적인 수비수에 비해 얼마나 많은 타구를 처리했는지를 나타내는 지표이고요. DRS는 이 +/- 값에 번트 처리 능력, 병살 처리 능력, 외야수의 송구 능력, 홈런타구를 아웃으로 처리하는 능력 등을 포함한 값입니다.

  7. 칼리프 2012.08.25 14:55 Address Modify/Delete Reply

    이 글 읽고 돌아다니다가 우연히 필딩 런 Fielding Run 이라는 수비 스탯을 보게 되었는데, 이건 어떤 개념인지 간략하게 알려주실 수 있으신가요? ( http://navercast.naver.com/contents.nhn?contents_id=5938) 대부분 UZR을 사용해서 그런지는 몰라도, 수비 스탯을 소개할 때 TZ나 +/-(Fielding Bible)은 한 번씩 언급하고 넘어가던데 유독 이 스탯에 대해서는 아무 설명이 없어서요.

    • BlogIcon FreeRedbird 2012.08.26 01:19 신고 Address Modify/Delete

      Fielding Runs는 Pete Palmer가 개발한 수비 스탯으로, 네이버캐스트에 나와 있는 것처럼 전통적인 숫자들(Putout, Assist, Double Play, Error 등)을 가지고 수비력을 측정하고자 한 지표 입니다.
      이 스탯은 문제가 많아서 요즘 잘 쓰지 않고 있습니다. 예를 들어, 공식을 보시면 분자가 .20(PO + 2A - E +DP)로 A 앞에만 2의 가중치가 붙어 있는데요. 어시스트가 풋아웃이나 에러, 병살보다 2배 더 중요하다는 근거는 전혀 없습니다. Palmer 본인도 설명한 적이 없고요.

  8. 한기범 2012.11.02 12:13 Address Modify/Delete Reply

    포스팅 잘 봤습니다. KBO의 스탯을 정리해보고 싶은데 레드버드님의 포스팅 많은 참고 되고 있습니다.

    UZR의 계산 방식이 한가지 궁금한데요, ZR과 UZR의 다이어그램이 다른데 UZR에서 각
    포지션마다 수비 책임범위가 써있지 않아서요. UZR에서는 어떻게 계산하는지 궁금합니다.

    • BlogIcon FreeRedbird 2012.11.07 08:45 신고 Address Modify/Delete

      정확한 책임범위는 공개되어 있지 않은 것으로 알고 있습니다. MGL의 영업 비밀이 아닐까 싶은데요. ㅎㅎ 혹 발견하게 되면 다시 포스팅하도록 하겠습니다.

이전 포스팅에 이어서, WAR 계산하기 시리즈의 두 번째로, Replacement Level(대체 수준)을 소개하고자 한다. 정말이지... 쓰고 싶은 것은 많은데... 시간이 늘 부족하다.

오늘의 포스팅은, 여러 자료를 활용하였지만, 특히 Baseball Prospectus의 책인 <Baseball between the Numbers>를 많이 참고하여 작성하였음을 미리 밝혀 둔다. 이것은 Baseball Prospectus의 Keith Woolner가 Replacement Level 및 VORP의 원조이기 때문이다.


네이버나 다음 등의 포털에서 Replacement Level을 검색하면, Keith Woolner가 Replacement Level과 VORP를 처음 발표했을 때의 글을 우리말로 번역한 글 정도만 검색되어 나오는 것 같다. 이 포스팅이 가능한 한 좀 더 알기쉬운 우리말 설명이 될 수 있도록 최선을 다 해 보고자 한다.


- 타자의 Replacement Level 구하기 -

무엇이든 객관적으로 비교하고자 한다면 뭔가 절대적인 기준이 필요하다. 제일 먼저 떠오르는 기준은 리그 평균이다. 리그 평균은 쉽계 계산 가능하다는 장점이 있다. 하지만 "리그 평균 성적의 메이저리거"라는 것은 사실 무척 높은 기준이다. Low Minor에 있는 어린 유망주들은 그렇다 치더라도, 메이저리그와 마이너리그를 오가는 수많은 AAAA 플레이어와 저니맨들이 있기 때문이다. 아래의 출루율 그래프을 보자. 이 그림은 The Hardball Times에서 가져온 것이다.

image

이 그래프는 2008년에 110타석 이상을 기록한 선수들을 대상으로 출루율(OBP)을 조사하여 메이저리그와 마이너리그에서 출루율의 분포를 나타낸 것이다. Y축은 퍼센티지이며, 마이너리그는 AAA와 AA만을 대상으로 하였다. (싱글 A에 있는 유망주가 어느날 갑자기 메이저리그에 콜업되거나 할 일은 없으므로, 비교 대상으로 부적절하다.)

위의 그래프에서, 메이저리그의 평균 출루율은 .330~.340 사이에 위치하고 있다. (정확히는 .336 이다.) 그 밑으로 얼마나 많은 플레이어들이 있는지 쉽게 확인할 수 있을 것이다. (빨간색+파란색 하면 메이저리그 평균 이하이면서 현재 메이저리그에서 뛰고 있거나 혹은 AAA, AA에 있으면서 시즌 중 메이저리그에 합류할 가능성이 있는 플레이어들의 합이 된다.) 만약 리그 평균을 기준으로 플레이어를 평가한다면, 무수히 많은 마이너스 값을 얻게 될 것이다. 이것은 보기도 좋지 않거니와, 마이너스 값 때문에 추가적인 분석이나 계산을 수행하기에도 애로사항이 많다.


이러한 필요에 의해서, 소위 "Replacement Level"이라는 개념이 Baseball ProspectusKeith Woolner에 의해 발명되었다. 어쩌면 세이버메트릭스의 역사에서 가장 중요한 사건이라고 할 수도 있을만큼, Replacement Level의 영향력과 파급효과는 막대한 것이었다.

Replacement Level에 대한 Keith Woolner 본인의 정의를 들어 보자. 이하는 <Baseball between the Numbers> 161페이지에 나오는 정의 부분을 그대로 옮긴 것이다.

Replacement Level is the expected level of performance a major league team will receive from one or more of the best available players who can be obtained with minimal expenditure of team resources to substitute for a suddenly unavailable starting player at the same position.

이해를 돕기 위하여 예를 들어 보도록 하겠다.

Cardinals의 주전 우익수는 Ryan Ludwick이다. 어느 날 Ludwick이 수비를 하다가 외야에서 넘어지면서 어딘가 한 군데가 부러져서 1~2개월 정도 결장하게 되었다고 하자. (위의 정의에서 말하는 "suddenly unavailable starting player"이다) Mozeliak 단장은 그의 빈자리를 메꾸기 위해서 AAA에서 외야수 Nick Stavinoha를 메이저리그 로스터로 올려 보낸다. 마이너리그 선수가 메이저리그에 올라가게 되면 자동적으로 리그 최저 임금을 적용 받게 된다. (위의 정의에서 말하는 "obtained with minimal expenditure of team resources"이다) 이제 La Russa 감독은 주전 우익수를 잃어버렸으므로, 우익수 자리에 Ankiel과 Stavinoha, 심지어 Joe Thurston 등을 상황에 따라 적당히 돌려가며 기용할 것이다. (위의 정의에서 말하는 "one or more of the best available players"이다)

최저의 비용으로 대체 선수를 조달하는 방법은 꼭 AAA 선수의 콜업만 있는 것이 아니다. 외야 한 자리를 메꾸기 위해, 현재 집에서 놀고 있는 Jim Edmonds를 잘 꼬셔서 최저연봉 수준으로 계약하여 로스터에 합류시키는 방법도 있다. 혹은 다른 팀의 Waiver Wire를 살펴 보니 마침 Matt Murton 같은 땜빵용으로 적당한 외야수가 웨이버 공시 되어 있었다면, 그를 클레임 해서 데려오는 방법도 가능할 것이다. 몇 주 버티다 보면 부상에서 회복된 Ludwick이 돌아와서 다시 주전 우익수가 될 것이므로, Cardinals는 굳이 다른 구단에서 주전급 우익수를 또 트레이드 해 오지는 않을 것이다.

위에서 언급한 세 가지 방법, 즉 1) AAA 선수의 콜업, 2) 집에서 놀고 있거나 인디 리그에서 뛰고 있는 선수와 계약, 3) 웨이버 클레임 정도가 최저 비용으로 대체 선수를 조달하는 일반적인 방법이 되겠다. 이런 대체 선수는 대개의 경우 혼자서 주전을 맡을 만큼 기량이 뛰어나지 않으므로, 기존의 벤치 멤버들과 섞여서 돌려가며 기용되는 일이 많을 것이다. 이렇게 부상당한 주전 대신 돌아가며 해당 포지션에 기용되는 땜빵 선수들이 집합적으로 내 줄 것이라고 기대하는 퍼포먼스의 수준이 바로 Replacement Level인 것이다.


Keith Woolner와 그의 동료들은 지난 100 년간의 메이저리그 기록(오타가 아니다. 진짜 100년이다!!)을 바탕으로 각 팀에서 주전을 제외한 나머지 선수들이 공격에서 어떠한 성적을 내 왔는지 통계를 내 보았다. 공격의 기여 수준을 측정하는 지표로는 RC/27을 사용하였다. (RC에 대해서는 지난 번 포스팅에서 간략히 설명한 바 있다.) 그 결과... 다음과 같은 결론을 얻었다.

1) 주전 선수와 대체 선수의 타석 수 비율은 대체로 8:2 이다.
2) 평균적인 대체 선수들은 평균적인 주전 선수에 비해 80% 정도의 성적을 냈다. 단, 약간의 예외가 있는데, 포수를 맡은 대체 선수들은 주전의 85% 정도의 성적을 냈으며, 1루수를 맡은 대체 선수들은 75% 정도의 성적을 냈다.

예외 부분은 상식적으로도 어느 정도 납득이 가능하다. 포수의 공격력은 대체로 시원찮으므로 주전과 대체 사이의 공격력 갭이 상대적으로 작을 것이며, 반면 1루수들은 대개 팀의 주포를 맡고 있으므로 주전과 대체 사이의 갭이 클 것이다.


그럼 이러한 Replacement Level이 어느 정도인지를 어떻게 구할 수 있을까? 이에 대해서는 명확히 합의된 바가 없으며, 다양한 아이디어와 공식들이 개발되어 경합하고 있는 상황이다. 다만 여러 연구 결과에 따르면, 여러 방식으로 Replacement Level을 구해 보면 거의 비슷한 결과를 얻게 된다고 한다. 이 글에서는 Replacement Level을 만든 장본인인 Keith Woolner의 공식을 소개하고자 한다.

Keith Woolner와 그의 동료들은 소위 slash stat(AVG/OBP/SLG)을 가지고 Replacement Level을 계산하는 식을 고안하였는데, 그 식은 아래와 같다. 역시 <Baseball bewteen the Numbers>에 소개된 내용이다.


사용자 삽입 이미지

여기서 P는 우리가 구하고자 하는 포인트로 Replacement Level과 리그 평균과의 갭을 의미하며, R은 해당 포지션에서 Replacement Level과 리그 평균과의 퍼포먼스 비율이다. 예를 통해 설명하도록 하겠다.

책에서 사용한 예를 활용하자면, 어느 시즌의 리그 평균 좌익수의 타격 성적이 .270/.340/.430이라고 하자. Replacement Level LF는 주전들에 비해 80% 정도의 퍼포먼스를 낼 것으로 기대되므로, 위의 식에서 R값은 0.8이 된다. 여기에 AVG, OBP, SLG를 각각 대입하면, P=0.033을 얻게 된다. 이 P값을 AVG/OBP/SLG에서 각각 빼 주면, 그게 바로 우리가 찾고자 하는 Replacement Level의 퍼포먼스가 된다. 즉, 그 시즌의 Replacement Level 좌익수의 예상 타격 성적은 .237/.307/.397이다.

시즌과 리그에 따라 약간씩 변동이 있으나, 리그 평균 플레이어의 퍼포먼스와 Replacement Level 플레이어의 퍼포먼스를 비교하면 대략 20점(20 Runs) 차이가 난다. 20점의 차이는 팀의 승패에 어느 정도의 영향을 미칠까? 이전 포스팅 중 Pythagorean Record에 관한 글을 기억하시는지? 그 포스팅에서, 가장 간단한 방법인 10점=1승 으로 계산하여도 오차가 별로 없음을 엑셀 파일을 통해 보여 드린 바 있다. 따라서, 여기에서도 동일하게 10점을 1승으로 생각하면 큰 무리가 없다. 즉, 평균적인 메이저리거와 Replacement Level 플레이어의 차이는, 승 수로 환산하면 약 2승이 되는 것이다.

즉, 어떤 팀이 2루에 리그 평균 2루수를 1년 내내 기용했고, 그 시즌에서 82승 80패를 기록했다고 하자. 만약 그 2루수가 spring training에서 심각한 부상을 당해서 시즌 아웃 되었고, 구단이 금전적 여유가 없어 1년 내내 Replacement Level 2루수들로 돌려막기를 했다면, 그 팀은 아마도 그 시즌에서 80승 82패를 할 것이라는 의미이다.

참고로, 최근에는 리그 평균과 Replacement Level의 차이를 NL에서는 2승, AL에서는 2.5승으로 보는 견해가 어느 정도 지지를 얻고 있음을 밝혀 둔다. 메이저리그에서도 NL과 AL 간의 차이가 있다고 보는 것이다.


- 투수의 Replacement Level 구하기 -

현대 야구에서는 선발투수와 구원투수의 역할이 확실하게 나누어져 있으므로, Replacement Level을 계산할 때에도 둘을 분리하여 구하게 된다.

Keith Woolner는 5인 로테이션이 완성된 1960년대 후반부터 2000년대 초반까지의 실제 메이저리그 기록을 가지고 회귀분석을 하여 아래와 같은 회귀식을 얻었다.

Replacement Level Starter RA = 1.37 x League Average RA - 0.66
Replacement Level Reliever RA = 1.70 x League Average RA - 2.27


여기서 RA는 Run Average로, 평균 실점을 의미한다. ERA가 평균자책인 데 반해, RA는 자책점과 비자책점을 모두 합쳐서 계산한다는 점이 다르다. ERA와 RA 사이에는 경험적으로 ERA = 0.92 x RA 의 관계가 성립하므로, Replacement Level 투수들의 ERA도 예측 가능하다. 반대로 가지고 있는 정보가 ERA밖에 없는 경우에도 Replacement Level의 계산이 가능하다.

예를 들어, 어느 시즌의 선발 투수들의 평균 ERA가 4.5였다고 하자. RA = 4.5/0.92 = 4.89 가 된다. 이 값을 위의 Replacement Level Starter RA 식에 집어 넣으면...  1.37 x 4.89 - 0.66 = 6.04가 된다. 다시 ERA를 구해 보면... 6.04 x 0.92 = 5.56이 된다. 즉 선발 투수들의 평균 ERA가 4.5인 시즌의 Replacement Level 선발 투수는 대략 5.56의 ERA를 가질 것으로 예상할 수 있는 것이다. 물론 평균 RA를 알고 있다면, ERA대신 RA를 사용하는 쪽이 좀 더 정확한 예측이 가능하다.


만약 공격, 수비, 그리고 구원투수들이 모두 리그 평균인 어떤 가상의 팀이 Replacement Level Starter를 선발로 기용하여, 역시 리그 평균 선수들만으로 이루어진 다른 팀을 상대한다면 어떻게 될까? Tom Tango와 같은 세이버메트리션들의 연구 결과에 의하면 이 경우의 승률은 대략 38%로 낮아진다. 또한, 공격, 수비, 선발투수들이 모두 리그 평균이고 불펜이 Replacement Level Reliever들로 구성된 팀이 완전히 리그 평균인 다른 팀을 상대한다면, 이 경우의 기대 승률은 대략 47%가 된다. 선발투수가 구원투수에 비해 얼마나 비중이 큰지 알 수 있는 부분이다.


- VORP(Value Over Replacement Player) -

VORP는, Value Over Replacement Player의 약자로, 특정 플레이어가 Replacement Level 플레이어와 비교하여 얼마만큼의 가치(Value)를 소속팀에 제공해 왔는지를 나타내는 스탯이다. "Value"는 점수로 계산된다. 즉, Replacement Player에 비해 팀에 몇 점의 득점을 기여했는가(타자의 경우) 혹은 몇 점을 덜 실점하도록 기여했는가(투수의 경우) 이다. VORP는 수비에 대해서도 계산할 수가 있다. 어떤 플레이어가 Replacement Player에 비해 수비로 몇 점이나 기여했는지의 데이터를 얻을 수 있다면, 같은 요령으로 계산이 가능하다. 수비로 인한 득실에 대해서는 이 다음 포스팅에서 따로 다룰 예정이므로, 여기에서는 생략하기로 한다.

이 Value를 구하는 이론과 계산식도 여러 가지가 있다. 공격의 경우 RC, EqA 등을 이용하여 구하기도 하는데, 나는 Fangraphs와 Tom Tango의 방식을 따라 wOBA 및 wRAA를 이용하는 방법을 선호하고 있다. 이론적 배경이 간단명료하고 계산이 훨씬 쉽다는 장점이 있기 때문이다. 그러한 장점에도 불구하고 딱히 정확도가 다른 방법에 비해 떨어진다는 생각은 들지 않는다. 일단 wRAA를 구하고, park effect를 적용하여 보정한 다음, 앞에서 언급했듯이 리그 평균 플레이어와 Replacement Player의 공격력은 대략 20점 차이가 나므로 앞의 계산 결과에 20점을 더해주면 된다. 일단 수비까지 설명한 후, WAR 계산을 설명할 때 실제 적용 예와 함께 다시 설명 드리도록 하겠다.  (링크 -  타자의  VORP:WAR 구하기)

투수의 경우, 일반적인 계산식은 아래와 같다. 투수는 실점에 직접적으로 관여(?)하기 때문에, 타자에 비해 계산이 단순한 편이다.
VORP = ((Replacement Level - RA)/9)*Innings Pitched
여기에서는 FIP를 적용하여 RA를 구하게 되는데... 역시 글이 너무 길어지므로 투수에 대해서도 따로 다루도록 하겠다. 나중에 다루겠다고 한 부분이 많은데... 꼭! 하나씩 챙겨서 차례로 다룰 예정이므로, 관심 있으신 분들께서는 자주 들러 주시기 바란다. ^^


VORP의 일반적인 내용에 대해서는 아래 위키 페이지를 참고.
http://en.wikipedia.org/wiki/Value_over_replacement_player

아래는 Keith Woolner의 Replacement Level에 대한 기념비적인 오리지널 원조 글이다. 검색엔진에서 Replacement Level을 검색하면 나오는 글은 대부분 이 글을 한글로 번역한 것이다.
http://www.stathead.com/bbeng/woolner/vorpdescnew.htm

Posted by FreeRedbird

댓글을 달아 주세요

  1. Doors 2009.10.21 16:54 Address Modify/Delete Reply

    자세한 설명 감사드립니다.^^

  2. BlogIcon FreeRedbird 2009.10.27 15:44 신고 Address Modify/Delete Reply

    감사합니다. ^^;;

  3. Halladay 2015.05.04 10:35 Address Modify/Delete Reply

    WAR라는 스텟 계산과 산출을 배우는데 정말 많은 도움이 되네요! 짜임새있는 글에 감탄하고 갑니다!

이 블로그에서 트레이드의 이해득실을 계산할 때나 특정 플레이어의 기여도를 비교할 때에 주로 사용한 비교 툴은 WAR(Wins Above Replacement) 였다. 그런데, 생각해보면 세이버메트릭스의 개념에 대해서 자세히 설명한 것은 FIP와 BABIP 정도밖에 없었던 것 같다. 이래가지고서야 WAR를 가지고 아무리 이야기해봤자 결국 잘난척에 불과하지 않을까...라는 생각이 들었다.

그래서 WAR의 개념과 계산 방법을 설명하기로 결심했지만... 문제는 도대체 어디까지 거슬러 올라가야 하는가였다. 이 블로그를 방문하시는 분들께서 스탯에 대해 얼만큼의 지식을 가지고 있는지 알 수도 없고... 결국 이런저런 고민 끝에, OPS와 그 변종들로부터 출발하기로 했다. 나는 Fangraphs와 같이 wRAA를 WAR 계산시 공격력의 척도로 삼고 있으므로, 이 글에서는 wRAA의 계산 방법까지 다뤄 보고자 한다.


요즘도 야구 중계를 보면 사실 타자에 대해 주로 언급되는 스탯은 타율(AVG), 홈런(HR), 타점(RBI)이 고작이다. 우리나라 중계는 물론이거니와 메이저리그 중계라고 해서 크게 다르지는 않은 것 같다. 그나마 OPS가 널리 퍼진 덕에, 출루율(OBP)과 장타율(SLG) 정도를 덤으로 들을 수 있는 정도이다.

타율이나 타점과 같은 석기시대의 스탯들로 타자를 평가하면 문제가 많다는 이유에 대해서는 자세한 설명을 생략하고자 한다. 이전의 FIP나 BABIP에 대한 글 뿐 아니라, 기회가 있을 때마다 같은 말을 반복해왔기 때문이다. 타율은 타자 본인의 능력과 상관없는 많은 요소들, 이를테면 상대팀의 수비 능력과 같은 외부 요인들이 많은 영향을 끼치므로, 타자의 능력을 평가하는 잣대로 쓰기에는 불완전한 부분이 많다는 정도로만 정리하고 넘어 가겠다. 타점은 팀 동료들이 해당 타자 앞에서 얼마나 출루를 해 주느냐에 더욱 크게 좌우되므로, 개인 스탯이라기보다는 팀 스탯에 가까운 숫자라고 할 수 있다. 타자의 생산성을 평가하는 지표로는 역시 낙제점을 면키 어렵다.


1. OPS

세이버메트릭스 최초의 히트작이라고도 할 수 있는 OPS 부터 살펴보자.

OPS는 On base percentage(OBP, 출루율) Plus Slugging percentage(SLG, 장타율)의 약어이다. 따라서 OBP와 SLG만 구할 수 있다면 쉽계 계산된다. 이 둘을 구하는 식은 아래와 같다.

OBP = (H + BB + HBP) / (AB + BB + SF + HBP)
SLG = TB / AB = (1B + 2*2B + 3*3B + 4*HR) / AB


이 둘을 그대로 더한 것이 OPS이다. 즉,

OPS = OBP + SLG

이렇게 된다. OPS가 히트하게 된 데에는 타자의 출루 능력과 장타력을 골고루 평가한다는 내용상의 우수함 뿐 아니라, 계산식이 단순하여 누구나 쉽게 이해하고 계산할 수 있다는 장점도 크게 작용하였다. 이후 보다 정밀한 스탯이 무수히 많이 개발되었지만, 한 눈에 타자의 생산성을 훑어보는 데에는 여전히 요긴하게 쓰이고 있다.


2. OPS+

이후 구장마다 타자에게 유리한 구장이 있고 불리한 구장이 있다는 것을 감안하여, 조정 OPS(OPS+, Adjusted OPS)가 등장하게 된다. OPS+는 구장 효과(Park Factor)를 반영할 뿐 아니라, 100을 평균으로 하여 스케일도 조정되기 때문에, 특정 시즌에 특정 타자가 리그 평균에 비해 얼마나 좋은 활약을 펼쳤는지 알 수 있다. (100보다 큰 숫자는 리그 평균보다 좋은 활약을 했음을 의미하며, 100보다 작으면 그 반대이다. 또한 100에서 멀어질수록 평균과의 차이가 크다.)

계산식은 다음과 같다.

OPS+ = 100 * ((OBP/lgOBP + SLG/lgSLG) - 1)

혹은 구장 효과를 적용하였음을 나타내기 위해 아래와 같이 표현하기도 한다.

OPS+ = 100 * ((OBP/lgOBP + SLG/lgSLG) - 1) / BPF

여기서 BPF는 타자의 Park Factor를 의미한다.


이렇게 되면 꽤 많이 발전한 것 같지만... OPS의 개념 자체에 대한 비판이 이어졌다. OPS이든 OPS+이든 기본적으로 가중치 없이 OBP와 SLG를 더해서 만들어지는 식이라는 점에서는 동일하다. 즉 출루율과 장타율을 동일한 가치로 취급하고 있는 것이다.

이러한 접근에 문제가 있음은 쉽게 알 수 있는데... 리그 평균 OBP와 리그 평균 SLG가 거의 1할 가까이 차이가 나는 데다가, 그 분포도 다른 것이다. 세이버메트리션들은 여기서 좀 더 나아가서, 득점과의 상관 관계를 통계적으로 구해 보았다. (타자가 타격을 하는 목적은 결국 팀이 득점하는 것이며, 그 외의 것은 모두 부수적인 것일 뿐이라는 사실을 기억할 필요가 있다.) 그 결과, 어떤 연구에서도 출루율과 득점과의 상관 관계(correlation)가 장타율과 득점과의 상관 관계보다 높게 나왔다. 이는 OPS와 같은 스탯을 계산할 때 출루율에 대해 얼마간의 가중치를 부여해야 한다는 의미가 된다.


3. GPA

이에 따라, GPA(Gross Production Average)가 발명되었다. 이 스탯은 출루율에 1.8의 가중치를 부여한 것이다.

GPA = (1.8*OBP + SLG) / 4

물론 이 식을 그대로 쓰지 않고 Park Factor를 적용, 조정하여 사용한다. 4로 나누는 이유는 AVG와 비슷한 정도의 scale을 얻도록 하기 위해서이다. 마치 타율과 비슷하게, GPA가 2할대 초반이 나오면 형편없는 타자이고, 3할이 나오면 아주 뛰어난 공격력을 지닌 타자라고 볼 수 있는 것이다.

GPA는 OPS보다 실제 득점과의 상관관계가 더 높으면서도 여전히 계산하기가 쉽다는 장점을 가지고 있다. GPA를 Runs, 즉 점수를 내는 데 기여한 수준으로 변환하는 공식들도 개발되어 있는데, 대표적인 것은 PA*1.356*(GPA^1.77) 이다.

여담이지만, "Moneyball"에서 Paul DePodesta는 OBP가 SLG보다 3배나 중요한 스탯이라고 주장한 바 있다. OBP가 중요하긴 하지만 그정도로 극단적인 OBP 우선주의는 좀 문제가 있다. DePodesta가 LA Dodgers에서 실패한 데에는 다 이유가 있는 것 같다...


4. RC, RC/27

이번에는 세이버 진영에서 내놓은 좀 더 복잡한 스탯들을 알아보자.

Bill James의 유명한 발명품들 중 하나인 RC(Runs Created)는 일단 아래와 같은 기본 형태를 가진다. (사실 이 스탯은 위의 GPA보다 훨씬 더 오래된 것이다.)

RC = (A*B) / C

A는 출루율을 반영한 어떤 값(On Base Factor)이며, B는 앞서 출루한 주자를 진루시키는 능력을 반영한 어떤 값(Advancement Factor)이다. C는 타자가 출루 내지는 진루를 시킬 수 있는 기회(Opportunity Factor)를 의미한다.

Bill James가 처음 RC를 고안한 이래로, 이 공식은 무려 14차례나 변형되어 왔다. 이를테면... 가장 기본적인 형태의 공식은 다음과 같다.

RC = ((H + BB) * TB) / (AB + BB)
      = OBP * SLG * AB


보다 널리 쓰이는 개량 버전 중 하나는 아래와 같다.

RC = ((H + BB - CS + HBP - GIDP) * (TB + 0.26 * (BB - IBB + HBP)) + (0.52 * SH + SF + SB)) / (AB + BB + HBP + SH + SF)

어이없다는 생각이 들 지도 모르겠으나... 이건 그나마 2002년 버전에 비하면 쉬운 공식이다. 필요한 숫자들이 많긴 하지만 모두 쉽게 얻을 수 있는 기본적인 스탯들이기 때문이다.

2002년 버전은 Wikipedia를 그냥 링크하도록 하겠다. 일일이 적자니 너무 길다... -_-;;;
클릭

링크에서... 위에 소개한 버전들을 쭉 지나면 2002 version이라는 것이 나온다. 읽을 수록 한숨만 나올 것이다. 통계적인 수치와 계산식을 통한 예측치를 일치시키려는 노력이 이렇게 계속되고 있지만... 그러면 그럴수록 식은 복잡해지고... 일반 팬들이 집에서 계산하기에는 무리가 많이 따르는 식이 되어 버리고 만다. 이 식을 바탕으로 한 득점 예상치의 오차가 5% 이내일 만큼 많이 정밀해진 것도 사실이지만... 그러면 그럴수록 오히려 활용하기는 더욱 어려워지고 있다.


[주: RC/27의 설명이 필요한 듯 하여 아래 paragraph를 나중에 추가하였다. 09/11/18]

한편, 공격력 측정 지표로 빈번히 이용되는 RC/27은 무엇일까?

RC/27은 단순히 RC를 27로 나눈 값이 아님에 유의하시길...!!!

RC/27 = 27 * RC / (AB - H + CS + GIDP + SH + SF)

계산하는 사람의 이론적인 이해 또는 입장에 따라 SH와 SF를 넣기도 하고 빼기도 한다. 개인적으로는 "SF는 넣고 SH는 제외해야 하지 않을까" 라는 생각을 하고 있다.

RC 대신 RC/27을 쓰는 이유는... RC가 누적 스탯이기 때문에, 절대적인 출장 기회가 많을수록 유리하기 때문이다. 예를 들어 어떤 플레이어가 부상으로 인해 시즌의 반 밖에 소화하지 못했다면, 그를 RC로 평가하는 것은 정당하지 못하다. RC/27의 개념은, 해당 타자 아홉 명으로 1번부터 9번까지 타순을 짠 다음, 9회까지 27아웃을 뛰는 동안 그 팀이 몇 점이나 득점할 수 있을지의 예상치를 산출하는 것이다. 따라서, 타석 수에 상관없이 절대적인 비교가 가능하다.

RC는 Bill James와 그의 동료들에 의해, 지금도 계속해서 개량 중인 스탯이다. "(출루능력 * 진루능력) / 기회"라는 이론적 기반 위에서, 실제 메이저리그 게임에서 통계적으로 관측되는 결과에 맞추기 위해 계속 식을 변형해 가는 것이다. Tom Tango는 이 이론적 기반 자체에 대해 의문을 제기한 바 있으며, 또한 RC가 홈런의 가치를 정확히 반영하지 못하고 있음을 보여주었다. Tom Tango의 비판에 대해서는 그의 홈페이지를 참고.

이러한 약점에도 불구하고, RC 특히 RC/27은 오랜 기간동안 타자의 공격력을 측정하는 지표로 매우 널리 이용되었다. 적어도 아래의 EqA나 wOBA가 나오기 전까지는 말이다.

5. EqA

이번에는 Baseball Prospectus의 야심작인 EqA를 살펴보자.

EqA는 Equivalent Average의 약자이다.
단어의 의미에서 알 수 있듯이, 역시 친숙한 AVG와 비슷한 숫자를 얻을 수 있도록 scale 조정을 한 스탯이다. 게다가 Equivalent는 리그에 대한 조정도 가능함을 의미한다. 즉 AA 레벨인 Texas League에서 뛰고 있는 어떤 유망주가 있을 때, 그의 활약 정도를 메이저리그로 옮겨 보면 어느 정도가 되는지 등의 분석이 가능하게 되는 것이다.

꽤 파워풀한 스탯 같지만... 역시 이런 스탯을 만들기 위해서는 엄청난 작업이 필요하다.

일단 아무 조정도 되지 않은 Raw EqA를 구해보면,

RawEqA = (H + TB + 1.5 * (BB + HBP + SB) + SH + SF - IBB/2) / ( AB + BB + HBP + SH + SF + CS + SB)

벌써 질렸는가? 이것은 단지 시작일 뿐이다.
이제부터 10번 이상의 변환을 거쳐야 한다. 하나하나가 결코 만만한 작업이 아니다.
이걸 일일이 설명하다가는 밤을 새야 할 것 같으므로, 그냥 Baseball Prospectus 사이트의 링크를 걸도록 하겠다.
클릭

이건 Runs Created 2002 버전보다도 몇 배나 어이없는 공식이다. RC의 경우는 엑셀을 이용하면 그럭저럭 노가다로 구할 수는 있지만... EqA는 솔직히 엄두조차 나질 않는다. 기껏해야 링크된 글을 몇 번 읽어보고 각각의 변환이 갖는 의미를 이해하는 정도가 고작이다.

주루플레이까지 포함하고 있고, 정교한 계산을 통하여 조정 작업을 거치게 되어 있으므로, 꽤 잘 만든 스탯인 것은 사실이지만 역시 일반 팬들이 활용하기는 너무 무리한 스탯이다.


이 밖에도 여러 OPS 대체 스탯이 만들어졌으나 일단 이 정도만 소개하고 넘어가고자 한다.


6. wOBA, wRAA

사실 진짜 소개하고 싶은 스탯은 바로 이 wOBAwRAA이다.

wOBA는 weighted On Base Average의 약자로, Tom Tango 외 2인이 쓴 책인 "The Book"에 잘 소개되어 있다. 앞으로 기회가 있을 때마다 이 책의 내용을 많이 소개할 예정인데... 2007년에 출판된 책으로, 세이버메트릭스의 새로운 교과서라고 해도 과언이 아닐 만큼 알찬 내용으로 잘 쓰여진 책이다.

세이버메트리션들은 이미 타자가 타석에 들어서서 발생한 어떤 "사건(Event)"이 득점에 미치는 영향을 오랜 기간에 걸쳐 조사해 왔다. 예를 하나 들어보자.

1999년부터 2002년간의 모든 메이저리그 게임을 이닝별, 상황별로 분석한 결과... 2사 만루 상황에서의 득점 기대값(Run Expectancy)은 0.815였다. 즉 이런 상황을 1000번쯤 맞게 된다면 815점 정도 득점할 확률이라는 것이다. 그런데... 타자가 여기서 만루홈런을 쳤다고 하자. 팀은 4점을 득점하고, 상황은 2사 주자 없음으로 바뀐다. 2사 주자 없음에서의 득점 기대값은 0.117로 나타나고 있다. 그렇다면, 앞의 만루홈런의 득점 가치(Run Value)를 구해 보자.

이 홈런으로 인해 득점 기대값은 0.815에서 0.117로 떨어졌다. 하지만 그 사이에 홈런으로 인해 팀은 4점을 득점하였으므로, 실제로는 0.117이 아니라 4.117이 된 셈이다. 따라서, 아래와 같이 식을 세울 수 있을 것이다.

0.815 + 만루홈런의 Run Value = 4.117

따라서, 2사 만루에서 홈런의 가치는 득점으로 환산하면 3.302 Runs가 됨을 알 수 있다.

이런 계산을 각 사건에 대하여 아웃카운트와 주자를 변화시켜 가며 모든 상황에 대해 해 보는 것이다. 이렇게 해서 사건별로 가중평균을 얻은 값은 아래와 같다.

홈런 : 1.397 Runs
3루타 : 1.070
2루타 : 0.776
1루타 : 0.475
에러 : 0.508
몸에 맞는 공 : 0.352
볼넷(고의사구제외) : 0.323
고의사구 : 0.179
폭투 : 0.266
아웃 : -0.299
(이하 생략 : 그 밖의 상황에 대한 데이터는 책을 참조하시기 바람... -_-;;; )

그렇다면 타자의 생산성을 어떻게 평가할 수 있을까? 홈런이나 안타 등이 가지는 가치는 아웃에 대비하여 구해야 할 것이다. "아무 것도 아닌 경우"란 존재하지 않기 때문이다. 타자는 아웃 당하거나, 아니면 어떤 방법으로든 살아서 나갈 것이다. 안타가 되었든, 에러가 되었든 간에 말이다. 따라서... 아웃으로 인한 가치의 손실을 빼 주면 해당 이벤트의 진정한 가치가 된다고 말할 수 있겠다. 예를 들면...

홈런 : 1.397 + 0.299 = 1.698

이런 식으로 구하는 것이다.

그 다음, 결과값을 OBP와 비슷한 scale로 나타내기 위해서, 각각의 value에 다시 1.15를 곱해 준다. 홈런의 경우는 1.698 * 1.15 = 1.95가 된다.

위에서 본 다른 스탯들은 주로 타율(AVG)과 비슷한 scale로 나타내기 위해서 조정을 했는데, wOBA의 경우는 출루율과 비슷한 scale로 조정을 해 주고 있다. 이렇게 조정해 주는 이유는 간단하다. 타자의 생산성을 한 눈에 알게 하기 위해서이다. .400의 출루율이 아주 좋은 것처럼, .400의 wOBA도 아주 좋은 것이다. .335 정도의 출루율이 리그 보통인 것처럼, .335 정도의 wOBA도 리그 보통이라고 생각하면 되는 것이다. 편리하지 않은가??

어쨌거나... 각 이벤트에 발생 횟수에 각각의 value를 곱하고, 여기에 다시 1.15를 곱하여 모두 더한다. 이를 PA(타석)로 나눠주면 그 타자가 한 번 타석에 들어설 때 팀의 득점 기대값(Run Expectancy) 상승에 얼마나 기여하는지를 알 수 있게 되는 것이다. 이것이 바로 wOBA이다. 식으로 나타내면 아래와 같다.

wOBA = (0.72*NIBB + 0.75*HBP + 0.90*1B + 0.92*RBOE + 1.24*2B + 1.56*3B + 1.95*HR) / PA

여기서 NIBB는 고의사구를 제외한 볼넷을 의미하며, RBOE는 Reached Base on Error, 즉 에러로 인해 타자가 출루에 성공하는 것을 의미한다. 타자의 능력과는 전혀 상관이 없는 폭투와 같은 이벤트는 아예 제외되어 있음에 유의하자.  (** 이 식은 이 글을 쓴 뒤에 약간 수정을 하게 되었다. 글 맨 마지막 부분 참고.)


이제 다음 단계는 그 타자가 실제로 메이저리그 평균보다 얼마나 뛰어난지를 점수로 계량하는 것이다. wRAA는 weighted Runs Above Average의 약자로, 단어 그대로의 의미를 지닌다. 즉 평균 타자에 비해 얼마나 득점에 기여하느냐를 점수(Runs)로 나타내는 것이다.

일단 리그 평균 wOBA를 구한다. 위의 모든 변수(홈런 등)에 리그 평균 값을 대입하면 된다. 그 다음, 해당 타자의 wOBA에서 리그 평균 wOBA를 빼 준다. 그리고 1.15로 나눠준다. (아까 OBP와 유사한 scale을 얻기 위해 1.15를 인위적으로 곱했으므로, 다시 나눠줘야 한다.) 마지막으로 해당 타자의 PA(타석)를 곱해주면, 그 타자가 해당 시즌에서 메이저리그 평균 타자에 비해 팀 득점에 기여한 정도가 점수로 나타나게 된다. 이를 식으로 나타내면...

wRAA = ((wOBA - lgwOBA) / 1.15) * PA

예를 들어서... Ryan Ludwick이 작년에 타석에서 어느 정도로 훌륭한 활약을 했었는지 계산을 해 보자.

2008년 NL의 리그 평균 wOBA는 대략 .331이었다. 한편, 2008년 Ryan Ludwick의 wOBA는 .406이었으며, 그는 617번 타석에 들어섰다. 이제 그의 wRAA를 계산해 보면...

wRAA = ((0.406 - 0.331) / 1.15) * 617 = 40.24

즉 Ryan Ludwick은 평균적인 NL 타자들에 비해 2008 시즌 팀 득점에 타격을 통해 40.24점 정도 더 많이 기여했다는 뜻이 된다. (참고 : Fangraphs에서는 그의 wRAA가 39.5로 나타나고 있다. 아마도 리그 평균 wOBA를 구하는 과정에서의 오차로 인한 차이가 아닐까 생각된다.)


다른 스탯에 비해 wOBA가 가지는 매력은 분명하다. 우선 실제 메이저리그에서 발생했던 사건들의 기대값을 구하여 계산한 결과이므로... 계산한 이론치와 실제 발생하는 득점 사이의 상관 관계가 우수하게 나타난다. 그리고 OPS만큼은 아니더라도, 다른 세이버 스탯들에 비하면 계산이 무척 쉬운 편이다. 마지막으로, wRAA로의 환산이 아주 편리하여, 해당 플레이어가 타석에서 점수로 몇 점 만큼 팀에 기여해 주었는지를 아주 쉽고 빠르게 계산할 수가 있다. 이것은 특히 여러 플레이어를 비교할 때에 그 진가를 발휘한다.

다만 약간 아쉬운 부분이라면, wOBA는 타석에서 타자에게 벌어지는 이벤트만을 반영하므로, 도루와 같은 주루플레이가 제외되어 있다. 이 부분은 앞으로 보완이 필요하다고 본다.



나름 쉽게 설명해 보려고 애써 보았는데 잘 된 것인지 모르겠다. 다음 번 세이버메트릭스 포스팅에서는 Replacement Level과 Positional Adjustment에 대해 다루고자 한다. 거기까지 다루고 나면 타자들의 WAR에 대해서도 설명이 가능할 것 같다.



** 추가 수정 사항

이 글을 쓴 이후, WAR를 계산하기 위해 직접 wOBA를 산출하던 중, 여러 타자들의 wOBA를 계산한 결과 모두 Fangraphs나 Stat Corner 등의 사이트에 비해 계산 결과가 다소 낮게 나오는 문제점을 발견하였다. 원인이 무엇일까 고민하던 중... wOBA를 창안한 Tom Tango의 글에서 다음과 같은 부분을 발견했다.

Note: Depending on the specific analysis, the PA term (plate appearances) may exclude bunts, IBB, and a few of the more obscure plays.

빙고!
wOBA 계산시 분모에서도 IBB(고의사구)를 제외하면 되는 것이다. 논리적으로 생각해도 분자에서 NIBB, 즉 고의가 아닌 보통 볼넷만을 계산 대상으로 하였으므로, 분모에서도 NIBB만을 계산에 넣는 것이 타당하다고 본다. 따라서, 수정된 식은 아래와 같다.

wOBA = (0.72*NIBB + 0.75*HBP + 0.90*1B + 0.92*RBOE + 1.24*2B + 1.56*3B + 1.95*HR) / (PA - IBB)

이렇게 계산하면 Fangraphs 사이트에 올라와 있는 결과들과 상당히 유사한 값을 얻을 수 있다. 물론 위의 인용문에서도 알 수 있듯이 각자의 논리에 따라 계산식이 조금씩 달라지므로, 소수점 세째 자리에서 나타나는 약간의 오차는 어쩔 수 없는 것일지도 모른다. Fangraphs나 Stat Corner 모두, 자신들이 어떤 특정 스탯을 더하고 뺐는지 상세히 밝히지 않고 있다. Tom Tango의 오리지널 계산식과는 값이 다르게 나오는 것으로 보아 뭔가 변화를 줬음은 확실한데 말이다...
Posted by FreeRedbird

댓글을 달아 주세요

  1. camomile 2009.10.27 14:53 Address Modify/Delete Reply

    흥미로운 스탯이군요. 그런데 RBOE가 나와있는 사이트는 어디인가요?

    • BlogIcon FreeRedbird 2009.10.27 16:17 신고 Address Modify/Delete

      2008년까지의 데이터는 Retrosheet에서 찾아보실 수 있습니다.

      http://www.retrosheet.org/boxesetc/P/Ppujoa001.htm

      이것은 Pujols의 스탯인데요. ROE 라고 적혀 있는 것이 바로 RBOE 입니다.

      Retrosheet의 선수별 데이터는 실시간 업데이트가 안되고 연간 단위로만 업데이트된다는 문제가 있는데요.. 실시간으로 RBOE를 표시해 주는 사이트는 저도 찾지 못했습니다.

    • BlogIcon FreeRedbird 2009.11.21 19:30 신고 Address Modify/Delete

      좀 더 뒤져보니 Baseball-Reference에서 RBOE를 발견할 수 있었습니다.

      http://www.baseball-reference.com/players/b/beltrad01-bat.shtml

      위 링크는 Beltre의 스탯인데요... 쭉 내려가시면 "Baserunning & Misc."라는 항목에서 "ROE"를 발견할 수 있습니다.

  2. camomile 2009.11.21 15:08 Address Modify/Delete Reply

    wRAA라는 스탯에 대해서 살펴보다가 느낀건데요. 시대적 조정이 전혀 되어있지 않은데다 포지션별 조정도 안되어있는 스탯이더라구요. 물론 WAR을 구할 때 포지션조정을 한다지만 VORP나 RARP처럼 애초에 타격스탯 산출부터 포지션을 고려해서 산출하는 것이 더 맞지 않나 싶네요. 이에 대해서 어떻게 생각하시는지 궁금합니다.

    • BlogIcon FreeRedbird 2009.11.21 19:37 신고 Address Modify/Delete

      wOBA나 wRAA는 순수하게 공격력만을 보기 위한 스탯이므로 선수의 포지션과는 그다지 상관이 없습니다. wRAA가 +15라는 것은 해당 포지션의 평균 타자의 공격력 수준보다 15점 높은 것이 아니라 "메이저리그 전체 평균 타자"보다 15점 높은 것이죠. 스탯의 원래 개념상 포지션 조정은 안하는 쪽이 맞다고 생각합니다. WAR계산시 수비력을 합치게 되므로, 이 단계에 가서 포지션 조정을 해 주는 것이 더 합리적이지요.

      wRAA는 시대 조정도 안 하는 쪽이 맞습니다. 왜냐하면... wRAA가 해당 시즌의 리그 평균을 기준으로 하기 때문입니다. 리그 평균은 매 해마다 달라지므로... 일정하게 표시할 수 없는 것이죠. 다른 연도를 비교하시려면 아쉬운대로 wOBA+를 이용하실 수 있겠습니다. Stat Corner(statcorner.com)에서 wOBA+를 제공합니다.

  3. camomile 2009.11.22 00:48 Address Modify/Delete Reply

    근데 매년 포지션의 리그 평균이나 Replacement Level이 변하는데 Fangraph의 방식처럼 wRAA에 UZR을 더해서 일률적으로 포지션에 대해 점수를 더하거나 빼는 것 보다는 BP의 WARP처럼 타격,수비스탯 산출시 각해의 Replacement Level과 비교해서 산출한다음 더하는 것이 보다 합리적인 것 아닌가요? 그리고 어차피 선수의 가치는 포지션대비 성적으로 봐야하는데, wRAA나 wOBA가 얼마만큼 의미가 있는지가 관건이네요. 또한 단순 타격능력만 본다고 하더라도 과연 주루능력이 전혀 반영되지 않는 wOBA, wRAA이 EqA, EqR보다 선수의 능력을 잘 보여줄 수 있을지도 의문이구요. EqA,EqR은 시대별조정된 스탯조차 쉽게 찾아볼 수 있죠.

    • BlogIcon FreeRedbird 2009.11.22 22:48 신고 Address Modify/Delete

      이거 굉장히 많은 내용의 질문이신데요... ^^ 이 내용은 원래 별도의 긴 포스팅을 염두에 두고 있었는데.. 답변으로 먼저 쓰게 되네요. 밑천 다 드러나겠습니다. ㅎㅎ 아마도 무척 긴 답글이 될 것 같습니다.

      우선... wRAA의 Average는 매년 변하는 해당 시즌의 평균에 대한 상대적인 값입니다. UZR의 기준값(리그 평균수비는 UZR=0 입니다.)도 매년 변한다고 봐야겠죠. 작년의 0과 올해의 0은 동일하지 않은 것입니다. BP에서 매년 변하는 Replacement Level을 기준으로 한 상대적인 값을 산출하고 있다고 하면, 방법론적으로는 별 차이가 없다고 봅니다. 저는 BP가 특별히 더 합리적이라고 생각되지는 않네요.

      다음, wRAA나 wOBA는 선수의 가치를 측정하는 스탯이 아닙니다. 공격력을 측정하는 스탯이죠. 포지션과 상관이 없습니다. 포지션을 고려한 종합적인 가치를 비교하시려면 wRAA가 아니라 WAR를 이용하셔야 합니다. BP로 따지면 EqA 단독으로 선수의 가치를 측정할 수 없으며, WARP를 이용해야 하는 것과 마찬가지입니다. WAR계산시 중복 계산을 피하기 위해 조정은 한 곳에서만 해 주는 것이 맞고요, 그 한 곳으로 가장 적절한 곳은 역시 수비 스탯을 더해줄 때라고 봅니다. 포지션이 다르다고 타석에서 다른 규칙을 적용받지는 않으니까요... 하지만 수비는 분명히 포지션에 따라 다르죠. wRAA의 의미와 선수의 포지션대비 가치는 그다지 상관이 없습니다.

      wOBA는 주루능력을 반영하지 않습니다. 애초에 컨셉이 다르기 때문이죠. EqA는 BP에서 공격력의 올인원 스탯을 만들기 위해 발명한 스탯입니다. 이거 하나로 타자의 타격과 주루를 한 번에 평가하고자 시도한 거죠. 반면 wOBA는 계산식에서 알 수 있듯이 타자가 타석에 들어섰을 때 벌어지는 이벤트에 대해서만 계산을 하는 것입니다. wOBA는 단순히 타격 능력을 보여줄 뿐입니다. 님께서 EqA를 선호하신다면 EqA를 쓰시면 됩니다. 저는 타격은 wOBA 및 wRAA를 쓰고 주루는 BP의 EqBRR을 참고하는 쪽을 더 선호합니다. 분리해서 보는 쪽이 더 정확히 볼 수 있다고 생각하기도 하고... 스탯으로서 wOBA의 접근 방식이 EqA에 비해 훨씬 sound하다고 보기 때문입니다. 이런 것은 관점의 차이라고 생각합니다. 세이버메트릭스에 단 하나의 정답은 없다고 봅니다.

      wOBA와 EqA의 대결을 다룬 연구는 여러 차례 시도되었고... 여기에서 wOBA가 진 적은 없었던 걸로 기억합니다. 아래의 최근 연구를 확인하세요. 둘 다 correlation이 0.97로 매우 우수한 스탯입니다만... 현대 야구에 대해서는 근소한 차이로 wOBA가 이기고 있습니다.

      http://www.hardballtimes.com/main/content/blog_article/is-eqa-better-than-woba

      제가 EqA를 좋아하지 않는 이유는 EqA의 계산이 지나치게 복잡하다는 점 이외에도... EqA 자체가 결함을 안고 있기 때문입니다. 약간 technical한 이야기가 되겠는데요... EqA는 개념적으로 Average 즉 타율과 비슷한 Scale을 갖도록 숫자를 맞춘 것입니다만, 투수와 같이 타격능력이 형편없는 경우 마이너스 값을 가지게 됩니다. 마이너스 타율은 있을 수 없는 일이지만, 그와 같은 Scale을 갖는다는 EqA에서는 마이너스가 나옵니다. 즉 너무 낮은 쪽으로 내려가게 되면 EqA의 계산식은 무너집니다. wOBA에서는 이런 일이 일어나지 않습니다. 또한, EqA가 타율과 비슷한 Scale을 갖기 위해서 온갖 보정과 추가계산을 하는 과정에서, 스탯으로서 갖는 자체적인 Scale이 붕괴합니다. .400 EqA는 .200 EqA에 비해 동일한 아웃 수 대비 득점 기여 수준이 2배가 되지 않습니다.
      이 논의에 대해서는 아래 링크를 참고하세요.
      http://www.insidethebook.com/ee/index.php/site/comments/why_is_eqa_so_complicated/

      저는 EqA가 갖는 "올인원 스탯"으로서의 매력을 인정합니다. 게다가 실제 득점과의 상관관계도 매우 우수하게 나옵니다. (correlation 값이 0.97이면 거의 더 바랄 게 없는 수준이죠) 다만 이렇게 복잡한 변형 과정을 거쳐서 결국은 Scale Distortion으로 귀결되는 것이 맘에 들지 않을 뿐입니다. 훨씬 간단하여 누구나 계산할 수 있으면서도 정확도 면에서 전혀 뒤떨어지지 않는 wOBA라는 좋은 대안이 있으니까요. wOBA가 주루를 고려하지 않는데도 이미 EqA와 동일한 수준의 correlation을 갖는다면... wOBA에 EqBRR을 참고하여 주루 부분을 보완하는 정도로도 EqA보다 충분히 더 정확한 결과를 얻을 수 있을 것입니다.

      마지막으로... WARP는 BP의 여러 스탯 중에서도 결함이 좀 많은 스탯입니다. 하나하나를 댓글에 쓰기는 너무 긴데요... 일단 같은 BP의 스탯임에도 불구하고... VORP와 WARP의 Replacement Level은 서로 다릅니다. WARP의 Replacement Level이 너무 낮게 설정되어 있는 것이죠. Keith Woolner나 Tom Tango 등 다른 사람들이 계산하는 Replacement Level 선수들로 이루어진 팀은 대략 .300이나 그 이상의 승률을 가집니다. (162게임에서 49승 정도) 하지만, Clay Davenport가 WARP를 계산할 때 사용하는 Replacement Level 선수들로 구성된 팀의 예상 승률은 .150 정도입니다. 대략 162게임 시즌에서 24승 정도밖에 못하는 쓰레기 팀이죠. Davenport가 설정하는 Replacement Level 선수는 솔직히 메이저리그는 커녕 웬만한 AAA 선수만도 못한 선수로, 메이저리그의 25번째 로스터 자리를 차지할 가능성이 0%에 가까운 커리어 마이너리거 입니다. 이런 선수를 Replacement Level로 잡아서 계산하면 계산이 맞을 수가 없습니다. 또한 투수의 경우 Pythagorean Expectation의 승수를 2로 잡아서 계산하여 계산이 안맞는 문제가 있고요... WARP 계산시 수비력의 척도로 사용되는 FRAR 혹은 FRAA는 PbP데이터가 아니라 PutOut, Error, 병살 등을 가지고 계산하는 관계로... 여러 세이버메트릭스 커뮤니티들에서 믿을 수 없는 스탯으로 이미 공인되어 있습니다. (다시 말하면 FRAR은 그냥 좀 더 잘 계산한 Range Factor라는 이야기 입니다.) 즉.. WARP는 BP가 군데군데 가지고 있는 이런저런 문제점을 한 곳에다 합쳐놓은... 신뢰도가 상당히 의심스러운 스탯이라고 볼 수 있습니다. EqA의 경우는 "공격 올인원 스탯"이라는 확실한 장점이 있습니다만, WARP의 경우는 결함투성이여서 도무지 좋은 점이 무엇인지 모르겠습니다.

  4. camomile 2009.11.23 14:04 Address Modify/Delete Reply

    허접한 질문에 장문의 답글 정말 감사드립니다.^^

    우선 wRAA는 변화하는 리그평균값에 대한 상대적 값이 맞습니다. 하지만, 제가 문제삼는 것은 전체 리그평균이 아니라 포지션 리그평균 혹은 Replacement Level이 매년 변화한다는 것입니다. 전체 리그평균이 불변이라도, 포지션 리그평균은 매년 바뀔수 있지 않습니까? 즉, 작년과 올해의 리그평균 wOBA가 .320으로 동일하다하더라도, 작년 포수 리그평균wOBA가 .290이고 올해 포수 리그평균wOBA가 .320이라면, 작년에 wOBA .380을 친 포수와 올해 wOBA .380을 친 선수의 공격력을 과연 동일하게 볼 수 있느냐는 것이죠. 결국 wOBA와 wRAA가 WAR을 산출하기 위한 공격력 스탯이라는 것을 놓고 본다면, wRAA로 공격력을 산출하고 추후에 상수를 더하거나 빼서 포지션 조정을 하는 것보다 BP처럼 RARP나 VORP로 공격력을 산출하는 것이 더 합리적이지 않나 싶어서 질문을 드린 것입니다.

    두번째로 의문이 드는 것은 과연 WARP와 VORP의 Replacement Level이 얼마나 차이가 나는가입니다. 올해 시대별조정을 거치지 않은 Albert Pujols의 VORP는 98.3, WARP의 산정에 기초가 되는 RARP는 93.2입니다. Joe Mauer의 VORP는 91.0이고 RARP는 77.7이군요. RARP의 Replacement Level이 VORP의 Replacement Level보다 낮다면, 두명의 RARP가 VORP보다 높게 나와야 하는데, 오히려 낮게 나오고 있죠. 지금은 BP의 Replacement Level이 약간 바뀐게 아닐까요?(저도 잘은 모르겠군요^^ 포지션별 리그평균 EqR을 구해서 RARP를 직접 도출하자니 엄두가 안나서ㅎㅎ 타자의 VORP는 정확한 산출방법을 잘 모르겠구요)

    세번째, Fielding Runs같은 경우 물론 결함이 엄청난 수비 스탯입니다만, 적어도 저희가 직접 구할 수 있는 스탯이라는데서 의미를 찾고 싶습니다. UZR이나 RZR같은 스탯이 물론 더 좋겠지만, 2002년 이전의 자료를 볼 수 없으며 포수의 수비에 대한 자료 역시 찾을 수 없고, 단순히 숫자 집어넣어서 나오는 스탯이 아닌데다가 시대별 조정도 안되어있다는 점에서 역시 한계가 있다고 생각합니다. 물론, 저역시도 UZR이나 RZR이 더 우월한 필딩 스탯이라는 점을 인정하며, 사실상 선수의 종합적 가치를 평가할 때 자료만 모두 구할 수 있다면 조정된RARP+조정된UZR(이제 시대조정뿐만 아니라 포지션난이도 조정도 해야겠지요)이 더 타당하다고 봅니다. 시대가 다른 선수들의 비교시, UZR과 wRAA로는 한계가 있죠. 작년 푸홀스가 WAR 8.9이고, 올해 푸홀스가 WAR 8.4라고 해도, 올해 푸홀스가 작년 푸홀스에 비해 못하다고 할 수 없는 점, 즉, 단년도 그리고 리그가 같은 선수간 비교만 허용되는 WAR보다는 오히려 시대가 다른선수 및 리그가 다른 선수간 일관된 비교를 가능하게 해주는 WARP가 많은 한계에도 불구하고 좀 더 범용적으로 사용될 수 있지 않나 생각됩니다. 다만, MGL이 창시한 Super-Lwts가 일반에 공개된다면, 이제 WAR 및 WARP를 사용할 필요조차 없게 되겠죠.

    댓글이 길어져서 일단 이정도로 댓글을 마치고, EqA와 wOBA 두 스탯 중 어떤 것이 더 좋은 스탯인지에 대해선 다음에 다시 토론 부탁드리고 싶네요. 아 그리고 저도 카디널스 팬입니다. ㅎㅎ 세이버매트릭스에 대해 궁금한 것도 많고 이야기할 것도 많은데 Freebird님 블로그때문에 많은 것을 알아가게되어 감사하다는 말도 덧붙이고싶네요.

    • BlogIcon FreeRedbird 2009.11.23 23:31 신고 Address Modify/Delete

      Replacement Level이 매년 변하는 것은 분명합니다. 어쩌면 작년의 8.9 WAR보다 올해의 8.4 WAR가 절대적으로는 높은 수준의 퍼포먼스일 수도 있습니다. (실제로 그런 일은 없겠지만) 1년 사이에 리그의 수준이 크게 높아져서 Replacement Level이 5 Runs 정도 올라갔다면 말입니다.

      이런 관점에서 보면 camomile님께서 말씀하시는 것처럼, 혹은 BP가 WARP2나 WARP3에서 하는 것처럼 긴 기간을 모집단으로 하여 리그의 수준을 반영한 조정 내지는 표준화가 일리 있습니다. 다만, 이렇게 조정함으로써 오히려 잃어버리게 되는 것은... 해당 선수가 해당 시즌에서 기록한 결과물이 갖는 시공간적인 context 입니다. 2009 시즌의 WAR 8.4는 2009 시즌이라는 고유의 context 안에서 8.4라는 고유의 값을 갖는 거죠. 이것은 이것대로 의미가 있습니다. context(혹은 Tom Tango의 표현대로 그 시즌 고유의 Run Scoring Environment라고 해도 좋겠습니다)를 잃어버리고 표준화되는 것은 그 나름대로 아쉬움이 있다고 생각합니다. 즉 2009년에 그 선수가 Replacement Level보다 8.4승만큼 더 기여했다는 것은 그것 그대로 객관적인 사실인데... 표준화로 8.4가 변하게 되면 이러한 맥락을 잃어버리게 되는 거죠.

      결국 자료를 활용하는 목적에 따라 갈리게 될 것 같습니다. 예를들어 Stan Musial의 어떤 시즌과 Albert Pujols의 어떤 시즌을 비교하여 어느 쪽이 더 대단한지 보고 싶다면... 절대적인 척도로 환산하여 비교하는 것은 그 나름의 장점과 의미가 있을 것입니다. 하지만, 조정을 하지 않고 Replacement Level을 그대로 둔다면, 각각의 플레이어가 비교 대상이 되는 그 특정한 시즌에 바로 그 해의 Replacement Level에 비해 어느 정도 우수한 퍼포먼스를 냈는지... 그 context 안에서 비교 되는 것이죠. 1960년대의 Replacement Level과 2000년대의 Replacement Level이 완전히 똑같지는 않을 것입니다. 하지만, 각자 속한 시대 안에서 상대적으로 어느 정도였는가 하는 것 또한 그 나름의 충분한 의미가 있을 것 같습니다.

      WARP의 Replacement Level은 Clay Davenport 자신이 BP의 Glossary 페이지에 "162게임에서 20-25승 하는 수준"이라고 적어 놓았습니다.
      http://www.baseballprospectus.com/glossary/index.php?mode=viewstat&stat=193

      이런 낮은 Replacement Level 설정으로 인해 Tom Tango와 Dave Cameron 등으로부터 뭇매를 맞아 왔죠. 아마도 2009년이 되어서야 Clay Davenport가 자신의 Replacement Level이 잘못되었음을 시인하고 Replacement Level 및 WARP를 수정한 것 같습니다. 아래 링크를 보시죠.
      http://www.insidethebook.com/ee/index.php/site/comments/the_new_warp/

      그리고 수비 스탯에 대해서는... 2002년 이전의 자료가 필요한 경우 저는 Sean Smith의 TotalZone을 이용합니다. 이것은 PbP데이터를 이용하는 스탯이므로, FRAR보다는 훨씬 낫다고 생각합니다.

      계속 답을 달다 보니 마치 BP의 안티가 된 것 같은 느낌인데요... BP에 대해 특별히 나쁜 감정은 없습니다. 저는 단지 제가 생각하기에 가장 신뢰할 만하고 사용이 용이한 스탯들을 선택해서 쓸 뿐입니다. 예를들어 주루 스탯 같은 경우는 여전히 BP의 EqBRR을 참고하고 있고요... 그리고 BP에는 스탯 말고도 볼 거리가 많죠. Kevin Goldstein 같은 뛰어난 필진을 보유하고 있기도 하고요.

      자주 놀러오셔서 많은 말씀 나누셨으면 합니다. ^^

  5. camomile 2009.11.24 23:49 Address Modify/Delete Reply

    아 그렇군요. 좋은 말씀 잘 들었습니다. 생각의 차이라고 볼 수 있는데, 저는 기본적으로 다른 리그 혹은 다른 연도간 일률적인 비교가 힘든 스탯은 1시즌만을 볼 때는 모르겠지만 그 이상에서는 아무런 쓸모가 없다고 보는지라 Fangraph가 제공하는 wOBA,wRAA 및 WAR은 기본적으로 한계가 있다고 생각했습니다. 저는 그래서 홈런,볼넷 등 누적스탯자체도 별로 중요치 않게 생각하거든요. 리그 수준에 따라 홈런 5~10개는 충분히 차이난다고 보기 때문이죠. 이를테면 작년 홈런이 30이었던 선수가 올해 홈런이 36이 되었다 하더라도 리그 홈런 자료가 제공되지 않는한 올해 그 선수의 파워가 작년에 비해 상승했다고 판단할 수 없으니까요. 담에 혹시 괜찮으시다면 EqA vs wOBA, 그리고 Fangraph의 Pitching WAR에 대해서 이야기 나눠보고 싶네요.

    • BlogIcon FreeRedbird 2009.11.25 10:43 신고 Address Modify/Delete

      네.. 언제든지 괜찮습니다. EqA vs wOBA 같은 경우는 여기에 계속 댓글 남기셔도 좋고요... 앞으로 다른 곳을 이용하셔도 괜찮습니다. 어차피 제가 타자의 스탯을 이야기할 때 wOBA를 메인으로 이용하는 한 계속 등장하게 될 테니까요. Fangraphs에서 투수의 WAR를 계산하는 법에 대해서는... 조만간 포스팅을 계획 중입니다.

      지금 포스팅을 생각하고 있는 것들이... MVP 및 사이영상에 대한 것, AFL 정리, Dave Duncan에 대한 생각, Rule 5 Draft, Non-Tender FA, Moneyball 그후 6년, 희생번트의 유용성 검토 part 2 등이 있고요... (적어놓고 보니 써야 할 것들이 엄청 밀려 있군요 ㅎㅎ) 이 사이의 적당한 시점에서 투수 WAR를 다루려고 합니다. 지금 예상으로는 아마 Dave Duncan 글 전후가 될 것 같은데... 거기에서 다시 말씀 나누시죠. ^^

  6. 홈런강탈 2010.02.06 23:43 Address Modify/Delete Reply

    WOBA는 출루율 스케일인데 처음에 공식 개념잡기는 출루율 만큼이나 가벼운듯. 삼진이나 진루에대한 아웃을 세분화시키면 가감을 통해서 해보는 것도 괜찮을 것 같구요.
    국내선수들에게 적용할때 회기분석공식들과 비교해서 차이는 비슷할것 같기는 한데 WAR에서 포지션 적용은 또 어떨지 모르겠고...^^

    • BlogIcon FreeRedbird 2010.02.08 09:20 신고 Address Modify/Delete

      실제로는 홈런이나 각 이벤트에 대한 가중치가 매년 조금씩 변합니다. 1.15라는 숫자 역시 OBP와 유사한 스케일이 될 수 있도록 약간씩 변하고요... 물론 큰 차이가 없으므로 일반적으로 위의 숫자를 그냥 사용하셔도 괜찮습니다.

      가중치의 변화에 대해서는 연구중입니다. "어떻게"는 알 것 같은데 아직 "왜"를 모르겠네요. 이해가 다 되면 따로 포스팅하도록 하겠습니다. ㅎㅎ

    • 홈런강탈 2010.02.08 21:38 Address Modify/Delete

      글쿤요. 답글도 글도 감사합니다. 포스팅기대되요 ㅋ

  7. 오뎅 2010.10.19 00:55 Address Modify/Delete Reply

    WAR 시대별로 평가하기 힘든가요.
    일반적인 팬으로

    04년 AL경우 이치로 7.2승으로 WAR 야수 1위입니다.
    그런데 홈런왕 매니 .308.397.613 WRC+ 154 기록하고 4.1 승 기록 했습니다.
    MVP 게레로 337.391.598 WRC+ 159 6.2 승
    두선수 모두 타격에서 뛰어난 점수를 획득 했지만
    수비에서 역전이 되죠.
    계산으로 알겠는데 일반적인 야구팬들은 납득이 되지 않습니다.
    포지션점수도 동일수준의 선수들이 수비력 때문에 그정도 타격에서 역전된다는 것이 이해하기 힘들죠.
    왜 그런가는 알고있지만 신뢰하지 못하는 이유라고 해야할까
    수비에대한 가중치가 지금까지 팬들의 생각보다 너무커서 괴리감이 있다고 해야할까
    WAR 직접으로 시대 다른 가령 04 이치로가 06 모어노 06 하워드 07 롤린스 08 페드로이야
    등보다 뛰어나다고 해서 뛰어난 시즌이라고 이야기 할수 없다면...
    음 어려워서요.
    타격에 대한 이야기인데 WAR 궁금한점을 질문을...

    • BlogIcon FreeRedbird 2010.10.20 18:31 신고 Address Modify/Delete

      먼저, WAR는 replacement level에 비해 얼마나 활약을 했는지를 나타내는 스탯이므로, 엄밀히 말해 04년의 8 WAR와 06년의 8 WAR가 완전히 똑같다고 할 수는 없습니다. 다만, 2년 사이에 replacement level이 그다지 많이 변했을 리도 없으므로, 오차는 얼마 되지 않을 듯 합니다.

      질문하신 부분과 관련하여, 예를 들어 보지요. 타자가 2루타 하나를 치면 위의 글에서 0.776점의 가치가 있다고 되어 있습니다. 아웃 당하면 -0.299이니까 실제로 2루타의 평균적 가치는 아웃 대비 1.075점의 가치가 있는 셈입니다.

      그런데, 만약 같은 타구인데도 Manny는 잡지 못해서 2루타가 되고, 수비가 좋은 Crawford는 그걸 잡아서 아웃으로 만들었다면, 역시 1.075점의 차이가 생기는 셈이죠. 우리 팀의 득점에 기여하는 것과, 상대 팀의 득점을 막는 것은, 똑같이 가치가 있는 일입니다. (사실 피타고리언 승률 공식으로 보면, 득점을 높이는 것보다는 오히려 실점을 줄이는 쪽이 아주 약간 더 유리하게 나옵니다.)

      문제는 수비 스탯을 얼마나 믿을 수 있느냐가 관건인데.. 공격이나 투수 스탯보다는 오차가 크다는 것이 정설입니다. UZR의 경우 3년 수치를 보는 것이 일반적이이죠. 약간의 오차가 있는 것은 어쩔 수 없다고 생각되고요. 단지 지금으로서는 이정도가 최선이다... 라는 정도입니다. 세이버메트릭스는 단 하나의 정답을 도출하지는 않습니다. 현재의 기술적 수준에서 논리적으로 가장 정답에 가깝다고 생각되는 결과물을 내주는 것이죠. Fangraphs의 WAR는 그것대로 결점을 가지고 있습니다만, 그래도 현재 발표된 메트릭 중에서는 가장 합리적이라고 생각되기에 이렇게 소개를 드리는 것입니다. 이제는 스탯티즈의 스탯도 과거의 BP쪽 스탯(EqA 등)에서 WAR 등의 Linear Weights 중심으로 바뀌어 있지요.

      사족으로... 외야수의 어깨는 과대평가되는 경향이 있고요.. 레인지가 가장 중요합니다. 일단 공을 잡아야 던지든 말든 하는 것이니까요.

  8. 오뎅 2010.10.20 19:23 Address Modify/Delete Reply

    외야수중 이치로 126점 특히 앤보살이 278점 ㅎㄷㄷ
    앤보살은 타격의 공헌을 넘는것 같네요.
    수비스탯은 그렇다고 치더라고 안타 하나 막는것이 생각해보니 엄청나군요.
    외야수 홈런스틸 계산해보니 기본적으로 1.397 아웃 0.299 ...

  9. 모노 2012.07.20 22:31 Address Modify/Delete Reply

    (질문) 숫자에 약해서 헷갈리네요;; wOBA에 사용되는 각각의 가중치를 wOBA상수(1.15?)로 나누면 그것이 득점기대값이 아닌가요??? 처음 단순히 생각해 여기에 타석수를 곱하면 wRC가 될 줄 알았는데 아니더군요.

    • BlogIcon FreeRedbird 2012.07.22 00:47 신고 Address Modify/Delete

      그렇지 않습니다. 1.15로 나눈 다음 아웃의 run value를 차감해 주어야 해당 이벤트의 run value를 얻을 수 있습니다. 홈런의 경우 공식에서 계수가 1.95 인데, 이를 1.15로 나눈 다음 다시 아웃의 run value인 0.299를 빼 주면 홈런의 원래 run value인 1.397을 얻게 되는 것이죠.

  10. gooodchoy 2017.04.09 12:55 Address Modify/Delete Reply

    좋은정보 고맙습니다.

  11. 질문자1 2018.10.11 01:07 Address Modify/Delete Reply

    6번 항목에 0.815 + 만루홈런의 Run Value = 4.117 라고 되어 있습니다. 그런데 0.815에 만루홈런의 가치가 어느 정도 포함되어 있지 않나요? 질문과는 별개로 블로그 글이 굉장히 흥미롭네요. 시험기간임에 불구하고 계속 보게 됩니다.

  12. 으라차 2019.05.21 23:47 Address Modify/Delete Reply

    팬그래프에서 나온 woba와 오차가 생기는 이유는 woba스케일이1.15고정이 아니라 매년 변화하기 때문인거 같아요
    물론 볼넷 사구 단타 등등의 가중치도 매년 변화하고요

  13. Raccoon 2019.05.29 13:44 Address Modify/Delete Reply

    좋은 정보 감사합니다

희생번트, 혹은 보내기번트는 야구에서 가장 흔히 볼 수 있는 작전 중 하나이다. 특히 우리나라 야구는 희생번트의 빈도가 높은 것으로 생각된다. (실제로 통계를 내 본 적은 없으나... 우리나라 야구중계를 보다 보면 종종 드는 생각이다. 1번타자가 출루하면 2번타자는 곧바로 번트 자세를 취하는 것이 아주 일상적인 모습이지 않은가???)

무사 1루의 상황에서 희생번트가 "성공"하면 1사 2루로 바뀐다. 주자가 1루에 있을 때는 장타가 아니면 점수가 나기가 어렵지만, 2루에 있으면 단타에도 득점이 가능하므로, 왠지 득점하기가 쉬워진 것처럼 느껴진다. 과연 이렇게 되면 실제로 점수를 낼 확률이 높아지는 것일까?

Tom Tango는 1999년부터 2002년까지 메이저리그의 모든 경기를 분석하여 다음과 같은 표를 만들었다.

RE 99-02 0 1 2
Empty 0.555 0.297 0.117
1st 0.953 0.573 0.251
2nd 1.189 0.725 0.344
3rd 1.482 0.983 0.387
1st_2nd 1.573 0.971 0.466
1st_3rd 1.904 1.243 0.538
2nd_3rd 2.052 1.467 0.634
Loaded 2.417 1.65 0.815

표의 왼쪽은 주자가 어떻게 있는지이고, 위쪽은 아웃을 의미한다.
각 상황별로 해당 이닝에 득점한 점수의 평균 값을 산출한 결과이다.
예를 들어 무사 1루의 상황은 1st, 0 out이므로, 이 이닝에서의 득점 기대값(Runs Expectancy)은 0.953인 것이다. 이해가 되시는지??
이제 희생번트가 성공하여 1사 2루의 상황으로 바뀌었다고 하자. 위의 표에서 1사 2루를 보면 득점 기대값은 0.725로 떨어져 있다. 헉... 희생번트가 성공했는데 득점 기대값은 오히려 낮아진 것이다...!!!!

무사 2루에서 희생 번트를 성공시켜서 1사 3루로 바뀌면? 득점 기대값은 1.189에서 0.983으로 역시 낮아진다.
1사 1루에서 희생 번트를 성공시켜서 2사 2루로 바뀌면? 득점 기대값은 0.573에서 0.344로 더욱 크게 낮아진다.
무사 1,2루에서 희생 번트로 1사 2,3루를 만들면? 득점 기대값은 1.573에서 1.467로 역시 낮아진다.

희생 번트가 성공할 경우, 어떠한 상황에서도 득점 기대값이 낮아진다. 즉 오히려 희생번트를 성공시키면 손해인 것이다.

이에 대해 다음과 같은 반론을 제기할 수도 있다. - 희생 번트의 성공으로 아웃카운트가 늘어나서 다득점의 기회가 줄어들기 때문에 득점 기대값이 낮아지는 것은 아닐까? 혹시 점수를 낼 확률 자체는 높은데 다득점이 안될 뿐인 것 아닐까?

이 질문에 대답하기 위해, 이번엔 Tom Tango의 다른 표를 살펴보자.
이 표는 위의 표를 확장한 것으로, 실제 상황별로 발생한 득점을 0점부터 5점 이상까지 세분화한 것이다.

Base Outs Runs
0 1 2 3 4 5+
Empty 0 0.707 0.154 0.074 0.035 0.016 0.013
Empty 1 0.827 0.101 0.042 0.017 0.007 0.005
Empty 2 0.923 0.051 0.017 0.005 0.002 0.001
 
1st 0 0.563 0.176 0.132 0.067 0.034 0.028
1st 1 0.717 0.123 0.091 0.04 0.017 0.013
1st 2 0.864 0.062 0.049 0.016 0.006 0.003
 
2nd 0 0.368 0.348 0.142 0.076 0.035 0.03
2nd 1 0.594 0.23 0.098 0.045 0.018 0.014
2nd 2 0.777 0.147 0.049 0.017 0.006 0.003
 
3rd 0 0.136 0.542 0.164 0.09 0.035 0.033
3rd 1 0.338 0.478 0.106 0.045 0.018 0.014
3rd 2 0.737 0.187 0.05 0.017 0.006 0.004
 
1st_2nd 0 0.359 0.219 0.165 0.127 0.07 0.059
1st_2nd 1 0.574 0.161 0.11 0.088 0.038 0.028
1st_2nd 2 0.769 0.106 0.058 0.044 0.015 0.008
 
1st_3rd 0 0.124 0.417 0.174 0.142 0.076 0.067
1st_3rd 1 0.345 0.37 0.119 0.092 0.042 0.031
1st_3rd 2 0.715 0.151 0.061 0.049 0.016 0.008
 
2nd_3rd 0 0.144 0.249 0.307 0.147 0.079 0.074
2nd_3rd 1 0.305 0.285 0.218 0.101 0.053 0.038
2nd_3rd 2 0.724 0.054 0.141 0.049 0.021 0.011
 
Loaded 0 0.128 0.255 0.211 0.143 0.134 0.13
Loaded 1 0.33 0.252 0.151 0.106 0.093 0.068
Loaded 2 0.675 0.092 0.105 0.055 0.048 0.025
 

가장 흔히 희생번트를 시도하는 상황인 무사 1루 --> 1사 2루를 보자. 해당 이닝에서 딱 1점을 득점할 확률은 무사 1루가 0.176, 1사 2루가 0.23으로 마치 1사 2루가 더 나은 것처럼 보인다. 그럼 희생번트가 효과가 있는 것 아닌가? 답은 전혀 아니올시다 이다. 위의 표를 자세히 보면 알 수 있듯이 무사 1루는 1사 2루보다 다득점의 기회가 훨씬 많은 것이다. 1점만 내도 좋겠지만, 2점이나 3점을 내도 좋은 것은 두말할 나위가 없다. "점수를 내는 것"이 목적이므로, 0점만 아니면 좋은 것이다. 즉 1점 득점의 확률을 비교할 것이 아니라, 0점에 그칠 확률을 비교하여 무득점할 확률이 적은 쪽이 더 바람직하다고 말하는 것이 옳다. 

무사 1루에서 결국 0점에 그칠 확률은 0.563이다. 반면 1사 2루의 경우는 0.594이다. 이렇게 해서 다시 한 번 같은 결론에 도달하게 된다. 희생번트가 성공하면 득점하기가 오히려 어려워진다.


이 표의 저자인 Tom Tango는 또다른 의문을 제기한다. "희생번트"와 "희생번트 시도"는 다르다는 것이다. "희생번트"는 타자가 아웃되고 주자가 진루하는 것을 의미하지만, "희생번트 시도"는 희생번트를 시도해서 얻는 모든 결과를 포함하는 것이다. 이를테면 수비실책으로 타자와 주자가 모두 세이프 된다든지, 병살타로 모두 아웃 된다는지 등등의 모든 가능성을 포함한다. 이 경우 위의 계산 결과는 많이 달라지게 되는데... 이 내용은 그의 유명한 책인 <The Book>에 자세히 나와있다. 마침 최근에 이 책을 입수했으므로, "희생번트 시도"에 대해서는 추후에 다시 한 번 상세히 다루도록 하겠다. (하지만, 미리 말해 두자면... "희생번트가 성공할 경우 득점이 어려워진다"는 결론은 여기에서도 절대 바뀌지 않는다.)
Posted by FreeRedbird

댓글을 달아 주세요

  1. BlogIcon Q1 2009.08.05 14:54 신고 Address Modify/Delete Reply

    희생번트 떡밥... 통계상으론 그렇긴 한데... 누구의 말처럼 야구가 통계 갖고 주사위 던지는 게임이 아니라 사람이 하는 거라 9회말(또는 연장) 동점에서 1점이면 되는데-_- 뒷타자가 RISP 3할 넘는 중심타자라면.. 번트 안 댈 감독이 얼마나 될까요...?
    저 통계가 뒷타자를 감안한 게 아니지 않습니까 라고 반론 아닌 반론 던져봅니다.

    가끔은 야구 볼 때 세이버메트릭션이 싫어지기도 해요... 사람이 하는 건데 말이죠.

    • BlogIcon FreeRedbird 2009.08.05 16:02 신고 Address Modify/Delete

      그게.. 사실은 나중에 두 번째 글에서 쓰려고 했던 부분인데요. 말씀하신 대로 위의 통계 자료는 뒷타자를 고려하지 않은 평균적인 수치이고요... 상대 수비의 상황과 뒷타자가 누구냐에 따라 결과가 좀 달라지는 것이 사실입니다. 희생번트 논란은 오래 전부터 있어왔기에 많은 연구 결과가 이미 있습니다. 하지만 더 자세히 서술하게 되면 다음에 쓰려고 했던 줄거리가 다 나오게 되어서.. 여기서는 생략하렵니다. ^^ 다만 일반적으로 희생번트가 성공하면 오히려 손해다... 라는 명제는 그대로 성립합니다.

      이 글은 원래 지난주에 Cards와 Dodgers의 4연전 마지막 게임에서, 8회 3-3동점 무사 2루 상황에서 Schumaker에게 희생번트를 지시한 La Russa 감독에 항의하고자 하는 의도로 작성하게 된 것입니다. 뒷타자들이 2-3-4번이었으니 희생번트가 당연하다고 할 수도 있습니다만, 실제 결과는 그렇지 않았습니다. 희생번트는 "성공"하여 1사 3루가 되었지만 그 이후 Ludwick 삼진, Pujols 고의사구, Holliday 고의사구로 2사 만루가 되었죠. 결국 Ankiel이 삼진을 당하면서 득점에 실패했습니다. 그리고 연장 10회에서 2점을 내줘서 5-3으로 패했죠. 보시는 바와 같이 보내기번트가 성공하고 뒤에 쟁쟁한 타자들이 나왔음에도 불구하고 상대가 고의사구와 효과적인 계투 작전으로 나와서 점수를 낼 수 없었습니다. 저는 희생번트로 아웃카운트를 하나 헌납한 것이 득점 실패의 큰 요인이라고 봤습니다.

      야구가 사람이 하는 게임이라는 것은 영원히 변하지 않는 사실이고.. 세이버메트릭스는 야구를 이해하는 조금 다른 시각일 뿐입니다. 특별히 미워하실 필요는 없다고 생각됩니다... ^^ 어느 한 쪽에만 의존하는 것은 좋지 않죠. Paul DePodesta가 Dodgers에서 실패한 것은 지나치게 세이버메트릭스에 의존했기 때문이라고 봅니다. Theo Epstein과 같이 전통적인 지식/방법과 세이버메트릭스 양 쪽에 균형적인 시각을 가지고 둘 다 활용하는 것이 가장 좋은 방법일 것입니다.

      다만... 저는 대체로 세이버메트릭스 쪽의 시각에서 포스팅을 하고 있습니다. 저는 야구선수가 아니고, 스카우트로 교육받은 적도 없으므로 전통적인 시각으로 글을 쓰게 되면 아무래도 남의 글(주로 미국 MLB 기자들의 기사와 미국 팬들의 글)을 많이 참고할 수밖에 없습니다. 반면, 세이버메트릭스는 기본 이론을 익히면 엑셀을 가지고 제 나름대로 응용할 수 있는 장점이 있습니다. 그리고 우리나라에는 공개적으로 활동하는 세이버메트리션이 거의 없으므로... 기존의 블로그들과는 조금 다른 각도에서 새로운 정보를 드리고자 하는 마음이 있습니다. 일종의 차별화 전략이라고 할까요... ^^

    • BlogIcon Q1 2009.08.06 13:53 신고 Address Modify/Delete

      넵~ 저두 사실 여기 즐겨찾기 해둔 이유도 세이버메트리션 관점의 포스팅이 "한글"로 있다는 거니깐요 ^^ 그리고 이런 글엔 반론도 하나쯤 붙어야 제맛(?) 아닌가요 ^^;;;; 다음 글도 기대하겠습니다~ ^^

      그리고 무사2루에서 1사 3루 만들었으면, 결국 1점만 내자는 거 니깐, 차라리 스퀴즈를 했어야...-_-a (어디까지나 저보고 작전 내라면 ^^;;)

      +) 사실, 1사3루에서 점수 안 내준, 삼진 잡은 투수를 (쿼홍치였나요?, 경기를 안 봐서...) 칭찬해야 하는 상황 같긴 해요.. ㅡ.ㅜ

    • BlogIcon FreeRedbird 2009.08.07 11:50 신고 Address Modify/Delete

      네. 그 삼진 잡은 투수는 쿼홍치 맞습니다. 그 타석에서 La Russa 감독은 Rasmus 대신 Ludwick을 대타로 기용했고.. 삼진아웃 되었습니다. 이후 2사 만루에서... 팀은 더이상 기용할 오른손 대타가 없었고.. 결국 Ankiel이 3구 3진되며 끝났습니다. Ludwick을 Rasmus 타석에서 대타로 쓸 것이 아니라 Ankiel 타석에서 썼어야 한다고 보는데요.. 뭐 지나간 게임에 대한 불평은 그만 하겠습니다.

      최근에 Cardinals 소식에 다소 소홀한 것 같아서... 앞으로 얼마간은 주로 Cardinals를 다룬 후에 다시 세이버메트릭스 주제로 돌아올까 합니다. 기대해 주세요. ^^

  2. BlogIcon 반바스틴 2009.08.05 16:46 Address Modify/Delete Reply

    1-2달전부터 눈팅만하다 글남깁니다.

    언제나 글잘보고있습니다. 축구를 좋아하지만 야구도 꽤 관심을 가지고있는사람이라..

  3. 2010.09.21 05:24 Address Modify/Delete Reply

    표에 의하면 무사2루나 무사1,2루에서의 희생번트는 득점확률을 높여준다고 말할 수 있겠군요.

    • BlogIcon FreeRedbird 2010.09.24 13:45 신고 Address Modify/Delete

      그것은 희생번트가 성공했을 때의 확률을 비교한 결과입니다. 희생번트를 시도하면 다양한 결과가 나타납니다. 예를 들면 병살로 주자와 타자가 모두 아웃될 수도 있죠. 정확히 비교를 하려면 "희생번트 시도"와 강공을 비교하는 것이 맞고, 그것을 위해서는 방대한 분석이 필요합니다. 결론만 말씀드리면, 말씀하신 상황에서 투수와 같이 매우 허접한 타자의 경우 번트를 대는 것이 유리하며, 일반적으로는 강공이 조금 더 좋은 결과를 얻게 됩니다.

야구는 사람이 하는 게임이다. 사람이 하다 보니 예상치 못한 다양한 현상들이 일어나곤 한다. 타율이 .180인 타자가 어느 날 갑자기 5타수 5안타를 기록할 수도 있고, 방어율이 5.50인 투수가 어느날 완봉승을 거둘 수도 있다. 이러한 예측불허의 상황이야말로 야구를 더욱 재미있게 만드는 요소라고 할 수 있다.

그러나, 이러한 랜덤한 요소들은 팀이나 플레이어의 현재 상태를 냉정하게 평가하고 앞날을 예측하는 데 장애가 된다. 예를들어 어떤 플레이어와의 재계약을 검토하는 구단이 있다면, 그의 성적이 뽀록인지 진짜 실력인지 궁금할 것이다. 또한, 7월의 트레이드 마감시한이 임박해 오면, 구단은 지금 팀 성적이 진짜 팀의 실력을 반영하고 있는 것인지, 아니면 단순히 운이 좋거나 나빠서 성적이 이렇게 나오고 있는 것인지 알아보고 싶을 것이다.

세이버메트릭스가 특히 중요한 의미를 갖는 분야 중 하나가 바로 이런 부분이다. 운빨 같은 랜덤한 요소들을 최대한 제거하고 객관적인 진짜 실력을 측정하는 데 도움을 주는 것이다. 이전에 소개한 FIP나 BABIP 같은 것들이 주로 선수 개개인에 대한 그러한 노력의 일환이라면, 오늘 소개할 Pythagorean Record은 팀 성적에 대한 냉정한 검토라고 할 수 있다.


메이저리그의 팀 순위(Season Standings)를 자세히 보면 "Expected Wins"와 같은 항목을 발견할 수 있다.
아래 화면은 ESPN에서 캡쳐한 것이다.

사용자 삽입 이미지


빨간 색 부분이 바로 Expected W-L 이다. 예를 들어 LA Angels의 경우, 실제 기록은 42승 32패인데 Expected W-L은 39승 35패이다. 이것은 무슨 의미일까? Expected W-L은 어떻게 계산되는 것일까? 지금부터 자세히 살펴보자.


피타고라스의 법칙을 기억하시는지?

a2+b2=c2

바로 이런 공식이었다.

그런데, 야구에도 이와 비슷한 형태를 가진 공식이 있다.

Exp. Win% = RS2 / (RS2+RA2)

여기서 Exp. Win%는 기대 승률, RS는 팀의 총 득점(Runs Scored), RA는 팀의 총 실점(Runs Allowed)을 의미한다. 즉, 어떤 팀의 총 득점과 총 실점을 알게 되면 그 팀의 현재 승률을 예측할 수 있는 것이다. 이 식은 Bill James에 의해 고안되었으며, 형태가 피타고라스 법칙과 유사하다고 하여 Pythagorean Record 혹은 Pythagorean Expectation이라고 부른다.

위에서 예를 들었던 LA Angels의 경우, 오늘 현재까지 74게임에서 총 득점은 376점, 총 실점은 355점이다. 이를 위의 공식에 넣으면 376^2/(376^2+355^2) = 52.9%가 나온다. 이 기대 승률을 이용하여 74게임에서의 예상되는 승수를 계산하면 74*0.529 = 39승이 되는 것이다. 74게임이므로 패는 당연히 74-39 = 35패가 된다.

이것은 어떤 의미를 가지는 것일까? 어떤 팀이 74게임에서 376득점, 355실점 했다면 이 팀은 아마도 39승 35패를 했을 것으로 예상되는데, LA Angels의 경우는 42승 32패로 현실이 기대치보다 좋게 나타나고 있다. 이는 그만큼 Angels가 운이 좋았다는 뜻으로 해석된다.


이 공식은 선풍적인 인기를 끌었고, Bill James가 제창한 수많은 세이버메트릭스 이론과 계산식들 중에서도 최대 히트작 중 하나가 되었다. 그러나 이후의 지속적인 연구에서, 이 공식이 득점과 실점의 차이가 커질 수록 오차가 생긴다는 문제점이 도출되었다. 즉, 득점을 아주 많이 한 경우의 기대 승률이 실제 기록보다 낮게 나타나는 현상이 지속적으로 발생하는 것이다. 한두 개가 그렇다면 해당 팀/해당 시즌에 운이 좋았다는 정도이겠지만 지속적으로 나타난다면 이것은 오차라고 보는 것이 맞다.

(참고로 기대 승률의 연구라는 것은 대체로 엑셀을 이용한 반복적인 노가다이다. 수십년 간의 메이저리그 실제 기록을 넣어 보고, 여러 가지 조건으로 RS와 RA값을 변화시켜 가며 회귀분석을 수행하는 것이다.)

관심은 주로 제곱하는 숫자에 집중되었다. 즉,

Win% = RSX / (RSX+RAX)

이 식에서 X값이 얼마일 때 가장 정확한 기대 승률을 도출하느냐였다. 이를 위해 무수한 회귀분석이 이루어졌다.
Bill James 자신도 X값이 2가 아니라 1.82일 때 더 정확한 결과가 나온다고 주장하였다. 한편, David Smyth라는 사람이 아래와 같이 X값을 구하는 공식을 만들어냈다.
X = ((RS+RA) / G)0.287

여기서 왜 또 0.287을 제곱하느냐를 따지는 것은 무의미하다. 위에서 이야기했듯이 무수한 회귀분석을 통해 경험적으로 도출된 식이기 때문이다. (참고로 G는 게임 수를 의미한다. (RS+RA)/G를 RPG(Runs Per Game)이라는 용어로 표현하기도 한다.)

이 밖에도 로그함수를 이용하는 등 수많은 시도가 있었으나, 여러 사람들의 지속적인 노가다 테스트 결과 위에 소개한 David Smyth의 방식이 역대 메이저리그 기록에 가장 근접하여 가장 우수한 기대 승률을 도출하는 것으로 나타났다. 물론 여전히 0.287에서 소수점 세째자리의 7에 대해서는 아직도 의견이 분분하지만... 소수점 세째자리로 인한 오차는 어지간해서는 무시해도 되는 수준이다.

그러나... David Smyth의 공식은 다소 복잡하므로... (사실 엑셀을 이용하면 쉽게 계산되지만.. 식 자체가 별로 친숙해지기 어렵게 만들어져 있으므로...) 일반적으로는 X값을 그냥 상수로 놓고 사용하는 경우가 많다. 이를테면 ESPN은 X를 2로 하여 Bill James의 원래 식과 동일하게 계산하고 있다. MLB 공식 사이트의 경우에는 Bill James가 수정한 대로 X를 1.82로 하여 계산하고 있다. 어느 쪽을 쓰더라도 차이는 별로 크지 않다. 당신이 구단 프런트가 아닌 이상 이 정도로도 충분한 것이다.

비록 경험적으로 도출된 공식이기는 하나, 미국 Williams 대학에서 수학과 통계학을 강의하는 Steven J. Miller 교수는 이 식에서 RS와 RA가 통계적으로 독립변수이고, 각 팀의 득점이 특정 형태의 분포(Weibull Distribution)를 따른다고 가정하면, 통계적으로 충분히 유의미한 공식임을 증명한 바 있다.


이 모든 식들이 너무 복잡하다고 생각한다면... 가장 간단한 방법이 있다. 득점에서 실점을 뺀 것을 Run Differential이라고 하는데, 이 Run Differential이 10점 변할 때마다 승차가 1씩 변하는 것이다. 승차가 1씩 변할 때에는 승이 1 올라가고 패가 1 줄어든다는 점에 유의하자. (단지 1승만 올라가면 순위표에서 반 게임 차 변하는 것이므로...)  다시 말해 700점 득점하고 81승 81패 하던 팀이 있다면 이 팀이 710점 득점하면 82승 80패 할 것이라는 이야기이다. 이것은 편의상 쓰는 방법이고 정확도가 다소 떨어지지만... 빠르고 쉽다는 장점이 있다.


오늘 자 순위표를 가지고 메이저리그 30개 팀의 기대 승률 및 승 수를 직접 구해 보았다. 과연 어느 팀이 지금까지 운이 좋았고, 어느 팀이 운이 나빴을까? 계산결과가 담긴 엑셀파일을 아래에 첨부하였으므로 첨부파일을 받아서 직접 확인해 보시기 바란다.



엑셀파일에는 가상의 팀으로 실험을 해본 결과도 포함되어 있다. 한 시즌의 162게임을 모두 치른 결과 750득점 750실점으로 득점과 실점이 같고, 성적도 81승 81패로 딱 5할인 팀이 있다고 하자. 이 팀이 더 좋은 성적을 내기 위해 투자를 하려고 한다. 공격력을 강화하여 득점을 더 하거나, 투수력와 수비력을 강화하여 실점을 덜 하는 방법 중 어느 쪽이 좋을까? 단, 똑같은 비용을 들였을 때 득점이 증가하는 수준과 실점이 감소하는 수준은 동일하다고 가정하자. 아래와 같이 100점씩 변화시킬 수 있다면, 어느 쪽이 유리할까???

A. 공격력 강화 --> 득점 100점 증가 --> 850득점 750실점
B. 투수/수비 강화 --> 실점 100점 감소 --> 750 득점 650 실점

답은 B이다. David Smyth의 공식을 기준으로 할 때, A의 기대 승 수는 91승이고 B의 기대 승 수는 92승이다. 점수를 더 내는 것보다 점수를 덜 내주는 쪽이 더 좋은 결과를 얻게 되는 것이다. 투수력와 수비력의 중요성을 알 수 있는 결과이다.

매니아를 위한 더 읽을 거리

Posted by FreeRedbird

댓글을 달아 주세요

  1. BlogIcon Hwan 2009.07.06 11:15 Address Modify/Delete Reply

    MLB 통계를 가지고 만들어낸 공식이니 우리나라 프로야구에서는 정확하지는 않겠지만, 오늘까지의 경기 내용으로 계산해보면 대부분 거의 비슷하거나 기대 승수가 더 높네요. 아마 무승부가 없는 MLB와 무승부가 패로 계산되는 우리나라의 차이 때문이 아닐까 싶기도 합니다. 흥미로운 것은 유독 롯데만 기대 승수보다 3승 정도 더 한 것으로 계산이 나오는군요. ^^

    좋은 글 잘 읽었습니다.

    • BlogIcon FreeRedbird 2009.07.08 22:27 신고 Address Modify/Delete

      아... 프로야구로 계산을 해 보셨군요. 말씀하신 바와 같이 우리나라 야구에는 무승부가 있어서 메이저리그와는 조금 다른 결과가 나올 것 같습니다. 프로야구 역사도 그럭저럭 30년을 바라보고 있어서 통계적으로 다른 공식을 도출할 수도 있을 것 같지만... 무승부 규칙 자체가 여러 번 바뀌었기 때문에 분석이 어려울 듯 합니다.

      아마 롯데가 다른 팀보다는 조금 운이 좋았던 모양이네요. ^^ 댓글 감사합니다.

  2. BlogIcon 호시 2010.06.25 01:42 Address Modify/Delete Reply

    너무 재밌게 잘 읽었습니다. 다른 세이버메트릭션에 관한 글들도 시간 날 때 조금씩 읽어야 겠네요. 알면 알수록 재미있는거 같습니다.

    이 포스팅에서 공부한 것을 바탕으로 국내프로야구 기대승률에 대한 포스팅을 썻습니다 아직 많이 부족하다 보니 FreeRedbird님의 포스팅의 정보를 많이 참조해서 썼습니다. 포스팅의 말미에 출처를 언급했습니다. 제가 실례를 범하지 않았길 바랍니다. 아래는 제 블로그 포스팅입니다
    http://hosieye.egloos.com/5344299

    • BlogIcon FreeRedbird 2010.06.25 17:15 신고 Address Modify/Delete

      감사합니다. 요즘 바빠서 세이버메트릭스 쪽은 포스팅을 거의 못하고 있는데요... 쓰고 싶은 것은 많지만 시간이 잘 나질 않네요. ^^ 그리고... 제 글은 출처만 밝혀 주시면 자유롭게 사용하셔도 상관없습니다.

      위의 댓글에도 언급이 되어 있고, 호시님의 글에도 있습니다만, 우리나라 야구는 무승부 제도가 있어서 승률이 왜곡되는 면이 있고요... 매년 조금씩 승/패/무승부 관련 규정이 바뀌어 왔기 때문에 MLB에서처럼 노가다로 분석을 하여 위 공식에서의 X값을 새로 만들기도 좀 그렇습니다. 동일한 규정으로 오래 데이터가 축적되어야 좀 더 정확한 한국형 승률 예측 공식을 얻을 수 있을 것으로 생각합니다.

  3. 위즈 2011.01.31 19:04 Address Modify/Delete Reply

    좋은 글 감사히 읽었습니다.
    사실, 야구 좀 안다고 자부했었지만 세이버 매트릭스 쪽으론 완전 잼병이었거든요.
    실제 야구를 볼때도 전통적인 스탯만 챙겨보고 OOTP 할때는 스탯보다는 툴을 중시하다보니..ㅎㅎ;;
    아무튼.. 정말 반갑고 감사하고 그렇습니다. 앞으로 틈틈이 찾아와서 글도 읽고 댓글도 남기고 하겠습니다.

  4. 삼팬 2015.09.16 20:41 Address Modify/Delete Reply

    저기 X를 구하는 공식에서 어떤 곳은 0.285로 되어 있는건데 어떤게 맞는건가요?


올 시즌 5할에 육박하는 초현실적 BABIP를 기록하고 있는 David Wright(3B, NY Mets)


마침 김형준 기자님 블로그에 BABIP 이야기가 올라오기도 했고, 이전에 이 블로그에 "FIP란 무엇인가"라는 글을 쓰면서 나중에 BABIP에 대해 따로 써 보겠다고 한 적도 있는 만큼, 오늘은 BABIP에 대해 몇 자 적어 보고자 한다.


BABIP란 무엇인가?

The Hardball Times의 설명을 보자.

"Batting Average on Balls in Play. This is a measure of the number of batted balls that safely fall in for a hit (not including home runs). The exact formula we use is (H-HR)/(AB-K-HR+SF) This is similar to DER, but from the batter's perspective."


즉... "Balls in Play" 된 경우 중에서만 계산한 타율이라는 의미이다. 여기에서 "Balls in Play"라는 것은 타자가 친 공이 페어 영역(fair territory) 안에 떨어지는 경우만을 뜻한다. 페어 영역에는 관중석이 포함되지 않으므로, BABIP를 계산할 때에는 홈런을 제외해야 한다. HBP, 즉 몸에 맞는 공 같은 것도 역시 제외된다.

위의 공식을 보면 좀 더 의미가 분명해지는데, 먼저 분모를 보면 AB-K-HR+SF 로 되어 있다. 즉 일반적인 At Bat(타수)에서 삼진과 홈런을 제외하고, 희생타를 더한 것이다. 삼진과 홈런은 페어 영역에 공이 떨어진 경우가 아니므로 제외하게 되며, 희생타는 페어 영역에 떨어지는 공임에도 불구하고 타수를 산출할 때 제외되므로 분모에 더해 줌으로써 보정을 해 주는 것이다.

분자는 H-HR 로 전체 안타 갯수에서 홈런을 뺀 것인데, 분모에서 홈런을 뺐으므로 분자에서도 똑같이 빼 주어야 올바른 계산이 된다. 삼진이나 희생타는 애초에 "안타"의 범주에 들어가지 않으므로 분자에서는 더하거나 뺄 필요가 없다.


이 BABIP는 주로 개개인의 성적에 "운"이 얼마나 개입되는지의 척도로 많이 사용된다. 통계적으로 메이저리그 평균 BABIP는 .300 근처로 나타나고 있는데, 투수와 타자의 경우가 좀 다르다. 먼저 투수를 보면...

[자료출처 : Fangraphs]

- Career BABIP -
Tim Wakefield .281
Tom Glavine .286
Jamie Moyer .291
Jason Isringhausen .291
Paul Byrd .293
Brandon Webb .294
박찬호 .296
Mike Mussina .299
CC Sabathia .295
Jeff Suppan .300
Chuck Finley .301
Randy Johnson .302
Curt Schilling .304
Chris Carpenter .304
Cliff Lee .304
Ben Sheets .306
Bob Wickman .306
Kyle Farnsworth .307
Livan Hernandez .310
Brad Lidge .325

(주: 특별한 기준 없이, 그냥 생각나는 대로 찍어서 조사해 본 결과이다. 좋은 선발투수, 보통 선발투수, 구원투수, 은퇴한 투수 등 최대한 다양하게 섞어 보려고 했고, 통계의 신뢰성은 샘플이 커질 수록 높아지므로 되도록 투구수가 많은 베테랑들 위주로 골라 보았다.)

위의 결과를 보면 투수들의 BABIP는 대략 .290대와 .300대에 집중적으로 분포하고 있음을 알 수 있다. 그럼 타자들의 경우는 어떨까??

- Career BABIP -

Mark McGwire .260
Rod barajas .265
Jose Uribe .274
Orlando Carbrera .287
Barry Bonds .288
Adam Dunn .290
Rich Aurilia .298
Miguel Tejada .300
David Ortiz .307
Frank Thomas .310
Frank Catalanotto .317
Juan Pierre .319
Albert Pujols .321
Vladimir Guerrero .322
Julio Franco .337
Todd Helton .341
Ichiro Suzuki .357
Derek Jeter .360

역시 되도록 오래 선수생활을 한 타자들 중에서 생각나는 대로 아무나 찍어서 확인한 결과인데... 투수들의 BABIP 분포에 비해 두드러지게 다양한 모습을 보여주고 있다. 실제로 THT에서도 비슷한 언급을 하고 있음을 알 수 있다.

"We use BABIP to evaluate both pitchers and hitters, but the way in which we use it differs greatly among the two. Most pitchers regress toward the league average BABIP of around .300 or .305. Very few pitchers can repeatedly do better or worse than this, so we say that pitchers have very little control over BABIP.

Hitters, on the other hand, can have a substantial amount of control over BABIP.
Ichiro Suzuki, for example, has a .356 career BABIP. Hitters do not regress toward league average, rather, they each regress toward their own, unique number."

위의 인용문에서, "타자들은 리그 평균에 수렴하기 보다는 각자 자신만의 고유의 숫자로 수렴한다"는 마지막 문장에 주목할 필요가 있다.


BABIP는 그 정의상 타자의 타격 스타일과 수비수들의 수비 능력에 영향을 많이 받을 수밖에 없으며, 투수가 영향을 미칠 수 있는 여지는 별로 없다. 이것은 수비의 영향을 배제한 대표적인 투수 평가 지표인 FIP가 "볼넷, 삼진, 홈런, 몸에 맞는 공" 으로만 계산된다는 점을 고려하면 당연한 것이다. FIP의 계산에 쓰이는 지표들이 BABIP의 계산에서는 모두 배제되고 있음을 주목할 필요가 있다. (FIP에 대해서는 이전 글 참조)

상식적으로 생각해 보아도, 투수가 오래 선수생활을 할 수록 다양한 스타일의 타자를 두루 상대하게 되며, 수비수들의 실력도 좋은 해도 있고 나쁜 해도 있을 것이므로, 시간이 계속 흐르면 결국 투수들의 BABIP는 평균값에 가까워지는 것이 정상일 것이다.

그러나 타자들의 경우는 이야기가 달라진다. 예를 들어 타자 A와 B의 컨택 능력이 똑같고, 게다가 같은 비율로 내야 땅볼을 치고 있다고 하면, 이 내야 땅볼 중 얼마만큼의 비율이 내야 안타가 되는가는 순전히 A와 B의 달리기 실력 차이에 달려 있다고 볼 수 있다. 이러한 차이는 투수의 경우와 달리, 시간이 많이 흐른다고 해서 평균에 수렴하는 종류도 아니고, 심지어 노력한다고 해서 달라지는 것도 아니다. 즉 Mike Lowell같이 느린 플레이어가 매일 저녁마다 달리기 훈련을 한다고 해서, 5년쯤 지나면 Ichiro를 능가하는 스피드를 가지거나 하는 일은 없다는 이야기이다.

BABIP에 영향을 미칠 수 있는 변수는 달리기 실력 이외에도 많다. 예를 들어 극단적인 당겨치기 일변도의 타격을 하는 타자는 아무래도 BABIP에서 손해를 보기가 쉽다. 일단 필드 전체 중에서 공이 떨어지는 범위가 좁고, 또 상대팀이 거기에 맞춰 defensive shift를 하므로 그만큼 안타 발생의 확률이 줄어들기 때문이다. 가장 극단적인 예는 Carlos Delgado로, 그는 보통 때 BABIP가 .284이지만 상대팀이 defensive shift를 하게 되면 BABIP가 .191로 엄청나게 떨어져 버린다. 이정도로 큰 차이라면 상대팀은 매 타석마다 무조건 수비 위치를 옮겨야 할 것이다.

THT의 Chris Dutton은 BABIP에 영향을 미치는 변수로 "HR/FB(플라이볼 대비 홈런 비율), IF/FB(플라이볼 대비 내야플라이 비율), LD%(라인드라이브 비율), GB/FB(플라이볼 대비 그라운드볼 비율), 스피드, 왼손 타자 여부, 타격시 컨택 비율, 타격시 공이 날아가는 범위" 등을 꼽고 있으며, 이 변수들이 구체적으로 각각 얼마나 영향을 미치는가에 대한 연구는 아직 진행중이다. 다만 확실한 것은, 타자들은 투수들에 비해 플레이어 별로 개성적인 BABIP를 가지고 있으므로, 리그 평균인 .300과 비교하기 보다는 각자의 커리어 통산 BABIP를 가지고 비교하는 것이 유용하리라는 것이다. 좀 더 정확도를 높이기 위해 개발된 xBABIP라는 스탯이 또 있지만, 이것은 바로 위에 링크된 Chris Dutton의 글에 나오다시피 아직 개량중이며, 계산식도 일반에게 공개되지 않은 상태이다.


자.. 그럼... 이러한 BABIP를 어떤 경우에 활용할 수 있을까?

가장 쉽고 흔한 예는 역시 해당 플레이어의 현재 기록에 얼마나 "운"이 개입하고 있는지를 보는 것이다. 어느 타자 A가 자신의 커리어 평균과 비교하여 유난히 BABIP 값이 높다면, A가 친 공은 운좋게도 수비수가 없는 곳만 골라서 떨어지고 있다는 의미이다. 어느 투수 B의 BABIP 값이 유난히 높다면, 타자의 경우와는 반대로 운이 나쁘게도 같은 팀 수비수들이 상대 타자들의 타구를 평소보다 잘 잡지 못하고 있다는 의미가 된다.

예를 들어 김형준 기자님 블로그에 언급된 David Wright의 올 시즌 타격 성적을 분석해 보자.

225 AB, 82 H, 4 HR, 60 K, 1 SF
현재 타율 .364로 완전 날아다니고 있는 모습이다. 반면 홈런이 4개밖에 안되는 것이 이상하게 느껴진다.

위의 BABIP 공식에 따라 계산해 보면,
(82-4)/(225-60-4+1) = .481


Fangraphs에서는 .484로 계산이 되어 있는데, 아마도 SF 숫자를 빼지 않은게 아닌가 싶다. THT에서는 .481로 계산이 되어 있는데, THT 쪽의 계산이 맞다고 생각된다.

아무튼... David Wright의 커리어 통산 BABIP는 .352 이므로... 만약 Wright의 BABIP가 .481 대신 .352 였다면 올 시즌 타율이 어떻게 될까?

위의 공식을 변형하면 안타 수는 이렇게 구할 수 있을 것이다.
H = BABIP*(AB-HR-K+SF) + HR

이렇게 해서 얻은 예상 안타 수는 61개. 이를 225 타수로 나누면 타율은 .271로 뚝 떨어진다. 즉, 올 시즌 David Wright는 엄청나게 운이 좋아서 거의 1할 가까운 타율 상승의 혜택을 보고 있다는 의미가 된다.

하지만.. 한편으로 올 시즌 Wright의 HR/FB(홈런/플라이볼) 비율은 6.3%에 불과하다는 점도 생각해 볼 필요가 있다. 그의 커리어 통산 HR/FB 비율은 14.5%이고, 이정도로 큰 차이가 나타날 특별한 이유가 없으므로... 여기에는 반대로 "나쁜 운"이 작용하고 있다고 볼 수 있을 것이다. 메츠의 홈구장 Citi Field의 홈런 Park Factor가 1.151로 홈런이 평균보다 많이 나오는 구장임을 감안하면, 더욱 더 "운이 따르지 않아 홈런이 줄어든 것"이라는 확신이 든다.

그럼 이를 반영하여 예상 타율을 보정해 보자. 6.3% 대신 14.5%의 HR/FB 비율을 적용하면 David Wright의 "정상적인" 홈런 갯수는 9개가 된다. 홈런 갯수를 9개로 바꾸고 BABIP가 커리어 통산과 동일한 .352가 되도록 안타 값을 다시 계산하면 안타 수는 64개가 된다. 이렇게 해서 얻게 되는 최종 타율은 .284이다. 여전히 현재 타율  .364에 비하면 8푼이나 낮은 수치이다. Wright의 높은 타율은 이렇게 엄청난 행운의 결과인 것이다.

.284의 조정 타율은 Wright의 커리어 평균 타율인 .313과 비교하면 상당히 낮은 편인데... 이것은 아마도 올 시즌 유난히 삼진을 많이 당하고 있기 때문인 것으로 생각된다. 라인드라이브 비율 같은 다른 중요 수치들은 그다지 변한 것이 없는데, 올 시즌 타수당 삼진 비율은 26.7%로 커리어 통산 19.4%에 비해 상당히 높게 나타나고 있다. 삼진을 많이 먹으면 타율이 떨어지는 것은 원래 당연한 것인데, 이를 아주 높은 BABIP라는 더 큰 운빨로 커버하고 있는 것이다.

그럼 왜 삼진이 많은 것일까? 2009년 그의 Z-Swing(스트라이크에 방망이를 휘두르는 비율)은 커리어 통산 대비 1% 줄어들었으며, Contact Rate(방망이를 공에 맞추는 비율)도 커리어 통산 대비 2.3% 줄어들었다. 즉 루킹 스트라이크도 늘었고 스윙 스트라이크도 늘었다는 의미가 된다. 이러면 당연히 삼진이 늘어날 수밖에...

종합해 보면, David Wright는 현재 비정상적으로 높은 BABIP에 의해 많은 덕을 보고 있으며, 홈런의 측면에서는 오히려 불운이 따르고 있다. 이러한 "운"은 타자가 스스로 컨트롤하기 어려운 부분이므로, 장타율을 걱정한다거나 다른 생각을 하지 말고 삼진을 덜 당하는 쪽에 집중하는 것이 바람직하다. 그래야 BABIP가 정상적인 수준으로 돌아가더라도 좋은 타율을 유지할 수 있을 것이다.



-----------------------------------


참고로, BABIP를 이용한 흥미로운 다른 연구 결과를 소개한다.

Fangraphs의 Dave Cameron은 1995년부터 2008년까지 14년 간의 메이저리그 전체 데이터를 가지고 홈팀 투수들과 원정팀 투수들의 평균 BABIP에 대한 계산을 수행하였다. 그 결과 다음과 같은 그래프가 나타났다.

(클릭하시면 크게 나옵니다)


원정팀과 홈팀 사이에 일정한 수준으로 계속 차이가 나고 있음을 알 수 있다.

14년 평균값을 비교해보면 원정팀 투수들의 BABIP가 홈팀 투수들보다 0.007 더 높다. 즉 원정팀 투수들이 안타를 조금씩 더 허용하고 있는 것이다. BABIP 0.007의 차이는 보는 시각에 따라 작은 것일 수도 있고 큰 것일 수도 있지만, 위의 그래프처럼 꾸준하게 차이가 벌어진다는 것은 홈 어드밴티지가 실제로 존재한다는 아주 유력한 증거이다...!!!

Posted by FreeRedbird

댓글을 달아 주세요

  1. BlogIcon 박요셉 2009.06.17 18:56 Address Modify/Delete Reply

    김형준 기자님 블로그에서 건너와서 글을 읽습니다~
    정말 야구의 데이터는... 무궁무진하군요 ^<^
    타자들의 운에 대해서 알아볼 수 있도록 인플레이에서의 타율도 있다니 ㄷㄷㄷ
    새로운 것을 알고 갑니다~~ ^<^

  2. BlogIcon 기호태 2009.06.17 21:08 Address Modify/Delete Reply

    정말 잘 읽었습니다. 메츠 경기를 전경기 보고 있는데, 빗맞은 타구가 안타가 되거나 수비수 사이로 빠져나가는 그라운드볼 안타가 굉장히 많이 나오고 있습니다 올시즌 롸잇은... 반면 루킹 삼진은 엄청나게 많은 수준이구요. 지적하신 내용이 굉장히 설득력이 있다고 봅니다. 괜찮으시면 메츠 팬사이트에 일부 좀 퍼가도록 하겠습니다.

    그리고 BABIP는 SF를 빼고 계산하는 방법과 포함해서 계산하는 방법 두 가지가 있는 것으로 알고 있습니다. 보통은 SF를 빼는 편이지만 성향에 따라서는 포함해서 계산하기도 하더군요. FanGraph는 포함시키는 쪽인 모양입니다.

    • BlogIcon FreeRedbird 2009.06.17 21:41 신고 Address Modify/Delete

      좋은 말씀 감사합니다.

      제 글은 어디든 자유롭게 퍼가셔도 좋습니다. 출처만 표시해 주세요. ^^

      BABIP는 말씀하신 대로 Fangraphs와 THT의 계산 방식이 살짝 다른 것 같습니다. 타자가 의도적으로 자신을 확실히 희생하는 희생번트(SH)는 BABIP계산에 들어가지 않습니다만, 희생플라이(SF)는 사실 애매한 면이 있죠. 의도적으로 친 것 같기도 하고 안친 것 같기도 하고... 포함시키는 것과 빼는 것 모두 일리가 있겠습니다만, 제가 볼 때는 THT의 계산처럼 정상적인 플레이의 일부로 생각하고 분모에 더해주는 것이 더 타당해 보입니다.

  3. BlogIcon 이창섭 2009.06.19 11:35 Address Modify/Delete Reply

    재미있게 잘 읽었습니다. 매우 흥미롭네요. 기록은 대개 과정보다는 결과론적으로 이야기가 이루어지기 때문에, 말씀하신 어마어마한 운은 일종의 실력이라고 봐도 할 말은 없을 것 같습니다. 우리가 매년 보았던 라이트는 또 충분히 기량이 뛰어난 선수이기도 하구요.
    읽으면서 하늘은 이럴 땐 공평하다란 생각이 들었습니다.

    평소, 관심이 많았던 기록이였는데 좋은 내용 많이 얻어갑니다. 감사합니다.^^

    • BlogIcon FreeRedbird 2009.06.19 17:59 신고 Address Modify/Delete

      타율이나 타점같은 전통적인 스탯들은 현재까지 일어난 일에 대한 사실 그대로의 기록입니다. 반면 BABIP와 같은 세이버 스탯이 갖는 중요한 의미가 있다면, 이론치와 실제 발생한 사실 사이의 gap을 살펴보고 미래를 예측하는 데 사용할 수 있다는 점일 것 같습니다. ERA가 FIP보다 훨씬 낮은 투수가 있다면 조만간 ERA가 점점 상승할 것이라고 예상할 수 있는 것처럼 말입니다.

      David Wright가 아주 뛰어난 플레이어라는 점에는 전혀 의심의 여지가 없습니다. 커리어 통산 BABIP가 .352라는 사실 자체가 그의 타격 재능을 보여주는 증거겠지요. 다만 지금의 타율은 실력을 넘어서 행운까지 뒷받침해 주고 있는 것으로 보입니다.

  4. 이동민 2009.06.20 22:11 Address Modify/Delete Reply

    흠 어쩐지 올해 라잇 성적을 분석하면 뭔가 이상하더라니.. 이런 해답이 있었군요. 홈런은 팍 줄었는데 삼진은 늘지 않나 ㅡㅡ 그러고도 3할 중반대를 치질 않나. 아마 타격 페이스 떨어지면 평균값으로 떨어지지 않을까 생각합니다. 시즌 초반에 보여줬던 그 깝깝한 모습으로 말이죠 ㅋ

    • BlogIcon FreeRedbird 2009.06.21 21:25 신고 Address Modify/Delete

      원래의 재능은 갑자기 없어지지는 않으니까요... 타율은 줄고 홈런은 늘어나는 쪽으로 움직이게 될 것이라고 봅니다. 댓글 감사합니다. ^^

  5. BlogIcon zzzzz 2010.01.31 23:45 Address Modify/Delete Reply

    감사합니다. 평소 메이저리그를 즐겨보는 팬으로써 최근 세이버매트릭스에 대해 많이 찾아보고있는데 도움이 많이 되네요. 개인적으로 BABIP에 대해 궁금하던 참이였는데 좋은 글 읽고 가네요^^.

    그리고 세인트루이스팬이신가봐요?ㅎㅎ
    저는 6년동안 양키스를 응원하고있지만 세인트루이스도 상당히 관심이 가더라구요.
    전 특히 웨인라이트 이친구가 참 마음에 들더군요.ㅎㅎ
    2006년이었나요 NLCS 7차전 9회2사만루에서 환호하는 메츠관중앞에서 벨트란을 삼진으로 잡아내는 모습이 아직도 기억에 남네요. 올해 사이영상에는 아쉽게 떨어졌지만 내년엔 이친구가 타길 내심 바라고 있습니다ㅋㅋㅋ

    • BlogIcon FreeRedbird 2010.02.01 09:28 신고 Address Modify/Delete

      말씀하신 Beltran 삼진 장면은 저도 선명하게 기억하고 있습니다. Cardinals의 팬으로 MLB를 본 지 10년이 넘었습니다만 가장 인상깊었던 한 순간을 꼽으라고 하면 역시 그 삼진이 될 것 같습니다.

      이 글은 좀 오래 된 글이어서, 지금 다시 보면 약간 고치고 싶은 부분도 있고 그렇습니다. 저도 계속 공부해 가면서 글을 쓰고 있으니까요... 세이버메트릭스에 대해서는 꾸준히 포스팅을 하고 있으니 자주 놀러 오세요... ^^

  6. risingx 2010.03.25 21:46 Address Modify/Delete Reply

    멋집니다..^^

  7. BlogIcon Lucid 2010.07.26 00:52 Address Modify/Delete Reply

    sabermetrics에 나름 관심을 가지고 꾸준히 보고 있는 야구팬입니다. ^^

    다름이 아니라 마지막 부분, 원정팀 투수의 BABIP가 홈팀 투수의 BABIP보다 살짝 높은... 이 부분은 홈 팀이 이기고 있을 때 9회말 공격을 하지 않는 것이 원인이 아닐까 합니다. 홈 팀의 승리로 끝난 경기는 홈 팀 투수들은 9이닝을 던지지만, 원정 팀 투수들은 8이닝을 던지니까요. fangraph의 본문에서는 이러한 부분은 언급되어 있는 것 같지 않더군요.

    • BlogIcon FreeRedbird 2010.07.26 15:02 신고 Address Modify/Delete

      안녕하세요... 제 생각은 조금 다른데요... 본문의 공식에서 보시는 바와 같이 BABIP를 계산할 때 분모에는 이닝이 아니라 Batted Ball의 갯수가 들어가니까요... 9회말의 BABIP가 다른 이닝의 BABIP와 비교해서 특별히 통계적인 의미(statistically significant)를 지니지 않는 이상, 9회말을 플레이하지 않는 것이 별 영향을 미치지는 않을 듯 합니다.

  8. 위즈 2011.01.31 10:35 Address Modify/Delete Reply

    정말 좋은 글 잘 읽었습니다.^^
    다 읽고 문득 드는 생각이 있는데요. BABIP가 "운"이라는 부분을 완전히 배제하기 위해서는 분모에서 "파울 플라이로 아웃된 타수"도 빼주어야 하지 않나 하는 겁니다. 일단 실질적으로 야구장에는 관중석과 "페어 영역" 사이에 "파울 영역"이 있습니다. 그리고 일단 이 파울 영역에 들어간 볼은 어떤 행운이 따르더라도 안타가 될 순 없습니다. 그러나 불행히도 파울 플라이가 아웃이 되는 경우는 발생합니다.

    즉, BABIP 공식에서 분자에는 파울에 관한 부분이 완전히 배제되어 있으나 분모에는 파울로 인해 아웃된 타수가 포함되어 있기 때문에 "운"이라는 요소를 완전히 배제하지 못한다는 것이지요. 파울은 모두 다 같은 파울이지만 그 볼이 얼마나 높이 뜨는가, 관중석으로 넘어가는가 그렇지 않는가 등의 운에 따라서 아웃이 될수도 그렇지 않을수도 있으니깐요.

    짧은 생각이지만 한 번 말씀드려 보았습니다.ㅎㅎ;;

    • BlogIcon FreeRedbird 2011.02.01 12:17 신고 Address Modify/Delete

      음.. 파울은 확실히 아웃과 에러라는 두 개의 outcome밖에 없지요. 이것은 생각해 볼 만한 부분인 것 같습니다. 좋은 의견 감사합니다. ^^

  9. 위즈 2011.01.31 10:38 Address Modify/Delete Reply

    그리고 링크 중에 OOTP Development가 포함되어 있는데 혹시 OOTP유저이신가요? 저도 OOTP를 다루는 카페에서 활동 중 인데요. 관심있으시면 한 번 들러주세요.^^ OOTP 12 프리오더가 지난주부터 시작되었습니다.ㅎㅎ;

    앞으로도 자주 들러서 이 곳에 있는 글들을 모두 섭렵해야 겠습니다.^^

    • BlogIcon FreeRedbird 2011.02.01 12:22 신고 Address Modify/Delete

      OOTP 유저 맞습니다. 4부터 모든 버전을 구매해 왔습니다. ^^ 온라인리그는 안해봤고 싱글플레이만 해 왔네요.

      12가 드디어 나오는군요. 바로 확인해 봐야겠네요...

      카페 주소를 알려 주시면 방문해 보겠습니다.

  10. 위즈 2011.02.01 13:34 Address Modify/Delete Reply

    OOTP 유저시라니 정말 반갑습니다!
    저는 2006시절부터 OOTP에 뛰어들었는데 저보다 선배시네요.ㅎㅎ

    http://cafe.naver.com/sportssim
    주소는 위와 같습니다.^^ 저희는 재야인사님의 리얼리그처럼 온라인리그를 진행하는 곳은 아니고요.^^;
    그냥 OOTP 유저들끼리 뭉쳐서 소소하게 활동하고 있습니다. 카페 차원에서 KBO로스터와 통합로스터도 OOTP 9 때부터 꾸준히 만들어오고 있고요.

    OOTP에 대해서 이런저런 이야기 나누시기에 괜찮지 않을까 생각합니다.ㅎ


올해 전체 1순위 지명이 확실한 Stephen Strasburg : SHOW ME THE MONEY!!!!!

우리는 앞의 글에서 Victor Wang의 연구를 통해 드래프트 1라운드에서는 타자를 뽑는 것이 유리하며, 고졸 투수가 가장 위험한 선택임을 살펴보았다.

이번 글에서는 Erik Manning의 분석을 같이 보고자 한다. 그는 Cardinals 유망주 사이트인 Future Redbirds의 주인이기도 하며, Beyond the Boxscore의 주요 필자 중 하나이다. 이 분석은 BtB에 게재된 것이다.

분석 대상은 1990년부터 1999년까지 10년간의 1라운드 지명자들이 메이저리그 데뷔 후 6년간 올린 성적이다. 6년이 지나면 FA가 되어 다른 팀으로 옮길 권리를 획득하므로, 6년 이후의 성적을 드래프트와 연관지어 분석하는 것은 무리이다.

분석에 사용되는 척도는 WAR(Wins Above Replacement level player) 이다. Replacement Level Player는 "팀 전력에 누수가 생겼을 때 마이너리그나 Waiver Wire, 미계약 FA 등 가능한 모든 수단을 동원해 땜방했을 경우 기대할 수 있는 수준의 플레이어"라고 할 수 있으며, 이는 Victor Wang이 분석에 사용했던 벤치 플레이어보다 더 낮은 레벨이다. 벤치 플레이어는 적어도 메이저리거이지만, Replacement Level Player는 메이저리거라기보다는 AAAA 플레이어이기 때문이다. 적절한 우리말 번역이 없으나, 개인적으로는 주로 "듣보잡 선수"라는 표현을 즐겨 쓰고 있다.



Paul Wilson : 94년 전체 1순위 지명(Mets). 뭐 할 말이 없다. -_-;;;; 전체 1순위 지명 중에도 이런 좌절스런 선택이 제법 있다.


우선 1라운드 지명 순위에 따른 연평균 WAR 값을 보자.

지명순위  연평균 WAR
1~5순위     1.20
6~10순위     0.85
11~15순위     0.66
15~20순위     0.72
21~30순위     0.24

대체로 먼저 지명될수록 성적이 좋다는 것을 알 수 있는데... 당연한 결과이다.
(다만 16~20순위 지명자가 11~15순위 지명자보다 아주 약간 좋은 성적(0.06 WAR)을 내고 있다는 예외 부분은 있다. 시간이 흐르면서 각 구단의 스카우팅 능력이 향상되면 이러한 예외는 사라질 것으로 생각된다...)

21순위 지명자부터는 WAR값이 크게 떨어지는 것을 볼 수 있다. 연평균 0.2 WAR이라면 거의 듣보잡 AAAA 선수와 비슷한 수준이다. 이런 결과가 시사하는 바는... 전년도 성적이 좋아서 구단의 드래프트 순위가 21~30번째에 해당한다면, 1라운드 지명권을 잃어버리는 것을 두려워하지 말고 과감하게 FA 계약을 체결하는 것이 오히려 좋은 전략이 될 수 있다는 것이다. 물론 FA는 비싸므로 비용 대 성능을 따져봐야 겠지만... 0.2 WAR가 아까워서 꼭 필요한 FA와의 계약을 포기하는 일은 있어서는 안 될 것이다.


다음은 Victor Wang이 분석했던 것처럼, 1라운드 지명자들을 4개의 그룹(대학 타자, 대학 투수, 고졸 타자, 고졸 투수)으로 나눠서 6년 연평균 WAB를 비교하였다.
그룹 연평균 WAR
대학 타자       0.93
대학 투수       0.56
고졸 타자       0.80
고졸 투수       0.44

결과는 Victor Wang의 연구와 거의 똑같다.

대학 유망주 > 고졸 유망주
타자 >>> 투수
대학 타자 >>>>>>>>> 고졸 투수

대학 타자를 지명하는 것이 가장 안전한 선택이며, 고졸 투수가 가장 나쁘다.

그런데... Erik Manning이 지적하는 것이 있다. 이 분석은 90년대 10년간의 드래프트를 가지고 이루어진 것이고.... 2000년대 들어서는 조금 다른 양상을 보이고 있는 것 같다는 것이다. 아직 좀 더 지켜봐야 하겠지만, 2000~04년의 5년간 드래프트 1라운드에서 지명된 고졸 투수들은 현재 연평균 0.8 WAR를 기록하고 있다고 한다. 이는 고졸 타자와 동등하며, 가장 좋은 선택인 대학 타자와 비교해도 그다지 떨어지지 않는 좋은 성적이다. 확실히, 시간이 지남에 따라 메이저리그 구단들의 스카우팅 능력이 향상되고 있는 것 같다.

이것은 순전히 개인적인 생각이지만... 최근들어 고졸투수의 성공률이 높아지고 있는 것은 특히 투구 자세의 분석이 활발히 이루어지고 있는 것이 크게 작용하지 않았나 싶다. 고졸투수가 망가지는 가장 큰 원인은 나쁜 투구폼에 기인한 팔꿈치 및 어깨 부상이기 때문이다.


좌완투수는 드래프트나 FA시장, 트레이드 할 것 없이 항상 인기있는 존재이다. 과연 좌완을 드래프트하면 좋은 결과를 얻을 수 있을까?

그룹 연평균 WAR
대학 LHP       0.72
대학 RHP       0.50
고졸 LHP       0.29
고졸 RHP       0.50

우완 투수는 대학/고졸에 상관없이 0.50으로 동일하지만, 좌완의 경우는 0.72 vs 0.29로 무려 2.5배 정도의 차이가 난다. 고졸 투수 중에서도 고졸 좌완은 참 위험한 선택인 것이다. 투수 유망주가 필요하다면 대학 좌완투수를 선택하는 것이 바람직하다.


마지막으로, 타자 유망주의 포지션 별 비교를 살펴보자.

그룹 연평균 WAR
Shortstops       1.00
Corner IF       0.85
Catchers       0.80
Outfielders       0.79

유격수들이 성적이 가장 뛰어나며, 다른 포지션은 차이가 크지 않음을 알 수 있다. 여기서의 포지션은 드래프트될 당시의 포지션이다. 유격수로 드래프트 되더라도 메이저리그에서 유격수를 맡기에 수비력이 충분하지 않으면 마이너리그에서 다른 포지션으로 옮겨지게 되는 것이다. 일단은 드래프트 될 당시에 포지션이 "유격수"로 되어 있다는 것은 남들보다 운동신경이 뛰어나고 민첩하다는 이야기가 되므로, 성공 확률이 높다고 볼 수도 있다.


A-Rod : 93년 Mariners에 의해 전체 1순위 지명. 열심히 유격수를 드래프트하다 보면 이런 월척을 낚기도 한다.


그럼 결론은???

1. TINSTAAPP (There Is No Such Thing As A Pitching Prospect) : 적어도 1라운드에서는 타자를 드래프트하자. 이왕이면 대학 타자를 뽑는 쪽이 더 안전하다.
2. 꼭 1라운드에서 투수를 뽑아야겠다면, 대학 좌완투수를 뽑자. 고졸 좌완은 최악의 선택이다.


앞의 글에서도 이이기했지만, 비용 대비 기대값을 생각하면 고졸보다는 대학 선수를 뽑는 쪽이 더욱 유리하다. 고졸 유망주는 여차하면 계약을 거부하고 대학에 갈 수 있기 때문에... 계약금이 비싸고 계약하기가 힘들다. 그렇게 힘들게 계약을 했는데도 성공률은 오히려 낮은 것이다.


물론 이러한 결론은 어디까진 일반론일 뿐이고... 올해와 같이 타자 유망주가 거의 없는 빈곤한 드래프트에서는 많은 구단들이 어쩔 수 없이 투수를 1라운드에 지명하게 될 것이다. (이런 수준의 드래프트라면 더더욱 양키스와 같이 FA 계약을 질러버리는 쪽이 유리하다. 이래저래 돈 많은 쪽이 살기 편한 세상이다...)


Tyler Matzek : Capistrano Valley HS(CA).
올해 가장 주목받는 유망주 중 하나지만... 지금까지 본 결과 가장 나쁜 선택인 "고졸 좌완" 이다. 하지만 쓸만한 타자 유망주가 몇 명 없는 올해 드래프트에서, 그는 아마도 전체 10순위 안에 지명될 것이다.
 

Posted by FreeRedbird

댓글을 달아 주세요

  1. BlogIcon Cherish TIP 2009.06.14 07:24 신고 Address Modify/Delete Reply

    이 글 정말 예술이네요.
    애틀란타의 팬으로서 애틀란타 마이크 마이너가 좋은 선택이 되었으면 좋겠습니다.
    잘 보고 갑니다 ^^

  2. BlogIcon FreeRedbird 2009.06.15 10:20 신고 Address Modify/Delete Reply

    댓글 감사합니다.

    드래프트 1라운드에서 Braves의 Mike Minor 지명은 상당히 의외였습니다. 매년 고졸선수를 1라운드에 지명해 왔고, 리스크를 두려워하지 않던 팀이었으니 말입니다. 하지만 스카우팅과 유망주 육성의 분야에서 메이저리그 최상위급인 Braves인만큼 믿고 기다려 보셔도 되지 않을까 싶습니다. ^^

  3. turin 2009.06.21 19:35 Address Modify/Delete Reply

    좋은 글 잘 봤습니다. 대단히 흥미롭네요.


MLB 2009 Draft : 6/9 ~ 6/11

원래 드래프트 관련 포스트는 시리즈로 여러 편에 걸쳐서 자세하게 쓰려고 했던 것인데..
이런저런 일로 시간을 보내는 사이에 어느새 드래프트가 코앞으로 다가와 버렸다.
미국 시간으로 9일에 시작하니 우리나라 시간으로는 10일 오전이 될 것이다.
이틀밖에 남지 않은 것이다.

옛날에 Mike Piazza가 62라운드에 지명되었던 것처럼... 늦은 라운드에서 보석을 발굴하는 일이 가끔 있지만... 그런 보석이 눈에 띄게 되는 것은 드래프트가 한참 지나고 난 뒤의 일이고... 드래프트 당일에 관심이 집중되는 부분은 역시 1라운드를 비롯한 최상위 라운드에서 각 구단이 어떤 선택을 하는가이다.

어떤 구단은 포지션에 상관없이 무조건 가장 재능이 뛰어난 유망주를 드래프트하는 반면, 어떤 구단은 가장 시급하게 보강이 필요한 포지션 위주로 드래프트한다. 어떤 구단은 대학 출신 유망주를 선호하는 반면, 어떤 구단은 고등학교나 2년제 대학 출신에 더 많이 투자한다. 어떤 구단은 1라운드에서 투수를 많이 지명하는 반면, 어떤 구단은 주로 타자를 뽑는다.

구단마다 처해 있는 상황이 다르고, 또 각 구단의 유망주에 대한 철학이나 마이너리그 운영 방침이 다르므로, 절대적으로 항상 옳은 유일한 방법 같은 것은 없을 것이다. 하지만, 지금까지 이루어진 드래프트를 분석해서 그들이 어떻게 성장했는지를 분석해 보면, 약간의 가이드라인을 얻을 수 있지 않을까? 세이버메트릭스 진영에서는 최근 이러한 연구가 활발하게 이루어져 왔으며, 이 글에서는 최근의 연구 결과를 2부에 걸쳐 소개해 보고자 한다.


누구를 먼저 뽑는 것이 좋은 전략일까??


아마도 이 방면의 선구적인 연구는 The Hardball Times에서 활동하는 Victor Wang의 논문일 것 같다. PDF 포맷이고 다운로드가 가능하니 관심 있으신 분들은 위의 링크를 눌러서 천천히 읽어보시기 바라며...

이 논의를 위해서는, 우선 WAB(Wins Above Bench)라는 개념의 이해가 필요하다. 어떤 플레이어 A의 WAB가 +3 이라는 것은... A를 한 시즌 내내 선발 출장 시켰을 때와 A 대신 벤치의 유틸리티 플레이어들로 시즌 내내 돌려막기 했을 때를 비교하면 통계적으로 대략 3승 정도의 차이가 날 것이라는 것이다. 다시 얘기해서... A가 시즌 내내 선발 출장해서 90승을 올린 팀이 있다면... A 대신 1년 내내 벤치워머들로 땜방했을 경우 이 팀은 아마도 87승에 그쳤을 것이라는 이야기가 된다.

요즘 흔히 쓰이는 WAR 대신 WAB를 이용한 이유에 대해서는 Victor Wang의 논문에 언급이 되어 있다. 글이 너무 길어지므로 설명은 생략. 관심있는 분들은 논문을 직접 읽어보시고... 이런 정의가 중요한 이유는 오프시즌에 Type A FA를 계약했을 때의 이익과 그로 인해 잃어버리게 되는 드래프트 1라운드 지명권의 손실을 비교하여 이해득실을 따지기 위해서이다. 하지만 이 글에서 오늘 우리가 보고자 하는 것은 단지 "드래프트에서 누구를 먼저 뽑는 게 유리할까?" 일 뿐이므로, 계산의 근거값은 중요하지 않으며, 상대적인 값만 참고하면 된다.

Victor Wang은 해당 유망주가 성장하여 메이저리거가 된 후의 연평균 WAB 값이 마이너스이면 "Bust(완전실패)"로, 0~2이면 "Contributor(롤 플레이어/비주전 선수)"로, 2~4면 "Everyday Player(주전 선수)"로, 4 이상이면 "Star(스타 플레이어)"로 등급을 나누었다. 연평균 WAB 값이 마이너스라는 이야기는 벤치워머보다도 활약이 못하다는 것이므로, "완전실패"라고 봐도 무방할 것이다.
 
분석 대상은 Baseball America가 매년 발표하는 TOP 100 유망주 리스트이며, 기간은 1990-1999년의 10년간이다. 이들이 FA시장에 나가기 전인 데뷔 후 6년간의 WAB를 가지고 계산하여 비교해 보았다. 과연 이들이 메이저리그에서 어떤 활약을 보였을까?

아래 표를 보자.

포지션 유망주 순위 완전실패  비주전  주전  스타  WAB*
타자  1~10위  10%  50%  25%  15%   10.9
 11~25위  21%  50%  20%  9%     7.9
 26~50위  35%  45%  12%  8%     6.4
 51~75위  45%  38%  15%  3%     4.5
 76~100위  43%  45%  10%  3%     4.0
투수  1~10위  31%  62%  4%  4%     4.3
 11~25위  32%  53%  12%  3%     4.4
 26~50위  33%  51%  14%  2.5%     4.4
 51~75위  39%  54%  6%  2%     3.4
 76~100위  43%  50%  5%  2%     2.9
* WAB는 6년간 WAB 합계의 평균임. 6년인 이유는 6년이 지나면 FA가 되어 팀이 바뀌기 때문.

놀랍지 않은가?

메이저리그 30개 구단을 모두 합친 유망주 리스트에서 TOP 10위 안에 들어 있는 투수 유망주라고 해도, 메이저리그에서 스타급 투수가 될 확률은 고작 4%이다...!!! 보통 이상 되는 그럭저럭 쓸만한 메이저리그 투수(주전)가 될 확률까지 합쳐 봤자 고작 8%에 불과하다. 산술적으로 TOP 10 투수 유망주 10명 중 쓸만한 메이저리그 투수는 10명 다 합쳐도 그 중에 1명 나올까 말까 한 것이다....!!!  "완전실패"가 무려 31%에 달한다는 점도 주목할 부분이다.

상대적으로 타자 유망주를 보면... TOP 10 타자 유망주들은 장래에 15%가 스타 플레이어가 되었고, 25%는 주전급 메이저리거가 되었다. 적어도 40%는 주전급 이상의 우수한 선수가 되는 것이다. 6년간 WAB의 합을 보아도 10.9 vs 4.3으로 타자 쪽이 압도적으로 우수하다.

그 이하의 11~25위, 26~50위 등을 비교해 보아도 결과는 명백하다. 즉 타자 유망주가 훨씬 안전하며, 투수 유망주는 망할 확률이 아주 높다는 것이다.

또한, 투수 유망주의 경우 1~10위나, 26~50위, 51~75위의 평균 WAB 값이 거의 똑같다. 이것은 투수 유망주를 제대로 평가하기가 매우 어렵다는 의미가 된다.

이를 드래프트에 적용하면 어떨까? 1라운드 지명자들은 대개 100만 달러 이상의 높은 계약금을 요구한다. 위의 연구 결과를 고려할 때, 계약금 요구 수준이 비슷하다면 타자 유망주를 선택하는 것이 훨씬 안전하다는 것을 알 수 있다. 기대값이 훨씬 높은 것이다.


Victor Wang은 여기서 한 발 더 나아가서, 드래프트 지명자들을 4개 그룹으로 나누어서 비교 분석을 수행하였는데, 이 연구는 올해 2월에 The Hardball Times에 게재되었다. 4개 그룹은 "대학 타자", "대학 투수", "고교 타자", "고교 투수" 이며, 이들을 다시 드래프트 1라운드 지명, 2라운드 지명, 3라운드 지명 별로 나누어서 메이저리그에서 어떤 활약을 보였는지 비교해 보았다. 비교에는 이전 연구와 동일하게 WAB를 척도로 사용하였다. 단, 여기서는 WAB 합계가 아니고, 이들이 메이저리거가 된 뒤의 연평균 WAB를 비교 대상으로 하였다.

연평균 WAB 비교:
 구분  1라운드 지명  2라운드 지명  3라운드 지명
 대학 타자  0.76  0.2  0.04
 고교 타자  0.75  0.14  0.1
 대학 투수  0.49  0.18  0.11
 고교 투수  0.35  0.16  0.08
* 1st Supplemental Round 지명자는 2라운드 지명에 합쳐서 계산되었다.

1라운드 지명자들의 차이는 매우 두드러지게 나타나고 있는데, 여기에서도 타자 유망주들의 성적은 투수 유망주들에 비해 압도적으로 우수하다. 특히 고교 투수 그룹과 비교하면 타자들은 2배 이상의 평균 성적을 내 주고 있는데, 통계적인 오차의 범위를 훨씬 넘어서는, 확연한 차이이다. 다만 2라운드나 3라운드로 가면 이러한 차이가 많이 희석되고 있으며, 특히 3라운드에 가면 오히려 투수들이 약간 좋은 성적을 내고 있다.

여기서 우리는... 통계적으로 볼 때 최악의 1라운드 지명은 고졸 투수임을 알 수 있다. 일반적으로 고졸 투수는 소위 "high risk, high return" 으로 여겨지는 경우가 많으며, 진정한 에이스를 얻으려면 고졸 투수를 지명해야 한다는 생각이 야구팬들 사이에 널러 퍼져 있다. 그러나 연구 결과를 보면 이러한 생각은 편견임이 드러난다. 단지 리스크만 클 뿐, 기대값이 형편없는 것이다. 기대되는 연평균 WAB 값이 타자 유망주에 비해 절반도 안 되는 데다가, 고졸 유망주의 경우 언제든지 계약을 거부하고 대학에 진학할 수 있다는 레버리지가 있기 때문에 대학 유망주에 비해 계약금이 더 높은 경우가 대부분이다. 돈은 많이 들고 기대값은 낮으니 최악의 선택일 수밖에 없다.


Zack Wheeler, RHP, East Paulding HS.
Tyler Matzek와 함께 올해 고졸 투수 최대어로 꼽힌다.
바로 이런 유망주를 1라운드에서 지명하지 말라는 말이다...!!!


(2부에서 계속)
Posted by FreeRedbird

댓글을 달아 주세요

  1. ㅇㅇ 2019.05.26 17:43 Address Modify/Delete Reply

    2019년 현재 Wheeler가 정상적으로 선발 로테이션을 돌고 있고, 2년 정도 반짝하기까지 한 모습을 보면서, 투수 유망주 평가가 얼마나 어려운 것인 지 다시 한번 느낍니다.

최근 Fangraphs나 The Hardball Times 같은 세이버메트릭스 사이트들에 힘입어 소위 advanced stat 들이 유행하게 되었다. FIP, wOBA, WPA, UZR, tRA 등이 대표적인 예인데, 그 중에서도 특히 많이 쓰이고 있는 것이 바로 FIP 이다.

FIPFielding Independent Pitching의 약어로, 단어 안에 그 의미가 이미 드러나 있다. 즉 "수비와 무관한 투구 stat"이라는 것이다. 자세한 계산 방법은 뒤에서 알아보고, 우선 전통적인 stat의 문제점부터 살펴보자.

전통적으로 사용되는 투수의 stat으로는 W-L, ERA, WHIP 등을 꼽을 수 있겠다. W-L, 즉 승-패는 투수를 평가하는데 거의 아무짝에도 쓸모가 없는 상징적인 숫자에 불과하다. 투수가 아무리 잘 던져도 타선이 뒷받침해주지 않으면 투수는 절대로 승수를 쌓을 수가 없는 것이다. 즉 투수의 승수와 패수는 팀 전체의 합작품이지 투수의 능력을 나타내는 지표가 될 수 없다. (이런 별 의미없는 숫자가 Cy Young 상의 중요 기준이 되고 있는 듯하여 씁쓸하다...)

ERA와 WHIP의 경우는 승-패 만큼 단순하지는 않으므로.. 조금 더 들여다볼 필요가 있다. ERAEarned Runs Average, 즉 평균자책점을 의미한다. ("방어율"이라는 기존의 번역은 의미상 부적절하다.) 여기서 "자책점"은 투수에게 책임이 있는 실점을 의미한다. 즉, 에러 등으로 주자가 출루하지 않고 순전히 안타와 볼넷, 사사구, 보크 등으로 내준 점수를 의미하는 것이다. 그러면 투수가 자책점을 얼마나 내줬는지는 충분히 의미있는 지표가 될 수 있지 않을까? 세이버메트릭스의 답은 "Hell no... 절대 아니다..." 이다.


볼넷이나 사사구는 당연히 투수의 책임이고 여기에 이의를 제기하는 사람은 없다. (스트라이크존이 유난히 넓거나 좁은 특정 심판을 탓할 수도 있겠지만... 그건 통계의 범위를 벗어나는 통제불가능한 변수이므로 따지지 말자.) 논쟁의 핵심은 안타에 있다. 도대체 안타의 어디까지가 투수의 책임일까? 똑같은 타구에 대해서... 좋은 수비수는 공을 잡아서 아웃으로 처리할 수 있지만, 나쁜 수비수는 공을 못잡고 안타로 만들어 버린다. "자책점"의 빌미가 된 안타 중에는 인간의 능력으로는 어쩔 수 없는 아주 잘 맞은 진짜 안타들도 있겠지만, 수비수의 형편없는 수비로 인해 안타가 되어버린 운 좋은 타구들도 제법 들어 있을 수 있는 것이다. 따라서, 안타의 발생 확률은 투수 뒤에 서 있는 수비수들의 수비 능력에 종속되게 되고, 결국 안타를 포함하는 stat으로 투수의 능력을 정확히 평가하기는 어렵다는 결론이 나오게 된다.

WHIPWalks and Hits per Innings Pitched의 약어이다. 우리말로 뭐라고 번역하는 지는 잘 모르겠다. 계산식은 (BB+H)/IP로 매우 단순하다. 투수가 한 이닝에 주자를 얼마나 내보내는지를 볼 수 있다고 해서 한때 각광받던 stat이었다. 그러나, 위의 ERA와 마찬가지로 WHIP도 피안타 수가 직접적으로 결과값에 영향을 미치는 구조를 가지고 있고, 따라서 안타의 수비 종속성에 대한 같은 논리를 통해 투수의 능력을 정확히 평가하기에는 부족하다는 결론을 얻게 된다.

그럼 어떤 대안이 있을까? 세이버메트릭스 진영에서 가장 널리 쓰이고 있는 것이 바로 FIP 이다. 수비수들의 능력과 상관없이 오직 투수만이 관여하는 수치인 삼진, 볼넷(사사구 포함), 홈런 만으로 투수의 진짜 능력을 판별하는 공식을 만들어낸 것이다.

Tom Tango가 개발하고 이후 여러 사람의 손을 거쳐 개량된 FIP의 일반적인 공식은 다음과 같다.

FIP = (13*HR+3*(BB-IBB+HBP)-2K)/IP + 3.20

HR은 홈런, BB는 볼넷, IBB는 고의사구, HBP는 사구(데드볼), IP는 투구 이닝 수를 의미한다.
맨 끝의 3.20은 상수인데... FIP의 결과값을 ERA(또는 RA)과 유사한 스케일로 치환하기 위해 더해 주는 값이며, 이 값은 각 사이트에 따라 자체적으로 조금씩 다른 값을 쓰고 있다.

예를 들어... 박찬호의 전성기였던 1998년과 2000, 2001년 성적을 보자.
1998년: 15승 9패 3.71 ERA, 220 2/3 IP, 1.34 WHIP, 16 HR, 97 BB, 191 K, 1 IBB, 11 HBP
2000년: 18승 10패 3.27 ERA, 226 IP, 1.31 WHIP, 21 HR, 124 BB, 217 K, 4 IBB, 12 HBP
2001년: 15승 11패 3.50 ERA, 234 IP, 1.17 WHIP, 23 HR, 91 BB, 218 K, 1 IBB, 20 HBP


승-패와 ERA만 보면 2000년이 가장 좋았던 것 같이 보인다. WHIP를 본다면 2001년이 더 나은 것 같기도 하고.... 그럼 위의 공식에 따라 FIP를 구해 보면 어떨까?
1998 FIP = 3.87
2000 FIP = 4.24
2001 FIP = 4.02


오히려 1998년이 가장 좋은 것으로 나온다.

Fangraphs의 박찬호 페이지를 보면, FIP 값이 조금 다르게 되어 있다.
1998 FIP = 3.82
2000 FIP = 4.23
2001 FIP = 3.89


이렇게 값이 다른 이유는, Fangraphs가 상수로 3.20을 사용하지 않고 매 년 리그별 평균 실점(RA)을 가지고 적절한 상수를 계산하여 연도별로 조금씩 다르게 적용하고 있기 때문이다. 이렇게 조정된 FIP값을 쓰더라도, 1998년이 가장 좋았고 2000년이 가장 떨어진다는 점에는 변함이 없다.

그럼 왜 2000년의 ERA는 3.27로 가장 낮은데, FIP는 4.23 혹은 4.24로 편차가 크게 나타나는 것일까? 여러 가지 요인이 있을 수 있으나, 2000년의 BABIP(Batting Average on Balls In Play)가 .266으로 낮았다는 것을 생각해 볼 수 있다. 박찬호의 career 평균 BABIP는 .294이고, 이는 메이저리그 평균과 유사한 수치이다. BABIP가 특정한 해에 낮았다는 것은 타자들이 친 공이 유난히 야수 정면으로 가는 일이 많았다든지... 혹은 그 해 수비수들이 유난히 수비를 잘했다든지... 즉 "운"과 "동료들의 특별한 도움"이 작용했음을 의미한다고 볼 수 있다. BABIP에 대해서는 후에 따로 글을 쓰도록 하겠다. 반면 1998년 BABIP는 .298이었다. 이런 차이가 ERA와 FIP의 차이에 한 몫을 했을 것이다. (흥미로운 것은 2001년에도 그의 BABIP가 .266 이었다는 것이다. ERA와 FIP의 괴리에 대해 BABIP 한 가지 만으로는 설명하기 어렵다는 증거가 된다.)

혹 ERA와 FIP의 괴리 현상에 대해 더 많은 정보를 얻고 싶다면 괴리 현상의 대표 격으로 늘상 언급되는 Javier Vasquez에 대한 Fangraphs의 글을 참고하기 바란다.
Posted by FreeRedbird

댓글을 달아 주세요

  1. milai83 2010.01.01 09:52 Address Modify/Delete Reply

    제가 세이버매트릭스에 왕초보이긴 하지만 박찬호 전성기는 97년도 부터죠. 그리고 BABIP가 낮다고 다 운이 좋았다고만 해석이 되나요? 실제 이게 낮으면 공의 구위가 좋다고도 볼수있는 수치로 알고 있는데요?

    1997 .250
    1998 .298
    1999 .312
    2000 .266
    2001 .266

    박찬호가 첫 풀타임 선발이 된후 1997~2001년까지 BABIP를 보면 약 275정도 되겠네요. 이때에 기준으로 본다면 오히려 98,99녀년이 운이 없었던거죠. 그런데 허리부상이후 나빠진 구위로 인해 오랜 기간 나쁜 성적을 올린 뒤 커리어를 보면서 97,00,01년이 운빨이 였다고 하는건 숫자 놀음의 한계를 보여주는거 같네요. 그리고 FIP를 보면 다음해 성적도 어느정도 예상할수 잇다고 하는거 같은데 바찬호의 경우 전혀 맞지도 않고요... 아마 박찬호 같은 유형의 투수들에겐 일반적인 FIP만으로는 설명 할수 없는 부분이 있을텐데 그거에 대해 어떻게 생각하시나요? 단지 운이 좋아 3년간 좋은 성적을 낸걸까요?

    1998년 박찬호가 시즌초에 허리부상을 당합니다. 그 후유증으로 시즌초 성적이 많이 안좋죠. 4~6월 BABIP가 약 .331이였고 7~9월은 .254정도 됩니다. 걍 박찬호에 대해 전후 사정 모르고 본다면 억세게 운이 안좋던 투수가 갑자기 운빨로 좋은 성적을 낸걸로 볼수 잇겟쬬. 하지만 당시 경기를 지켜보던 사람들은 박찬호가 허리에 대한 부담감을 떨치면서 작년(97년)과 같은 위력적인 공을 던진걸 알고 있습니다. 97년 BABIP가 .250이지죠.

    • BlogIcon FreeRedbird 2010.01.01 18:53 신고 Address Modify/Delete

      BABIP를 결정하는 요소로는 운, 구장 효과, 팀 동료들의 수비 실력, 그리고 투수 본인의 실력 등 여러 가지가 있습니다. BABIP가 낮았다고 단순히 운이 좋았다고 볼 수는 없습니다. 위의 요소들이 복합적으로 작용한 결과지요. Tom Tango 등의 연구결과에 의하면 BABIP에서 투수 자신의 영향력은 28% 정도라고 합니다. 문자 그대로의 "운" 뿐 아니라, 유리한 구장에서 뛰거나, 수비가 좋은 동료들과 함께 뛰는 것 역시 넓은 의미에서는 운이라고 말할 수 있겠지요.

      질문하신 부분에 대해 제 나름의 답을 드리자면 이렇습니다. 박찬호는 잘 던졌습니다. 그리고 운이 좋았고, 투수에게 유리한 구장을 홈으로 쓰면서 구장 덕도 보았습니다. 낮은 BABIP, 그리고 FIP로 나타나는 수치에 비해 상대적으로 좋았던 성적은 이러한 요인들이 복합적으로 만들어낸 결과물이라고 봅니다. 박찬호는 확실히 좋은 투수였습니다만, 당시 국내 언론에서 이야기하는 것처럼 사이영상 후보 감 까지는 아니었다고 생각합니다.

      참고로... 저는 박찬호 안티가 아닙니다. 아래 글을 보시죠. ^^
      http://birdsnest.tistory.com/78

      1998년이나 2000년의 박찬호 FIP를 가지고 제가 계산해보니 타격을 제외하고 둘 다 4 WAR 정도 나오는데요... 이정도면 2009 시즌 MLB 전체 투수 랭킹에서 20위권에 해당하는 성적입니다. 무척 좋은 성적이죠.


      구위가 좋은 것과 BABIP가 낮은 것은 약간 다른 문제입니다. Curt Schilling의 커리어 BABIP는 .304, Ben Sheets는 .306, Randy Johnson은 .302, Chris Carpenter는 .304로 모두 별로 낮지 않습니다. 구위 보다는 투수의 투구 스타일에 좀 더 영향을 받지 않나 생각되는데... 뚜렷하게 확립되거나 검증된 이론은 없습니다. 물론 특정 투수 개인의 커리어 내에서, 부상 등으로 인해 구위가 특히 많이 떨어지면서 안타를 많이 맞게 되는 일은 있을 수 있다고 생각 됩니다.

      FIP와 ERA, 그리고 BABIP에 대한 논란에 대해서는 아래 글 및 글에 달려있는 댓글들을 보시면 조금 더 도움이 되실 것입니다. 이미 camomile님과 좀더 자세히 토론을 벌인 바 있습니다.
      http://birdsnest.tistory.com/128

  2. 2010.08.26 16:54 Address Modify/Delete Reply

    비밀댓글입니다

    • BlogIcon FreeRedbird 2010.08.26 18:33 신고 Address Modify/Delete

      Park Factor는 얼마나 많은 변수를 고려하느냐에 따라 다양한 계산 방법이 존재합니다.

      비교적 단순한 방법을 하나 보겠습니다. Y를 Yankees의 홈경기 때 평균 점수 발생(홈팀 득점+원정팀 득점)이라고 하고, R을 Yankees의 원정경기 평균 점수 발생이라고 하면, AL이 14팀이고 14개의 구장이 있으므로 다음과 같이 계산할 수 있습니다.

      (Y*14)/((Y+R*13))

      위의 식은 Yankees가 전체 AL 구장을 돌면서 득점/실점한 수준(분모)에 비해 홈에서만 전경기를 치른다고 했을 때의 득점/실점 수준(분자) 비율이 되겠지요.

      이제 이 식을 다음과 같이 변형합니다.

      ((Y*14)/((Y+R*13))+1)/2

      실제 시즌에서 홈경기와 원정경기가 절반씩이므로 이를 보정한 것입니다.

      여기에 regression을 해 줍니다. 샘플 사이즈가 작을수록 신뢰할 수 없는 데이터가 되므로, 계산시 반영 비율을 적당히 축소하는 것입니다. 이제 계산식이 아래와 같이 바뀝니다.

      1-(1-((Y*14)/((Y+R*13))+1)/2)*X

      여기에서 X가 regression을 위한 변수입니다. 1년간의 데이터라면 0.6, 2년간의 데이터라면 0.7, 3년은 0.8, 4년 이상은 0.9를 곱해 줍니다.

      여기까지의 계산식은 1을 중립으로 보았을 때의 값입니다. 100을 중립으로 놓는 경우도 많은데.. 결과값에 단순히 100을 곱해 주면 되겠죠.

      이 계산 방법은 아래 링크에 자세히 소개되어 있습니다.
      http://gosu02.tripod.com/id103.html

      득점 뿐 아니라 홈런이나 2루타 등에 대한 Park Factor도 같은 방식으로 계산이 가능합니다.

      ESPN의 Park Factor는 계산식이 좀 더 단순하게 되어 있는데요... 분모를 그냥 원정경기 득점 수준으로만 계산하고 있습니다. 바람직한 계산은 아니라고 생각하는데요... 이 숫자를 그대로 쓰더라도 단지 1년간의 데이터이므로 어느 정도 regression이 필요합니다. ESPN에 의하면 양키스타디움의 홈런팩터는 1.537 이므로 위 계산식에 의하여 1-(1-1.537)*0.6 = 1.322 가 조정 홈런 팩터가 됩니다. 여러 해의 데이터를 사용한다면 좀 더 신뢰할 만한 결과를 얻을 수 있겠지요. 참고로 Fangraphs는 5년간의 누적 데이터를 사용합니다.

      Park Factor는 진작부터 쓰고 싶었던 주제인데 시간이 잘 나지 않아서 다루지 못하고 있었습니다. 이 댓글을 조금 보강해서 아예 포스팅을 하도록 하겠습니다. 질문해주신 덕에 관련 글을 쓰게 되네요... 감사합니다. ^^

  3. 2010.08.27 13:33 Address Modify/Delete Reply

    비밀댓글입니다

  4. 위즈 2011.03.19 08:14 Address Modify/Delete Reply

    오랜만에 방문합니다.^^
    그동안 FIP에 대해 생각해본 것이 있어서 의견을 좀 나누고자..ㅎ;;
    FIP가 수비로 인한 부분을 배제한다고 했는데요. 만약 각각 다른 팀에 소속된 투수들이 아닌, 한 팀에 소속된 투수들간의 비교라면 평균자책점, whip, FIP가 어느 정도 비슷한 양상으로 나타나야 하지 않을까 생각해 보았습니다.

    흔히들 수비에는 기복이 없다고들 합니다. 1년 내내 같은 팀에서 로테이션에 속해 있었던 투수들은 대동소이한 수비지원을 받았다고 생각해도 무방할 듯 한데요. 그렇다면 위에 말씀드린 세 가지 지표가 비슷한 양상을 보여야 하지 않을까요? 적어도 순서 척도로 봤을때 대소 관계 정도는 맞아 떨어져야 하지 않을까 싶은데요.

    실제로 그 양상을 찾아봤을땐 제각각입니다. 그 양상이 어찌나오든, 평균자책점과 whip가 앞서 말씀드렸듯이 한 시즌 동안 같은 팀의 로테이션에서 뛰었던 투수들 간의 비교에는 의미가 있다는 생각이 드네요.

    • BlogIcon FreeRedbird 2011.03.22 14:21 신고 Address Modify/Delete

      비슷한 양상을 보인다는 것은 어떤 의미이신지요? 투수간 능력이 다르니 FIP는 투수마다 다를 수밖에 없고요. ERA나 WHIP도 마찬가지이겠지요. 혹시 E-F(ERA-FIP)를 말씀하시나요?

      예를 들어 같은 팀에서 뛴 선발투수라면(구원투수는 이닝수가 적어 부적당합니다) E-F가 유사해야 한다고 생각할 수 있습니다만, ERA를 결정하는 것은 수비나 구장 효과가 전부는 아니니까요. BABIP의 변동이라든지(여기에는 운이 많이 개입되지요), 투수 본인의 그라운드볼 성향 같은 것도 영향을 미치게 됩니다. 그러니 반드시 같은 팀이라고 유사한 E-F 값을 가지리라는 보장은 없습니다.

  5. 위즈 2011.03.22 16:47 Address Modify/Delete Reply

    답변 감사드립니다. 제가 글 재주가 없다보니 명확히 전달이 안되었네요.^^
    제가 말씀드린 것은 FIP가 수비로 인한 부분을 배제하는데 의의가 있으니 같은 팀에 소속된 투수들끼리의 비교에서는 굳이 수비로 인한 부분을 배제할 필요가 없지 않겠냐하는 것이었습니다. (물론 말씀하신대로 로테이션에 속해있는 투수들 간의 비교에서요.)

    비슷한 양상을 보여야 한다는 것은 만약 한 팀의 1선발에서 5선발 쪽으로 갈수록 ERA가 높게 나왔다면, FIP도 이와 비슷하게 1선발에서 5선발 쪽으로 갈수록 높게 나와야 하지 않냐는 것이지요.

    • BlogIcon FreeRedbird 2011.04.04 14:03 신고 Address Modify/Delete

      답변이 늦었네요. ^^ 리그 전체로 보면 ERA와 FIP는 물론 비례합니다. 말씀하신 부분은 같은 팀의 선발투수 5명인데... 5 라는 숫자는 통계적으로 거의 무의미한 작은 표본이므로 5명에게 항상 일정한 경향이 나타나기를 기대하는 것은 무리인 것 같습니다. 그리고 위의 답변에서 말씀드렸듯이 Batted Ball의 운명에는 수비만 개입하는 것이 아니라 투수 개개인의 "운"이 많이 작용하고요. 얼마나 그라운드볼을 많이 유도하느냐에 따라 수비에 대한 의존도도 달라지기 때문에, 같은 팀이라고 해서 수비를 반영하거나 하지 않거나 마찬가지의 결과를 얻을 것이라고 기대하기는 어렵습니다.

  6. BlogIcon aslkjdqwe 2011.09.28 21:56 신고 Address Modify/Delete Reply

    맷 케인, 바스케스, 글래빈, 매덕스, 모로우등은 FIP을 신봉하는 사람들 입장에선 달갑지 않겠네요. FIP의 단점을 메꾼다고 만든 tRA나 SIERA 역시 FIP과 마찬가지로 예외적인 선수들을 배척하네요. 예외가 이렇게 많아서야...좋은 FIP이 좋은 결과(ERA,RA)를 만드는 데 도움이 되는 건 맞지만 여전히 놓치는 게 너무 많은 스탯이란 건 변함이 없는 것 같네요.

    • BlogIcon FreeRedbird 2011.09.28 23:39 신고 Address Modify/Delete

      말씀하신 투수들은 모두 FIP의 예외적인 투수들에 해당하고요. 하지만 달갑지 않다기보다는 FIP 이외에도 더 고려해 주어야 할 것이 있다는 것을 일깨워주는 존재들이라고 생각합니다. 투수는 여러 스탯을 이용해서 평가를 하는 것이 더 좋겠지요. 애초에 투수를 수비나 운으로부터 완전히 분리하는 것이 불가능하기에, 어떻게 평가를 하더라도 약간의 사각지대는 생길 수밖에 없습니다.

      하지만 FIP가 놓치는 게 많다는 말씀에는 동의하기가 어려운데요. 인플레이된 타구를 통째로 제외한다고 해도 놓치는 것은 그다지 많지 않습니다. 아래 링크의 두 번째 표를 보시죠.
      http://www.fangraphs.com/blogs/index.php/new-siera-part-four-of-five-testing/

      업그레이드 된 SIERA가 RMSE 1.04로 가장 우수하고요. kwERA가 1.05, xFIP와 bbFIP가 1.06, FIP가 1.12 입니다. ERA는 1.29죠. 당연히 ERA보다 더 후진 스탯은 비교대상에 없습니다. (ERA의 단점을 보완하고자 계속 새로운 지표를 개발하는 것인데 ERA보다도 못하다면 존재 의미가 없죠.)

      간단하면서도 효율적이라는 면에서 FIP는 매우 우수한 스탯입니다. 심지어 홈런조차 빼버리고 삼진과 볼넷만으로 계산하는 kwERA(이름은 ERA지만 이것은 FIP의 컨셉에 가까운 스탯입니다)가 훨씬 복잡한 SIERA와 거의 같은 수준의 정확도를 가지고 있다는 것은 의미심장하다고 생각됩니다.

      kwERA와 bbFIP에 대해서는 시즌이 끝나는 대로 별도 포스팅하도록 하겠습니다.

  7. 쵱휴여 2012.04.26 16:23 Address Modify/Delete Reply

    좋은글 잘 보았습니다.

    한가지 궁금한게 있는데 FIP를 구할 때 홈런이 들어가는데 홈런중에서 인사이드 파크 홈런은 포함인가요? 제외인가요?

    나름 검색을 해보기는 했는데 잘 모르겠네요~

    기본적으로 빠지는게 FIP의 이념상 맞겠지만, 포함된다면 그 빈도가 낮아 유의미하지 않다고 판단해서 일것 같긴 합니다.

    • BlogIcon FreeRedbird 2012.04.26 17:44 신고 Address Modify/Delete

      인사이드파크 홈런을 제외하고 FIP를 산출하는 것을 본 적은 없는 것 같습니다. 빠지는 게 정확하겠지만, 말씀하신 것처럼 발생 횟수가 워낙 작기 때문에, 큰 문제는 없을 듯 합니다.

  8. BlogIcon aslkjdqwe 2012.05.06 21:15 신고 Address Modify/Delete Reply

    오늘 프로야구를 보다 문득 궁금한 점이 생겼습니다.
    오늘 심수창 선수가 3이닝 동안 11피안타(1피홈런)으로 부진했는데
    "상대 타자의 컨디션이 유독 좋았다."
    "잡을만한 타구도 있었지만 잡지 못했다."
    "유독 빈공간을 향하는 타구가 많았다."
    라는 식으로 변명한다면 어떤 식으로 답해야할까요?
    합리적인 변명인 거 같기도 하고 이건 좀 아닌 거 같기도하고...
    어중간하게 BABIP니 FIP이니 알게 돼서;;

    • BlogIcon FreeRedbird 2012.05.07 01:52 신고 Address Modify/Delete

      그런 주장은 진짜일 수도 있습니다. 11피안타의 타구의 질을 보는 방법도 있는데.. 이를테면 라인드라이브 타구가 대부분이었다 라고 한다면 운이 없다기보다 공이 별로였을 가능성이 높겠지요. 어쨌든, 한 경기만 가지고 판단하기는 조금 어려울 수도 있습니다. 이후의 경기들에서 잘 던진다면 그런 주장대로 정말 "유독 빈공간을 향하는 타구가 많았"을 가능성이 높고요. 그렇지 않고 매 경기 난타당한다면 그냥 그게 실력인 것이지요. BABIP가 투수의 실력과 별 상관이 없이 대체로 비슷하게 나타난다 라는 것은 일정 이상의 실력을 가진 투수들(미국으로 치면 메이저리거 급)에게만 해당하는 이야기입니다.

  9. 2012.08.18 15:04 Address Modify/Delete Reply

    비밀댓글입니다

    • BlogIcon FreeRedbird 2012.08.19 01:29 신고 Address Modify/Delete

      네. 다른 지구 구장에서도 충분히 많은 경기를 치르기 때문에, 1로 가정하셔도 큰 차이가 없습니다.

  10. asd 2012.10.17 14:02 Address Modify/Delete Reply

    가령 어떤 선수가 9이닝 3볼넷 3탈삼진 완봉승을 거뒀다고 친다면 이 선수는 운이 억세게 좋았던 것인가요? (잘 맞은 타구가 거의 없고요.)

    • BlogIcon FreeRedbird 2012.10.18 00:57 신고 Address Modify/Delete

      그럴 가능성이 있지만 반드시 그렇다고는 할 수 없죠. 원인으로 꼽을 수 있는 것들은..

      1) 운이 좋았다.
      2) 팀 수비력이 매우 뛰어나서 안타성 타구도 다 아웃으로 처리되었다.
      3) Matt Cain처럼 대부분의 투수에게는 없는 특별한 BABIP 관리 능력을 가지고 있다.

      정도인 것 같습니다. 해당팀의 시즌 수비 지표 및 그 투수의 커리어 스탯을 보면 2번과 3번을 판단할 수 있으므로, 2번도 아니고 3번도 아니라면 운이 좋았다고밖에 할 수 없겠지요.

선수를 판단하는 데 있어 세이버메트릭스가 더 유용한지, 구식 방법(소위 Old-School)이 더 나은지의 논쟁을 벌이고 싶은 생각은 없다. 이것은 답도 없거니와 매우 소모적이고 불필요한 논쟁으로 번지기 쉽다. Stat vs Scouting 역시 마찬가지이다.

어느 쪽에 비중을 둘 것인가, 어느 쪽이 더 훌륭한 방법인가의 고민은 각 구단 Front Office에 맡기고... 나는 다만 일반적인 팬들 사이에 퍼져 있는 한 가지 오해에 대해서만 언급하고자 한다. 그것은 세이버메트릭스가 야구 보는 재미를 떨어뜨린다는 것이다.

많은 "전통적 방법"의 옹호자들이 외치곤 한다. "세이버메트릭스는 야구는 사람이 하는 게임이라는 것을 망각한 숫자 놀음에 불과하다. 컴퓨터와 씨름하느니 한 경기라도 직접 더 보는 것이 낫다!" 이것은 오해와 무지에서 비롯된 편견이다.

wOBA 같은 개념을 이해하는 것은 확실히 골치아픈 일이다. FIP 같은 것은 단순한 편이지만 그래도 어떻게 해서 계산이 되는 것인지 수식을 한 번 정도는 들여다보아야 한다. 하지만 컴퓨터로 계산을 좀 한다고 해서 야구 자체가 어떻게 변하는 것은 아니다. 야구는 거기 그대로 있을 뿐이다.  어제까지 재미있게 보던 야구가 오늘 엑셀 가지고 몇 번 계산 좀 했다고 갑자기 재미없어지지는 않는다.


Manny Ramirez를 보자. 뛰어난 타격 능력, 외야에서의 삽질, 재미있는 제스처들, 그리고 어리숙한 발언들까지... "Manny Being Manny"라는 표현까지 나올 만큼, 그는 정말 흥미로운 플레이어이다. 세이버매트릭스는 그의 플레이어로서의 가치를 계량해 준다. 그가 어느 정도로 우수한 타자인지, 그가 얼마나 많은 점수를 외야에서 까먹고 있는지, 숫자로 알려 주는 것이다. (자세한 숫자는 위의 이름을 클릭하여 Fangraphs 페이지를 참고하기 바란다) 그가 2002년부터 2008년까지 외야에서 까먹은 점수가 연간 10점 정도 된다는 것을 알고 나서 그를 보더라도, 그가 여전히 아주 재미있는 플레이어라는 사실은 조금도 변하지 않는다. Career wOBA .420의 강타자라는 것을 알고 보더라도, 그의 다음 타석에서 무슨 일이 일어날 지는 여전히 흥미진진하다.

세이버메트릭스는 야구를 보는 "조금 다른 시각"일 뿐이라고 생각한다. 그것은 다양한 관점에서 야구를 바라보게 하여, 오히려 보는 재미를 몇 배나 증가시켜 준다. 단지 숫자놀음에 불과하다고 생각하고 외면해 왔다면, 한번 세이버메트릭스에 입문해 볼 것을 권한다. 수식을 일일이 다 이해하는 것은 골치아플 뿐 아니라 불필요한 일이기도 하다. 단지 어떠한 아이디어로 그와 같은 새로운 척도가 나오게 되었는지 개념만 잡는 것으로도 충분하다. 그리고 나서 새로운 관점으로 게임을 보게 되면, 분명 이전에 느끼지 못한 새로운 즐거움을 느끼게 될 것이다.
Posted by FreeRedbird

댓글을 달아 주세요

  1. BlogIcon Hadrianius 2010.02.17 14:33 Address Modify/Delete Reply

    세이버에 대해 자세히는 몰라서 확신은 못 내리겠지만, 세이버도 일종의 '도구'에 지나지 않는다고 생각합니다. 이게 진리이니 하고 떠드는 사람들이나 세이버는 숫자로 할 수 있는 가장 쓸데없는 노동이라고 지껄이는 사람이나 다 세이버의 본질에서는 멀다고 봅니다.

    야구를 조금 더 재미있게 보는 방법이라고 할까요. 자신만의 스탯을 만들어서 따로 계산을 할 수도 있는 것이고,그에 따라서 자신이 생각하는 야구를 주장할 수도 있지 않겠습니까. 타율이든 타점이든 출루율이든 RC든 하나의 패러다임이라고 봅니다. 빌 제임스도 그것을 주장하지 않았을까요(이냥반은 거기에 서사적인 이야기까지 붙이지만).

    한가지 질문하고 싶은게, 국내에서 세이버메트리션 관련한 책들은 나온 게 어떤 게 있나요?

    • BlogIcon FreeRedbird 2010.02.17 15:41 신고 Address Modify/Delete

      시대에 따라 유행하는 개념이나 스탯이 바뀌어 온 것은 사실입니다만, 저는 단순히 하나의 패러다임이라고만 보지는 않습니다. 어느 시대이거나, 조금 더 팀 득점과 팀 승리에 기여할 수 있는 방법은 있다고 생각합니다. 이를테면 RPG(Runs Per Game)가 낮은 리그에서는 도루와 같은 작전의 효용이 크게 증가하지만, RPG가 높은 리그에서는 그냥 강공으로 가는 것이 더 유리한 것처럼 말이죠. 만약 야구단의 프런트에서 일을 한다면, 이러한 지식을 가지고 일을 하는 것은 직업적으로 매우 중요하다고 생각됩니다. 요즘은 그런 일이 없을 거라고 생각됩니다만, 타점 같은 스탯에 속아서 선수와 계약해서는 프런트에서 일할 자격이 없죠... 지금 우리가 알고 있는 세이버메트릭스 지식이 진리라고 생각하지는 않고요. 다만 진리에 조금이나마 가까이 가 보고자 하는 소박한 노력의 산물이겠지요. 결국 야구는 인간이 하는 게임이라는 점을 잊어서는 안 되겠습니다.

      그냥 게임을 즐기는 팬의 입장이라면, 사실 꼭 세이버메트릭스를 알아야만 할 필요는 없습니다. 다만 말씀하신 대로 야구를 좀 더 재미있게, 좀 더 풍부하게 즐길 수 있는 방법이라고 봅니다. 아는 만큼 더 즐길 수 있다고나 할까요. 비단 세이버메트릭스에만 해당되는 이야기는 아니라고 생각합니다. 예를 들어 투수의 pitching mechanics에 대해 지식이 있다면, 투수가 공을 던지는 모습을 훨씬 더 흥미롭게 볼 수 있겠죠.

      마지막 질문에 대해 대답을 드리면... 한글로 된 세이버메트릭스 책은 없습니다. 거의 전무하다고 보셔도 될 것 같네요. (Michael Lewis의 "머니볼"은 세이버메트릭스 책이 아닙니다. 오히려 세이버메트릭스에 대한 편견을 조장하는 책이죠.)