올 시즌 5할에 육박하는 초현실적 BABIP를 기록하고 있는 David Wright(3B, NY Mets)


마침 김형준 기자님 블로그에 BABIP 이야기가 올라오기도 했고, 이전에 이 블로그에 "FIP란 무엇인가"라는 글을 쓰면서 나중에 BABIP에 대해 따로 써 보겠다고 한 적도 있는 만큼, 오늘은 BABIP에 대해 몇 자 적어 보고자 한다.


BABIP란 무엇인가?

The Hardball Times의 설명을 보자.

"Batting Average on Balls in Play. This is a measure of the number of batted balls that safely fall in for a hit (not including home runs). The exact formula we use is (H-HR)/(AB-K-HR+SF) This is similar to DER, but from the batter's perspective."


즉... "Balls in Play" 된 경우 중에서만 계산한 타율이라는 의미이다. 여기에서 "Balls in Play"라는 것은 타자가 친 공이 페어 영역(fair territory) 안에 떨어지는 경우만을 뜻한다. 페어 영역에는 관중석이 포함되지 않으므로, BABIP를 계산할 때에는 홈런을 제외해야 한다. HBP, 즉 몸에 맞는 공 같은 것도 역시 제외된다.

위의 공식을 보면 좀 더 의미가 분명해지는데, 먼저 분모를 보면 AB-K-HR+SF 로 되어 있다. 즉 일반적인 At Bat(타수)에서 삼진과 홈런을 제외하고, 희생타를 더한 것이다. 삼진과 홈런은 페어 영역에 공이 떨어진 경우가 아니므로 제외하게 되며, 희생타는 페어 영역에 떨어지는 공임에도 불구하고 타수를 산출할 때 제외되므로 분모에 더해 줌으로써 보정을 해 주는 것이다.

분자는 H-HR 로 전체 안타 갯수에서 홈런을 뺀 것인데, 분모에서 홈런을 뺐으므로 분자에서도 똑같이 빼 주어야 올바른 계산이 된다. 삼진이나 희생타는 애초에 "안타"의 범주에 들어가지 않으므로 분자에서는 더하거나 뺄 필요가 없다.


이 BABIP는 주로 개개인의 성적에 "운"이 얼마나 개입되는지의 척도로 많이 사용된다. 통계적으로 메이저리그 평균 BABIP는 .300 근처로 나타나고 있는데, 투수와 타자의 경우가 좀 다르다. 먼저 투수를 보면...

[자료출처 : Fangraphs]

- Career BABIP -
Tim Wakefield .281
Tom Glavine .286
Jamie Moyer .291
Jason Isringhausen .291
Paul Byrd .293
Brandon Webb .294
박찬호 .296
Mike Mussina .299
CC Sabathia .295
Jeff Suppan .300
Chuck Finley .301
Randy Johnson .302
Curt Schilling .304
Chris Carpenter .304
Cliff Lee .304
Ben Sheets .306
Bob Wickman .306
Kyle Farnsworth .307
Livan Hernandez .310
Brad Lidge .325

(주: 특별한 기준 없이, 그냥 생각나는 대로 찍어서 조사해 본 결과이다. 좋은 선발투수, 보통 선발투수, 구원투수, 은퇴한 투수 등 최대한 다양하게 섞어 보려고 했고, 통계의 신뢰성은 샘플이 커질 수록 높아지므로 되도록 투구수가 많은 베테랑들 위주로 골라 보았다.)

위의 결과를 보면 투수들의 BABIP는 대략 .290대와 .300대에 집중적으로 분포하고 있음을 알 수 있다. 그럼 타자들의 경우는 어떨까??

- Career BABIP -

Mark McGwire .260
Rod barajas .265
Jose Uribe .274
Orlando Carbrera .287
Barry Bonds .288
Adam Dunn .290
Rich Aurilia .298
Miguel Tejada .300
David Ortiz .307
Frank Thomas .310
Frank Catalanotto .317
Juan Pierre .319
Albert Pujols .321
Vladimir Guerrero .322
Julio Franco .337
Todd Helton .341
Ichiro Suzuki .357
Derek Jeter .360

역시 되도록 오래 선수생활을 한 타자들 중에서 생각나는 대로 아무나 찍어서 확인한 결과인데... 투수들의 BABIP 분포에 비해 두드러지게 다양한 모습을 보여주고 있다. 실제로 THT에서도 비슷한 언급을 하고 있음을 알 수 있다.

"We use BABIP to evaluate both pitchers and hitters, but the way in which we use it differs greatly among the two. Most pitchers regress toward the league average BABIP of around .300 or .305. Very few pitchers can repeatedly do better or worse than this, so we say that pitchers have very little control over BABIP.

Hitters, on the other hand, can have a substantial amount of control over BABIP.
Ichiro Suzuki, for example, has a .356 career BABIP. Hitters do not regress toward league average, rather, they each regress toward their own, unique number."

위의 인용문에서, "타자들은 리그 평균에 수렴하기 보다는 각자 자신만의 고유의 숫자로 수렴한다"는 마지막 문장에 주목할 필요가 있다.


BABIP는 그 정의상 타자의 타격 스타일과 수비수들의 수비 능력에 영향을 많이 받을 수밖에 없으며, 투수가 영향을 미칠 수 있는 여지는 별로 없다. 이것은 수비의 영향을 배제한 대표적인 투수 평가 지표인 FIP가 "볼넷, 삼진, 홈런, 몸에 맞는 공" 으로만 계산된다는 점을 고려하면 당연한 것이다. FIP의 계산에 쓰이는 지표들이 BABIP의 계산에서는 모두 배제되고 있음을 주목할 필요가 있다. (FIP에 대해서는 이전 글 참조)

상식적으로 생각해 보아도, 투수가 오래 선수생활을 할 수록 다양한 스타일의 타자를 두루 상대하게 되며, 수비수들의 실력도 좋은 해도 있고 나쁜 해도 있을 것이므로, 시간이 계속 흐르면 결국 투수들의 BABIP는 평균값에 가까워지는 것이 정상일 것이다.

그러나 타자들의 경우는 이야기가 달라진다. 예를 들어 타자 A와 B의 컨택 능력이 똑같고, 게다가 같은 비율로 내야 땅볼을 치고 있다고 하면, 이 내야 땅볼 중 얼마만큼의 비율이 내야 안타가 되는가는 순전히 A와 B의 달리기 실력 차이에 달려 있다고 볼 수 있다. 이러한 차이는 투수의 경우와 달리, 시간이 많이 흐른다고 해서 평균에 수렴하는 종류도 아니고, 심지어 노력한다고 해서 달라지는 것도 아니다. 즉 Mike Lowell같이 느린 플레이어가 매일 저녁마다 달리기 훈련을 한다고 해서, 5년쯤 지나면 Ichiro를 능가하는 스피드를 가지거나 하는 일은 없다는 이야기이다.

BABIP에 영향을 미칠 수 있는 변수는 달리기 실력 이외에도 많다. 예를 들어 극단적인 당겨치기 일변도의 타격을 하는 타자는 아무래도 BABIP에서 손해를 보기가 쉽다. 일단 필드 전체 중에서 공이 떨어지는 범위가 좁고, 또 상대팀이 거기에 맞춰 defensive shift를 하므로 그만큼 안타 발생의 확률이 줄어들기 때문이다. 가장 극단적인 예는 Carlos Delgado로, 그는 보통 때 BABIP가 .284이지만 상대팀이 defensive shift를 하게 되면 BABIP가 .191로 엄청나게 떨어져 버린다. 이정도로 큰 차이라면 상대팀은 매 타석마다 무조건 수비 위치를 옮겨야 할 것이다.

THT의 Chris Dutton은 BABIP에 영향을 미치는 변수로 "HR/FB(플라이볼 대비 홈런 비율), IF/FB(플라이볼 대비 내야플라이 비율), LD%(라인드라이브 비율), GB/FB(플라이볼 대비 그라운드볼 비율), 스피드, 왼손 타자 여부, 타격시 컨택 비율, 타격시 공이 날아가는 범위" 등을 꼽고 있으며, 이 변수들이 구체적으로 각각 얼마나 영향을 미치는가에 대한 연구는 아직 진행중이다. 다만 확실한 것은, 타자들은 투수들에 비해 플레이어 별로 개성적인 BABIP를 가지고 있으므로, 리그 평균인 .300과 비교하기 보다는 각자의 커리어 통산 BABIP를 가지고 비교하는 것이 유용하리라는 것이다. 좀 더 정확도를 높이기 위해 개발된 xBABIP라는 스탯이 또 있지만, 이것은 바로 위에 링크된 Chris Dutton의 글에 나오다시피 아직 개량중이며, 계산식도 일반에게 공개되지 않은 상태이다.


자.. 그럼... 이러한 BABIP를 어떤 경우에 활용할 수 있을까?

가장 쉽고 흔한 예는 역시 해당 플레이어의 현재 기록에 얼마나 "운"이 개입하고 있는지를 보는 것이다. 어느 타자 A가 자신의 커리어 평균과 비교하여 유난히 BABIP 값이 높다면, A가 친 공은 운좋게도 수비수가 없는 곳만 골라서 떨어지고 있다는 의미이다. 어느 투수 B의 BABIP 값이 유난히 높다면, 타자의 경우와는 반대로 운이 나쁘게도 같은 팀 수비수들이 상대 타자들의 타구를 평소보다 잘 잡지 못하고 있다는 의미가 된다.

예를 들어 김형준 기자님 블로그에 언급된 David Wright의 올 시즌 타격 성적을 분석해 보자.

225 AB, 82 H, 4 HR, 60 K, 1 SF
현재 타율 .364로 완전 날아다니고 있는 모습이다. 반면 홈런이 4개밖에 안되는 것이 이상하게 느껴진다.

위의 BABIP 공식에 따라 계산해 보면,
(82-4)/(225-60-4+1) = .481


Fangraphs에서는 .484로 계산이 되어 있는데, 아마도 SF 숫자를 빼지 않은게 아닌가 싶다. THT에서는 .481로 계산이 되어 있는데, THT 쪽의 계산이 맞다고 생각된다.

아무튼... David Wright의 커리어 통산 BABIP는 .352 이므로... 만약 Wright의 BABIP가 .481 대신 .352 였다면 올 시즌 타율이 어떻게 될까?

위의 공식을 변형하면 안타 수는 이렇게 구할 수 있을 것이다.
H = BABIP*(AB-HR-K+SF) + HR

이렇게 해서 얻은 예상 안타 수는 61개. 이를 225 타수로 나누면 타율은 .271로 뚝 떨어진다. 즉, 올 시즌 David Wright는 엄청나게 운이 좋아서 거의 1할 가까운 타율 상승의 혜택을 보고 있다는 의미가 된다.

하지만.. 한편으로 올 시즌 Wright의 HR/FB(홈런/플라이볼) 비율은 6.3%에 불과하다는 점도 생각해 볼 필요가 있다. 그의 커리어 통산 HR/FB 비율은 14.5%이고, 이정도로 큰 차이가 나타날 특별한 이유가 없으므로... 여기에는 반대로 "나쁜 운"이 작용하고 있다고 볼 수 있을 것이다. 메츠의 홈구장 Citi Field의 홈런 Park Factor가 1.151로 홈런이 평균보다 많이 나오는 구장임을 감안하면, 더욱 더 "운이 따르지 않아 홈런이 줄어든 것"이라는 확신이 든다.

그럼 이를 반영하여 예상 타율을 보정해 보자. 6.3% 대신 14.5%의 HR/FB 비율을 적용하면 David Wright의 "정상적인" 홈런 갯수는 9개가 된다. 홈런 갯수를 9개로 바꾸고 BABIP가 커리어 통산과 동일한 .352가 되도록 안타 값을 다시 계산하면 안타 수는 64개가 된다. 이렇게 해서 얻게 되는 최종 타율은 .284이다. 여전히 현재 타율  .364에 비하면 8푼이나 낮은 수치이다. Wright의 높은 타율은 이렇게 엄청난 행운의 결과인 것이다.

.284의 조정 타율은 Wright의 커리어 평균 타율인 .313과 비교하면 상당히 낮은 편인데... 이것은 아마도 올 시즌 유난히 삼진을 많이 당하고 있기 때문인 것으로 생각된다. 라인드라이브 비율 같은 다른 중요 수치들은 그다지 변한 것이 없는데, 올 시즌 타수당 삼진 비율은 26.7%로 커리어 통산 19.4%에 비해 상당히 높게 나타나고 있다. 삼진을 많이 먹으면 타율이 떨어지는 것은 원래 당연한 것인데, 이를 아주 높은 BABIP라는 더 큰 운빨로 커버하고 있는 것이다.

그럼 왜 삼진이 많은 것일까? 2009년 그의 Z-Swing(스트라이크에 방망이를 휘두르는 비율)은 커리어 통산 대비 1% 줄어들었으며, Contact Rate(방망이를 공에 맞추는 비율)도 커리어 통산 대비 2.3% 줄어들었다. 즉 루킹 스트라이크도 늘었고 스윙 스트라이크도 늘었다는 의미가 된다. 이러면 당연히 삼진이 늘어날 수밖에...

종합해 보면, David Wright는 현재 비정상적으로 높은 BABIP에 의해 많은 덕을 보고 있으며, 홈런의 측면에서는 오히려 불운이 따르고 있다. 이러한 "운"은 타자가 스스로 컨트롤하기 어려운 부분이므로, 장타율을 걱정한다거나 다른 생각을 하지 말고 삼진을 덜 당하는 쪽에 집중하는 것이 바람직하다. 그래야 BABIP가 정상적인 수준으로 돌아가더라도 좋은 타율을 유지할 수 있을 것이다.



-----------------------------------


참고로, BABIP를 이용한 흥미로운 다른 연구 결과를 소개한다.

Fangraphs의 Dave Cameron은 1995년부터 2008년까지 14년 간의 메이저리그 전체 데이터를 가지고 홈팀 투수들과 원정팀 투수들의 평균 BABIP에 대한 계산을 수행하였다. 그 결과 다음과 같은 그래프가 나타났다.

(클릭하시면 크게 나옵니다)


원정팀과 홈팀 사이에 일정한 수준으로 계속 차이가 나고 있음을 알 수 있다.

14년 평균값을 비교해보면 원정팀 투수들의 BABIP가 홈팀 투수들보다 0.007 더 높다. 즉 원정팀 투수들이 안타를 조금씩 더 허용하고 있는 것이다. BABIP 0.007의 차이는 보는 시각에 따라 작은 것일 수도 있고 큰 것일 수도 있지만, 위의 그래프처럼 꾸준하게 차이가 벌어진다는 것은 홈 어드밴티지가 실제로 존재한다는 아주 유력한 증거이다...!!!

Posted by FreeRedbird
:

최근 Fangraphs나 The Hardball Times 같은 세이버메트릭스 사이트들에 힘입어 소위 advanced stat 들이 유행하게 되었다. FIP, wOBA, WPA, UZR, tRA 등이 대표적인 예인데, 그 중에서도 특히 많이 쓰이고 있는 것이 바로 FIP 이다.

FIPFielding Independent Pitching의 약어로, 단어 안에 그 의미가 이미 드러나 있다. 즉 "수비와 무관한 투구 stat"이라는 것이다. 자세한 계산 방법은 뒤에서 알아보고, 우선 전통적인 stat의 문제점부터 살펴보자.

전통적으로 사용되는 투수의 stat으로는 W-L, ERA, WHIP 등을 꼽을 수 있겠다. W-L, 즉 승-패는 투수를 평가하는데 거의 아무짝에도 쓸모가 없는 상징적인 숫자에 불과하다. 투수가 아무리 잘 던져도 타선이 뒷받침해주지 않으면 투수는 절대로 승수를 쌓을 수가 없는 것이다. 즉 투수의 승수와 패수는 팀 전체의 합작품이지 투수의 능력을 나타내는 지표가 될 수 없다. (이런 별 의미없는 숫자가 Cy Young 상의 중요 기준이 되고 있는 듯하여 씁쓸하다...)

ERA와 WHIP의 경우는 승-패 만큼 단순하지는 않으므로.. 조금 더 들여다볼 필요가 있다. ERAEarned Runs Average, 즉 평균자책점을 의미한다. ("방어율"이라는 기존의 번역은 의미상 부적절하다.) 여기서 "자책점"은 투수에게 책임이 있는 실점을 의미한다. 즉, 에러 등으로 주자가 출루하지 않고 순전히 안타와 볼넷, 사사구, 보크 등으로 내준 점수를 의미하는 것이다. 그러면 투수가 자책점을 얼마나 내줬는지는 충분히 의미있는 지표가 될 수 있지 않을까? 세이버메트릭스의 답은 "Hell no... 절대 아니다..." 이다.


볼넷이나 사사구는 당연히 투수의 책임이고 여기에 이의를 제기하는 사람은 없다. (스트라이크존이 유난히 넓거나 좁은 특정 심판을 탓할 수도 있겠지만... 그건 통계의 범위를 벗어나는 통제불가능한 변수이므로 따지지 말자.) 논쟁의 핵심은 안타에 있다. 도대체 안타의 어디까지가 투수의 책임일까? 똑같은 타구에 대해서... 좋은 수비수는 공을 잡아서 아웃으로 처리할 수 있지만, 나쁜 수비수는 공을 못잡고 안타로 만들어 버린다. "자책점"의 빌미가 된 안타 중에는 인간의 능력으로는 어쩔 수 없는 아주 잘 맞은 진짜 안타들도 있겠지만, 수비수의 형편없는 수비로 인해 안타가 되어버린 운 좋은 타구들도 제법 들어 있을 수 있는 것이다. 따라서, 안타의 발생 확률은 투수 뒤에 서 있는 수비수들의 수비 능력에 종속되게 되고, 결국 안타를 포함하는 stat으로 투수의 능력을 정확히 평가하기는 어렵다는 결론이 나오게 된다.

WHIPWalks and Hits per Innings Pitched의 약어이다. 우리말로 뭐라고 번역하는 지는 잘 모르겠다. 계산식은 (BB+H)/IP로 매우 단순하다. 투수가 한 이닝에 주자를 얼마나 내보내는지를 볼 수 있다고 해서 한때 각광받던 stat이었다. 그러나, 위의 ERA와 마찬가지로 WHIP도 피안타 수가 직접적으로 결과값에 영향을 미치는 구조를 가지고 있고, 따라서 안타의 수비 종속성에 대한 같은 논리를 통해 투수의 능력을 정확히 평가하기에는 부족하다는 결론을 얻게 된다.

그럼 어떤 대안이 있을까? 세이버메트릭스 진영에서 가장 널리 쓰이고 있는 것이 바로 FIP 이다. 수비수들의 능력과 상관없이 오직 투수만이 관여하는 수치인 삼진, 볼넷(사사구 포함), 홈런 만으로 투수의 진짜 능력을 판별하는 공식을 만들어낸 것이다.

Tom Tango가 개발하고 이후 여러 사람의 손을 거쳐 개량된 FIP의 일반적인 공식은 다음과 같다.

FIP = (13*HR+3*(BB-IBB+HBP)-2K)/IP + 3.20

HR은 홈런, BB는 볼넷, IBB는 고의사구, HBP는 사구(데드볼), IP는 투구 이닝 수를 의미한다.
맨 끝의 3.20은 상수인데... FIP의 결과값을 ERA(또는 RA)과 유사한 스케일로 치환하기 위해 더해 주는 값이며, 이 값은 각 사이트에 따라 자체적으로 조금씩 다른 값을 쓰고 있다.

예를 들어... 박찬호의 전성기였던 1998년과 2000, 2001년 성적을 보자.
1998년: 15승 9패 3.71 ERA, 220 2/3 IP, 1.34 WHIP, 16 HR, 97 BB, 191 K, 1 IBB, 11 HBP
2000년: 18승 10패 3.27 ERA, 226 IP, 1.31 WHIP, 21 HR, 124 BB, 217 K, 4 IBB, 12 HBP
2001년: 15승 11패 3.50 ERA, 234 IP, 1.17 WHIP, 23 HR, 91 BB, 218 K, 1 IBB, 20 HBP


승-패와 ERA만 보면 2000년이 가장 좋았던 것 같이 보인다. WHIP를 본다면 2001년이 더 나은 것 같기도 하고.... 그럼 위의 공식에 따라 FIP를 구해 보면 어떨까?
1998 FIP = 3.87
2000 FIP = 4.24
2001 FIP = 4.02


오히려 1998년이 가장 좋은 것으로 나온다.

Fangraphs의 박찬호 페이지를 보면, FIP 값이 조금 다르게 되어 있다.
1998 FIP = 3.82
2000 FIP = 4.23
2001 FIP = 3.89


이렇게 값이 다른 이유는, Fangraphs가 상수로 3.20을 사용하지 않고 매 년 리그별 평균 실점(RA)을 가지고 적절한 상수를 계산하여 연도별로 조금씩 다르게 적용하고 있기 때문이다. 이렇게 조정된 FIP값을 쓰더라도, 1998년이 가장 좋았고 2000년이 가장 떨어진다는 점에는 변함이 없다.

그럼 왜 2000년의 ERA는 3.27로 가장 낮은데, FIP는 4.23 혹은 4.24로 편차가 크게 나타나는 것일까? 여러 가지 요인이 있을 수 있으나, 2000년의 BABIP(Batting Average on Balls In Play)가 .266으로 낮았다는 것을 생각해 볼 수 있다. 박찬호의 career 평균 BABIP는 .294이고, 이는 메이저리그 평균과 유사한 수치이다. BABIP가 특정한 해에 낮았다는 것은 타자들이 친 공이 유난히 야수 정면으로 가는 일이 많았다든지... 혹은 그 해 수비수들이 유난히 수비를 잘했다든지... 즉 "운"과 "동료들의 특별한 도움"이 작용했음을 의미한다고 볼 수 있다. BABIP에 대해서는 후에 따로 글을 쓰도록 하겠다. 반면 1998년 BABIP는 .298이었다. 이런 차이가 ERA와 FIP의 차이에 한 몫을 했을 것이다. (흥미로운 것은 2001년에도 그의 BABIP가 .266 이었다는 것이다. ERA와 FIP의 괴리에 대해 BABIP 한 가지 만으로는 설명하기 어렵다는 증거가 된다.)

혹 ERA와 FIP의 괴리 현상에 대해 더 많은 정보를 얻고 싶다면 괴리 현상의 대표 격으로 늘상 언급되는 Javier Vasquez에 대한 Fangraphs의 글을 참고하기 바란다.
Posted by FreeRedbird
: