BABIP란 무엇인가 : David Wright의 2009 시즌 타격 성적 분석
Sabermetrics_Stats 2009. 6. 17. 18:45 |
올 시즌 5할에 육박하는 초현실적 BABIP를 기록하고 있는 David Wright(3B, NY Mets)
마침 김형준 기자님 블로그에 BABIP 이야기가 올라오기도 했고, 이전에 이 블로그에 "FIP란 무엇인가"라는 글을 쓰면서 나중에 BABIP에 대해 따로 써 보겠다고 한 적도 있는 만큼, 오늘은 BABIP에 대해 몇 자 적어 보고자 한다.
BABIP란 무엇인가?
The Hardball Times의 설명을 보자.
"Batting Average on Balls in Play. This is a measure of the number of batted balls that safely fall in for a hit (not including home runs). The exact formula we use is (H-HR)/(AB-K-HR+SF) This is similar to DER, but from the batter's perspective."
즉... "Balls in Play" 된 경우 중에서만 계산한 타율이라는 의미이다. 여기에서 "Balls in Play"라는 것은 타자가 친 공이 페어 영역(fair territory) 안에 떨어지는 경우만을 뜻한다. 페어 영역에는 관중석이 포함되지 않으므로, BABIP를 계산할 때에는 홈런을 제외해야 한다. HBP, 즉 몸에 맞는 공 같은 것도 역시 제외된다.
위의 공식을 보면 좀 더 의미가 분명해지는데, 먼저 분모를 보면 AB-K-HR+SF 로 되어 있다. 즉 일반적인 At Bat(타수)에서 삼진과 홈런을 제외하고, 희생타를 더한 것이다. 삼진과 홈런은 페어 영역에 공이 떨어진 경우가 아니므로 제외하게 되며, 희생타는 페어 영역에 떨어지는 공임에도 불구하고 타수를 산출할 때 제외되므로 분모에 더해 줌으로써 보정을 해 주는 것이다.
분자는 H-HR 로 전체 안타 갯수에서 홈런을 뺀 것인데, 분모에서 홈런을 뺐으므로 분자에서도 똑같이 빼 주어야 올바른 계산이 된다. 삼진이나 희생타는 애초에 "안타"의 범주에 들어가지 않으므로 분자에서는 더하거나 뺄 필요가 없다.
이 BABIP는 주로 개개인의 성적에 "운"이 얼마나 개입되는지의 척도로 많이 사용된다. 통계적으로 메이저리그 평균 BABIP는 .300 근처로 나타나고 있는데, 투수와 타자의 경우가 좀 다르다. 먼저 투수를 보면...
[자료출처 : Fangraphs]
- Career BABIP -
Tim Wakefield .281
Tom Glavine .286
Jamie Moyer .291
Jason Isringhausen .291
Paul Byrd .293
Brandon Webb .294
박찬호 .296
Mike Mussina .299
CC Sabathia .295
Jeff Suppan .300
Chuck Finley .301
Randy Johnson .302
Curt Schilling .304
Chris Carpenter .304
Cliff Lee .304
Ben Sheets .306
Bob Wickman .306
Kyle Farnsworth .307
Livan Hernandez .310
Brad Lidge .325
(주: 특별한 기준 없이, 그냥 생각나는 대로 찍어서 조사해 본 결과이다. 좋은 선발투수, 보통 선발투수, 구원투수, 은퇴한 투수 등 최대한 다양하게 섞어 보려고 했고, 통계의 신뢰성은 샘플이 커질 수록 높아지므로 되도록 투구수가 많은 베테랑들 위주로 골라 보았다.)
위의 결과를 보면 투수들의 BABIP는 대략 .290대와 .300대에 집중적으로 분포하고 있음을 알 수 있다. 그럼 타자들의 경우는 어떨까??
- Career BABIP -
Rod barajas .265
Jose Uribe .274
Orlando Carbrera .287
Barry Bonds .288
Adam Dunn .290
Rich Aurilia .298
Miguel Tejada .300
David Ortiz .307
Frank Thomas .310
Frank Catalanotto .317
Juan Pierre .319
Albert Pujols .321
Vladimir Guerrero .322
Julio Franco .337
Todd Helton .341
Ichiro Suzuki .357
Derek Jeter .360
역시 되도록 오래 선수생활을 한 타자들 중에서 생각나는 대로 아무나 찍어서 확인한 결과인데... 투수들의 BABIP 분포에 비해 두드러지게 다양한 모습을 보여주고 있다. 실제로 THT에서도 비슷한 언급을 하고 있음을 알 수 있다.
"We use BABIP to evaluate both pitchers and hitters, but the way in which we use it differs greatly among the two. Most pitchers regress toward the league average BABIP of around .300 or .305. Very few pitchers can repeatedly do better or worse than this, so we say that pitchers have very little control over BABIP.
Hitters, on the other hand, can have a substantial amount of control over BABIP. Ichiro Suzuki, for example, has a .356 career BABIP. Hitters do not regress toward league average, rather, they each regress toward their own, unique number."
위의 인용문에서, "타자들은 리그 평균에 수렴하기 보다는 각자 자신만의 고유의 숫자로 수렴한다"는 마지막 문장에 주목할 필요가 있다.
BABIP는 그 정의상 타자의 타격 스타일과 수비수들의 수비 능력에 영향을 많이 받을 수밖에 없으며, 투수가 영향을 미칠 수 있는 여지는 별로 없다. 이것은 수비의 영향을 배제한 대표적인 투수 평가 지표인 FIP가 "볼넷, 삼진, 홈런, 몸에 맞는 공" 으로만 계산된다는 점을 고려하면 당연한 것이다. FIP의 계산에 쓰이는 지표들이 BABIP의 계산에서는 모두 배제되고 있음을 주목할 필요가 있다. (FIP에 대해서는 이전 글 참조)
상식적으로 생각해 보아도, 투수가 오래 선수생활을 할 수록 다양한 스타일의 타자를 두루 상대하게 되며, 수비수들의 실력도 좋은 해도 있고 나쁜 해도 있을 것이므로, 시간이 계속 흐르면 결국 투수들의 BABIP는 평균값에 가까워지는 것이 정상일 것이다.
그러나 타자들의 경우는 이야기가 달라진다. 예를 들어 타자 A와 B의 컨택 능력이 똑같고, 게다가 같은 비율로 내야 땅볼을 치고 있다고 하면, 이 내야 땅볼 중 얼마만큼의 비율이 내야 안타가 되는가는 순전히 A와 B의 달리기 실력 차이에 달려 있다고 볼 수 있다. 이러한 차이는 투수의 경우와 달리, 시간이 많이 흐른다고 해서 평균에 수렴하는 종류도 아니고, 심지어 노력한다고 해서 달라지는 것도 아니다. 즉 Mike Lowell같이 느린 플레이어가 매일 저녁마다 달리기 훈련을 한다고 해서, 5년쯤 지나면 Ichiro를 능가하는 스피드를 가지거나 하는 일은 없다는 이야기이다.
BABIP에 영향을 미칠 수 있는 변수는 달리기 실력 이외에도 많다. 예를 들어 극단적인 당겨치기 일변도의 타격을 하는 타자는 아무래도 BABIP에서 손해를 보기가 쉽다. 일단 필드 전체 중에서 공이 떨어지는 범위가 좁고, 또 상대팀이 거기에 맞춰 defensive shift를 하므로 그만큼 안타 발생의 확률이 줄어들기 때문이다. 가장 극단적인 예는 Carlos Delgado로, 그는 보통 때 BABIP가 .284이지만 상대팀이 defensive shift를 하게 되면 BABIP가 .191로 엄청나게 떨어져 버린다. 이정도로 큰 차이라면 상대팀은 매 타석마다 무조건 수비 위치를 옮겨야 할 것이다.
THT의 Chris Dutton은 BABIP에 영향을 미치는 변수로 "HR/FB(플라이볼 대비 홈런 비율), IF/FB(플라이볼 대비 내야플라이 비율), LD%(라인드라이브 비율), GB/FB(플라이볼 대비 그라운드볼 비율), 스피드, 왼손 타자 여부, 타격시 컨택 비율, 타격시 공이 날아가는 범위" 등을 꼽고 있으며, 이 변수들이 구체적으로 각각 얼마나 영향을 미치는가에 대한 연구는 아직 진행중이다. 다만 확실한 것은, 타자들은 투수들에 비해 플레이어 별로 개성적인 BABIP를 가지고 있으므로, 리그 평균인 .300과 비교하기 보다는 각자의 커리어 통산 BABIP를 가지고 비교하는 것이 유용하리라는 것이다. 좀 더 정확도를 높이기 위해 개발된 xBABIP라는 스탯이 또 있지만, 이것은 바로 위에 링크된 Chris Dutton의 글에 나오다시피 아직 개량중이며, 계산식도 일반에게 공개되지 않은 상태이다.
자.. 그럼... 이러한 BABIP를 어떤 경우에 활용할 수 있을까?
가장 쉽고 흔한 예는 역시 해당 플레이어의 현재 기록에 얼마나 "운"이 개입하고 있는지를 보는 것이다. 어느 타자 A가 자신의 커리어 평균과 비교하여 유난히 BABIP 값이 높다면, A가 친 공은 운좋게도 수비수가 없는 곳만 골라서 떨어지고 있다는 의미이다. 어느 투수 B의 BABIP 값이 유난히 높다면, 타자의 경우와는 반대로 운이 나쁘게도 같은 팀 수비수들이 상대 타자들의 타구를 평소보다 잘 잡지 못하고 있다는 의미가 된다.
예를 들어 김형준 기자님 블로그에 언급된 David Wright의 올 시즌 타격 성적을 분석해 보자.
225 AB, 82 H, 4 HR, 60 K, 1 SF
현재 타율 .364로 완전 날아다니고 있는 모습이다. 반면 홈런이 4개밖에 안되는 것이 이상하게 느껴진다.
위의 BABIP 공식에 따라 계산해 보면,
(82-4)/(225-60-4+1) = .481
Fangraphs에서는 .484로 계산이 되어 있는데, 아마도 SF 숫자를 빼지 않은게 아닌가 싶다. THT에서는 .481로 계산이 되어 있는데, THT 쪽의 계산이 맞다고 생각된다.
아무튼... David Wright의 커리어 통산 BABIP는 .352 이므로... 만약 Wright의 BABIP가 .481 대신 .352 였다면 올 시즌 타율이 어떻게 될까?
위의 공식을 변형하면 안타 수는 이렇게 구할 수 있을 것이다.
H = BABIP*(AB-HR-K+SF) + HR
이렇게 해서 얻은 예상 안타 수는 61개. 이를 225 타수로 나누면 타율은 .271로 뚝 떨어진다. 즉, 올 시즌 David Wright는 엄청나게 운이 좋아서 거의 1할 가까운 타율 상승의 혜택을 보고 있다는 의미가 된다.
하지만.. 한편으로 올 시즌 Wright의 HR/FB(홈런/플라이볼) 비율은 6.3%에 불과하다는 점도 생각해 볼 필요가 있다. 그의 커리어 통산 HR/FB 비율은 14.5%이고, 이정도로 큰 차이가 나타날 특별한 이유가 없으므로... 여기에는 반대로 "나쁜 운"이 작용하고 있다고 볼 수 있을 것이다. 메츠의 홈구장 Citi Field의 홈런 Park Factor가 1.151로 홈런이 평균보다 많이 나오는 구장임을 감안하면, 더욱 더 "운이 따르지 않아 홈런이 줄어든 것"이라는 확신이 든다.
그럼 이를 반영하여 예상 타율을 보정해 보자. 6.3% 대신 14.5%의 HR/FB 비율을 적용하면 David Wright의 "정상적인" 홈런 갯수는 9개가 된다. 홈런 갯수를 9개로 바꾸고 BABIP가 커리어 통산과 동일한 .352가 되도록 안타 값을 다시 계산하면 안타 수는 64개가 된다. 이렇게 해서 얻게 되는 최종 타율은 .284이다. 여전히 현재 타율 .364에 비하면 8푼이나 낮은 수치이다. Wright의 높은 타율은 이렇게 엄청난 행운의 결과인 것이다.
.284의 조정 타율은 Wright의 커리어 평균 타율인 .313과 비교하면 상당히 낮은 편인데... 이것은 아마도 올 시즌 유난히 삼진을 많이 당하고 있기 때문인 것으로 생각된다. 라인드라이브 비율 같은 다른 중요 수치들은 그다지 변한 것이 없는데, 올 시즌 타수당 삼진 비율은 26.7%로 커리어 통산 19.4%에 비해 상당히 높게 나타나고 있다. 삼진을 많이 먹으면 타율이 떨어지는 것은 원래 당연한 것인데, 이를 아주 높은 BABIP라는 더 큰 운빨로 커버하고 있는 것이다.
그럼 왜 삼진이 많은 것일까? 2009년 그의 Z-Swing(스트라이크에 방망이를 휘두르는 비율)은 커리어 통산 대비 1% 줄어들었으며, Contact Rate(방망이를 공에 맞추는 비율)도 커리어 통산 대비 2.3% 줄어들었다. 즉 루킹 스트라이크도 늘었고 스윙 스트라이크도 늘었다는 의미가 된다. 이러면 당연히 삼진이 늘어날 수밖에...
종합해 보면, David Wright는 현재 비정상적으로 높은 BABIP에 의해 많은 덕을 보고 있으며, 홈런의 측면에서는 오히려 불운이 따르고 있다. 이러한 "운"은 타자가 스스로 컨트롤하기 어려운 부분이므로, 장타율을 걱정한다거나 다른 생각을 하지 말고 삼진을 덜 당하는 쪽에 집중하는 것이 바람직하다. 그래야 BABIP가 정상적인 수준으로 돌아가더라도 좋은 타율을 유지할 수 있을 것이다.
-----------------------------------
참고로, BABIP를 이용한 흥미로운 다른 연구 결과를 소개한다.
Fangraphs의 Dave Cameron은 1995년부터 2008년까지 14년 간의 메이저리그 전체 데이터를 가지고 홈팀 투수들과 원정팀 투수들의 평균 BABIP에 대한 계산을 수행하였다. 그 결과 다음과 같은 그래프가 나타났다.
(클릭하시면 크게 나옵니다)
원정팀과 홈팀 사이에 일정한 수준으로 계속 차이가 나고 있음을 알 수 있다.
14년 평균값을 비교해보면 원정팀 투수들의 BABIP가 홈팀 투수들보다 0.007 더 높다. 즉 원정팀 투수들이 안타를 조금씩 더 허용하고 있는 것이다. BABIP 0.007의 차이는 보는 시각에 따라 작은 것일 수도 있고 큰 것일 수도 있지만, 위의 그래프처럼 꾸준하게 차이가 벌어진다는 것은 홈 어드밴티지가 실제로 존재한다는 아주 유력한 증거이다...!!!
'Sabermetrics_Stats' 카테고리의 다른 글
[세이버메트릭스] 타자의 공격력 계산하기 : OPS, OPS+, GPA, RC, RC/27, EqA, wOBA, wRAA (23) | 2009.08.25 |
---|---|
희생번트는 정말 득점에 도움이 될까?? (8) | 2009.08.05 |
Pythagorean Record란 무엇인가 : 기대 승률, 실제 승률, 그리고 운빨 (6) | 2009.06.30 |
What Is FIP?? (FIP란 무엇인가) (19) | 2009.04.12 |
Sabermetrics를 위한 변명 (2) | 2009.04.09 |