Sabermetrics_Stats

What Is FIP?? (FIP란 무엇인가)

FreeRedbird 2009. 4. 12. 00:11

최근 Fangraphs나 The Hardball Times 같은 세이버메트릭스 사이트들에 힘입어 소위 advanced stat 들이 유행하게 되었다. FIP, wOBA, WPA, UZR, tRA 등이 대표적인 예인데, 그 중에서도 특히 많이 쓰이고 있는 것이 바로 FIP 이다.

FIPFielding Independent Pitching의 약어로, 단어 안에 그 의미가 이미 드러나 있다. 즉 "수비와 무관한 투구 stat"이라는 것이다. 자세한 계산 방법은 뒤에서 알아보고, 우선 전통적인 stat의 문제점부터 살펴보자.

전통적으로 사용되는 투수의 stat으로는 W-L, ERA, WHIP 등을 꼽을 수 있겠다. W-L, 즉 승-패는 투수를 평가하는데 거의 아무짝에도 쓸모가 없는 상징적인 숫자에 불과하다. 투수가 아무리 잘 던져도 타선이 뒷받침해주지 않으면 투수는 절대로 승수를 쌓을 수가 없는 것이다. 즉 투수의 승수와 패수는 팀 전체의 합작품이지 투수의 능력을 나타내는 지표가 될 수 없다. (이런 별 의미없는 숫자가 Cy Young 상의 중요 기준이 되고 있는 듯하여 씁쓸하다...)

ERA와 WHIP의 경우는 승-패 만큼 단순하지는 않으므로.. 조금 더 들여다볼 필요가 있다. ERAEarned Runs Average, 즉 평균자책점을 의미한다. ("방어율"이라는 기존의 번역은 의미상 부적절하다.) 여기서 "자책점"은 투수에게 책임이 있는 실점을 의미한다. 즉, 에러 등으로 주자가 출루하지 않고 순전히 안타와 볼넷, 사사구, 보크 등으로 내준 점수를 의미하는 것이다. 그러면 투수가 자책점을 얼마나 내줬는지는 충분히 의미있는 지표가 될 수 있지 않을까? 세이버메트릭스의 답은 "Hell no... 절대 아니다..." 이다.


볼넷이나 사사구는 당연히 투수의 책임이고 여기에 이의를 제기하는 사람은 없다. (스트라이크존이 유난히 넓거나 좁은 특정 심판을 탓할 수도 있겠지만... 그건 통계의 범위를 벗어나는 통제불가능한 변수이므로 따지지 말자.) 논쟁의 핵심은 안타에 있다. 도대체 안타의 어디까지가 투수의 책임일까? 똑같은 타구에 대해서... 좋은 수비수는 공을 잡아서 아웃으로 처리할 수 있지만, 나쁜 수비수는 공을 못잡고 안타로 만들어 버린다. "자책점"의 빌미가 된 안타 중에는 인간의 능력으로는 어쩔 수 없는 아주 잘 맞은 진짜 안타들도 있겠지만, 수비수의 형편없는 수비로 인해 안타가 되어버린 운 좋은 타구들도 제법 들어 있을 수 있는 것이다. 따라서, 안타의 발생 확률은 투수 뒤에 서 있는 수비수들의 수비 능력에 종속되게 되고, 결국 안타를 포함하는 stat으로 투수의 능력을 정확히 평가하기는 어렵다는 결론이 나오게 된다.

WHIPWalks and Hits per Innings Pitched의 약어이다. 우리말로 뭐라고 번역하는 지는 잘 모르겠다. 계산식은 (BB+H)/IP로 매우 단순하다. 투수가 한 이닝에 주자를 얼마나 내보내는지를 볼 수 있다고 해서 한때 각광받던 stat이었다. 그러나, 위의 ERA와 마찬가지로 WHIP도 피안타 수가 직접적으로 결과값에 영향을 미치는 구조를 가지고 있고, 따라서 안타의 수비 종속성에 대한 같은 논리를 통해 투수의 능력을 정확히 평가하기에는 부족하다는 결론을 얻게 된다.

그럼 어떤 대안이 있을까? 세이버메트릭스 진영에서 가장 널리 쓰이고 있는 것이 바로 FIP 이다. 수비수들의 능력과 상관없이 오직 투수만이 관여하는 수치인 삼진, 볼넷(사사구 포함), 홈런 만으로 투수의 진짜 능력을 판별하는 공식을 만들어낸 것이다.

Tom Tango가 개발하고 이후 여러 사람의 손을 거쳐 개량된 FIP의 일반적인 공식은 다음과 같다.

FIP = (13*HR+3*(BB-IBB+HBP)-2K)/IP + 3.20

HR은 홈런, BB는 볼넷, IBB는 고의사구, HBP는 사구(데드볼), IP는 투구 이닝 수를 의미한다.
맨 끝의 3.20은 상수인데... FIP의 결과값을 ERA(또는 RA)과 유사한 스케일로 치환하기 위해 더해 주는 값이며, 이 값은 각 사이트에 따라 자체적으로 조금씩 다른 값을 쓰고 있다.

예를 들어... 박찬호의 전성기였던 1998년과 2000, 2001년 성적을 보자.
1998년: 15승 9패 3.71 ERA, 220 2/3 IP, 1.34 WHIP, 16 HR, 97 BB, 191 K, 1 IBB, 11 HBP
2000년: 18승 10패 3.27 ERA, 226 IP, 1.31 WHIP, 21 HR, 124 BB, 217 K, 4 IBB, 12 HBP
2001년: 15승 11패 3.50 ERA, 234 IP, 1.17 WHIP, 23 HR, 91 BB, 218 K, 1 IBB, 20 HBP


승-패와 ERA만 보면 2000년이 가장 좋았던 것 같이 보인다. WHIP를 본다면 2001년이 더 나은 것 같기도 하고.... 그럼 위의 공식에 따라 FIP를 구해 보면 어떨까?
1998 FIP = 3.87
2000 FIP = 4.24
2001 FIP = 4.02


오히려 1998년이 가장 좋은 것으로 나온다.

Fangraphs의 박찬호 페이지를 보면, FIP 값이 조금 다르게 되어 있다.
1998 FIP = 3.82
2000 FIP = 4.23
2001 FIP = 3.89


이렇게 값이 다른 이유는, Fangraphs가 상수로 3.20을 사용하지 않고 매 년 리그별 평균 실점(RA)을 가지고 적절한 상수를 계산하여 연도별로 조금씩 다르게 적용하고 있기 때문이다. 이렇게 조정된 FIP값을 쓰더라도, 1998년이 가장 좋았고 2000년이 가장 떨어진다는 점에는 변함이 없다.

그럼 왜 2000년의 ERA는 3.27로 가장 낮은데, FIP는 4.23 혹은 4.24로 편차가 크게 나타나는 것일까? 여러 가지 요인이 있을 수 있으나, 2000년의 BABIP(Batting Average on Balls In Play)가 .266으로 낮았다는 것을 생각해 볼 수 있다. 박찬호의 career 평균 BABIP는 .294이고, 이는 메이저리그 평균과 유사한 수치이다. BABIP가 특정한 해에 낮았다는 것은 타자들이 친 공이 유난히 야수 정면으로 가는 일이 많았다든지... 혹은 그 해 수비수들이 유난히 수비를 잘했다든지... 즉 "운"과 "동료들의 특별한 도움"이 작용했음을 의미한다고 볼 수 있다. BABIP에 대해서는 후에 따로 글을 쓰도록 하겠다. 반면 1998년 BABIP는 .298이었다. 이런 차이가 ERA와 FIP의 차이에 한 몫을 했을 것이다. (흥미로운 것은 2001년에도 그의 BABIP가 .266 이었다는 것이다. ERA와 FIP의 괴리에 대해 BABIP 한 가지 만으로는 설명하기 어렵다는 증거가 된다.)

혹 ERA와 FIP의 괴리 현상에 대해 더 많은 정보를 얻고 싶다면 괴리 현상의 대표 격으로 늘상 언급되는 Javier Vasquez에 대한 Fangraphs의 글을 참고하기 바란다.