Sabermetrics_Stats

[세이버메트릭스] 그라운드볼의 효과(2)

FreeRedbird 2010. 3. 25. 19:53
우리는 앞의 글에서 Matthew Carruth의 연구를 바탕으로 투수의 그라운드볼 유도 능력이 어떤 영향을 미치는지 살펴본 바 있다. 그런데, Carruth의 연구는 2009년 AL만을 대상으로 하고 있고, 또한 그가 살펴보지 않은 다른 부분들에 대해서도 궁금한 게 많아서, 내가 직접 이 연구를 확장해 보기로 했다.

우선, 연구 대상을 2003년에서 2009년까지의 MLB 투수들 중 100이닝 이상을 던진 시즌으로 확장하였다. 필요한 데이터는 Fangraphs와 Baseball-Reference 사이트에서 긁었다. 이렇게 추린 결과 총 986개의 표본을 얻을 수 있었는데, 대략 1시즌에 140명 정도가 100이닝을 넘기는 것 같다. 또한, Carruth가 살펴본 것 이외의 다른 분야에 대해서도 회귀분석을 통한 상관관계를 살펴보았는데, 대표적인 것으로 그라운드볼과 ROE(Reached On Error, 에러로 타자가 출루하는 것)의 관계 등이 있다.

미리 밝혀두지만, 매우 높은 상관관계, 즉 매우 높은 r 및 r-sqaure값을 기대하면 실망할 것이다. 야구에서 다른 변인을 배제한 채 그라운드볼 비율 하나만 가지고 설명할 수 있는 것은 많지 않은 것이다. 하지만, 대부분의 경우에 비록 상관관계는 적더라도 통계적으로는 유의미한 결과가 나왔다. 2차 회귀분석 같은 것은 실시하지 않았다. (나는 Baseball Prospectus의 덕후들이 아니다...!!)

하나씩 차례차례 보면...


<모든 그래프는 클릭하면 크게 보실 수 있습니다.>

1. 그라운드볼과 실점율(RA) : r = 0.138394, r^2 = 0.019153, RA = -2.03629*GB% + 5.639307

미세하나마 그라운드볼 비율이 높아질수록 실점허용이 조금씩 감소하고 있다. r-square가 0.02에 불과하여 큰 의미를 두기는 어렵지만... (이것은 RA의 변화 중 2%를 GB%로 설명할 수 있다는 이야기가 된다. RA를 결정하는 요소는 GB%이외에도 매우 많다고 이해하면 될 것이다.)

2. 그라운드볼과 ERA : r=0.183638, r^2=0.033723, ERA = -2.53154*GB% + 5.493725

ERA는 RA보다 조금 더 그라운드볼에 영향을 많이 받고(그래봐야 영향력은 여전히 미미한 수준이지만...), 그래프의 기울기가 더 급하게 나타난다. 그라운드볼을 더 많이 유도할 수록 RA가 감소하는 것보다 더 ERA가 감소하는 것이다. 과연 그럴까? ERA/RA를 살펴보자.

3. 그라운드볼과 ERA/RA : r=0.228233, r^2=0.05209, ERA/RA = -0.13672*GB% + 0.983837

이 경우는 앞의 둘에 비해 GB%가 미치는 영향이 더욱 커졌다. 이 정도면 분명히 무시할 수 있는 관계가 아니다. 그라운드볼 유도 경향이 강할수록, RA에 비해 ERA가 크게 감소하는 것이다. 그라운드볼을 많이 유도하는 투수가 상대적으로 ERA에서 이득을 보게 됨을 알 수 있다. 이 현상은 뒤에서 다시 확인하게 될 것이다.

4. 그라운드볼과 FIP : r=0.266894, r^2=0.071233, FIP = -2.88823*GB% + 5.643196

FIP는 어떨까? 앞에서 본 것들보다도 더욱 상관관계가 크게 나타나고 있음을 알 수 있다. 그라운드볼을 많이 유도하면 FIP가 내려가는 것이다. FIP가 인플레이 된 공을 무시하기 때문에 그라운드볼 투수를 과소평가한다는 주장을 하시는 분들이 있는데, 현실은 정 반대임을 알 수 있다. FIP는 그라운드볼 투수에게 호의적이다.

5. 그라운드볼과 에러로 인한 출루(ROE) : r=0.242846, r^2=0.058974, ROE/9 = 0.587465*GB% + 0.104385
그라운드볼은 과연 에러를 증가시킬까? 답은 위에서 보는 바와 같이 YES이다. ROE는 투수마다 이닝수가 다르므로 9이닝당 에러 갯수, 즉 ROE/9로 환산하여 계산하였다. (이 데이터는 B-R 사이트의 구석에 숨어 있고, Play Index에서 리포트로 제공되지도 않아서 찾아서 정리하는데 꽤 애먹었다. -_-;;) 이렇게 해서, 투수의 그라운드볼 유도가 수비수들의 에러를 증가시키고, 그에 따라 비자책점이 증가하여 ERA가 감소한다고 할 수 있겠다.

6. 그라운드볼과 폭투 : r=0.066555, r^2=0.00443, WP/9 = 0.1729*GB% + 0.187465

혹시 투수가 그라운드볼을 유도하기 위해 싱커를 많이 던지면 폭투가 늘어나지 않을까? 라는 의문으로 9이닝당 WP 수와 그라운드볼의 관계를 살펴보았다. 그 결과, 그라운드볼 비율과 폭투는 아무런 상관이 없는 것으로 나타났다.

7. 그라운드볼과 BABIP : r=0.098328, r^2=0.009668, 식 생략(무의미함)

이 분석결과는 나로서는 무척 의외였다. 그라운드볼을 많이 유도하면 안타가 많이 나올 것이고, 따라서 BABIP가 증가할 것이라고 생각했었는데, 분석결과는 그렇지가 않았다. 그라운드볼 비율과 BABIP는 거의 아무 상관이 없다...!!

8. 그라운드볼과 타율 : r=0.044523, r^2=0.001982, 식 생략(무의미함)

타율은 BABIP의 영향을 매우 크게 받으므로, 이러한 결과는 이미 BABIP가 GB%와 별 상관이 없음을 보았을 때 이미 예견할 수 있는 것이다. 투수의 피안타율은, 그라운드볼 비율과는 정말 아무런 상관이 없다.

9. 그라운드볼과 출루율 : r=0.014189, r^2=0.000201, 식 생략(무의미)

투수의 피출루율과 그라운드볼 비율은, 그야말로 전혀 상관이 없었다. 위의 그래프는 아무런 설명이 필요치 않아 보인다.

10. 그라운드볼과 장타율 : r=0.271293, r^2=0.0736, SLG = -0.19846*GB% + 0.512522

드디어, 그라운드볼이 모처럼 제법 영향을 미치는 결과가 나왔다. 그라운드볼이 늘어나면 장타 허용이 감소하는 것이다. 이것은 충분히 예측 가능한 결과인데, 그라운드볼이 라인드라이브나 플라이볼에 비해 장타를 덜 맞는 것은 너무나도 당연한 것이다.

11. 그라운드볼과 타자의 컨택 비율 : r=0.07047, r^2=0.004966, 식 생략(무의미)
이 결과는 나를 놀라게 했다. "그라운드볼 투수"라고 하면 아무래도 맞춰 잡는 유형의 투수일 것 같다는 생각이 들지 않는가?? 그라운드볼을 유도하여 내야수들이 타자 및 주자를 아웃 처리하게 하는 것이 그라운드볼의 큰 목적일 것 같은데... 타자가 공을 맞히는 contact 비율은 그라운드볼 비율과 별 상관이 없었다.

12. 그라운드볼과 삼진 : r=0.167946, r^2=0.028206, K/9 = -3.99764*GB% + 8.071883

그라운드볼 투수는 삼진을 덜 잡을 것 같은 선입견이 있는데... 실제로도 약간은 그런 경향이 있음을 확인할 수 있다. 그라운드볼 비율이 높을 수록, 9이닝당 삼진 비율은 내려간다. 비록 r값이 작지만...

13. 그라운드볼과 볼넷 : r=0.136526, r^2=0.018639, BB/9 = -1.86688*GB% + 3.852966

볼넷은 어떨까? 그라운드볼 투수는 볼넷도 적게 허용하는 것으로 나타났다. 물론 여기서도 K/9와 마찬가지로 상관관계가 큰 것은 아니지만 말이다.

14. 그라운드볼과 제구력(K/BB) : r=0.008614, r^2=0.0000742, 식 생략(무의미)
삼진/볼넷 비율은, 완벽하지는 않지만, 투수의 제구 수준을 살펴보는 매우 유용한 스탯이다. 그런데, 그라운드볼과의 상관관계는 전혀 없었다. 이번에 돌려 본 모든 분석 결과 중에서도 가장 형편없는 상관계수 및 P-value를 얻은 것이다. 위의 그래프를 보면 완전 일직선이지 않은가... 그라운드볼 유도 능력과 제구력은 아무 상관이 없다.

15. 그라운드볼과 피홈런 : r=0.455812, r^2=0.207764, HR/9 = -2.18067*GB% + 2.032465
드디어 그라운드볼이 제법 영향을 미치는 결과를 얻게 되었다. 그라운드볼을 많이 유도하면 피홈런이 감소한다. 이건 너무 당연한 이야기처럼 들리는데... 어쨌든 위에서 보는 바와 같이 실제로 유의미한 관계가 존재함을 알 수 있다.

16. 그라운드볼과 Infield Fly : r=0.411868, r^2=0.169635, IFFY% = -0.17908*GB% + 0.180326
그라운드볼을 많이 유도하면 홈런이 줄어들므로 실점을 그만큼 덜 해야 되는데... 기대한 것 만큼 실점 감소의 효과가 크지는 않다. 한 원인은 앞에서 이미 본 바와 같이 ROE가 증가하는 것이겠지만, 이것만으로는 뭔가 부족한 것 같아서, 또 어떤 다른 게 있을까 곰곰이 생각하다가 혹시 내야플라이가 어떨까 싶어 돌려 보았다. 결과는 위에서 보는 바와 같이, 그라운드볼이 증가할 수록 내야플라이가 감소한다. 내야플라이는 삼진 다음으로 타자의 아웃 처리 가능성이 높은, 투수에게 매우 유리한 결과물이므로, 내야플라이가 감소한다는 것은 실점을 줄이는 데에는 악영향을 미친다. 즉, 투수가 그라운드볼을 유도하면 홈런을 줄이는 이득이 있지만, 내야플라이가 줄어드는 손해도 있는 것이다.

17. 그라운드볼과 패스트볼 구속 : r=0.109629, r^2=0.012018, FBv = 4.712103*GB% + 87.71396
그라운드볼과 관련된 선입견을 하나 더 체크해 보았다. 혹시 패스트볼 구속이 안나오는 투수들이 그 대안으로 싱커를 많이 던저셔 그라운드볼을 많이 유도하고 있는 것은 아닌지? 결과는 위에서 보는 바와 같이, 거의 상관이 없었다. r값이 상당히 낮은데, 굳이 억지로 이야기하지면 오히려 그라운드볼 비율이 높은 투수가 구속도 약간 빨랐다.

18. 그라운드볼과 이닝당 투구수 : r=0.38887, r^2=0.15122, P/IP = -5.60524*GB% + 18.54446

그라운드볼의 이점이 또 무엇이 있을까...? 위의 그래프에서 보는 바와 같이, 그라운드볼을 많이 유도할수록 적은 공을 던져서 이닝을 마무리할 수 있다...!! 삼진도 적고 볼넷도 적으면 당연히 공을 덜 던질 수밖에 없다. 이것은 투수의 스태미너에도 긍정적인 영향을 미칠 것이다.

19. 그라운드볼과 WAR : r=0.213114, r^2=0.045418, WAR = 5.695013*GB% + 0.252346

마지막으로, 그라운드볼과 WAR(Wins Above Replacement Level)의 관계이다. NL 투수들은 타석에서의 삽질로 인해 WAR을 까먹게 되므로, 이 분석은 AL에서만 뛴 425명의 기록을 대상으로 하였다. 그 결과는, r=0.21의 상관관계에서, 그라운드볼을 많이 유도할수록 높은 WAR를 기록한다는 것이다...!!!!!!!!!  이것은 그라운드볼을 유도하는 것이 투수에게, 나아가 팀에게 좋은 전략임을 보여준다.


정리.

그라운드볼을 유도하는 것은 다음에 대해 어느 정도 내지는 상당한 영향을 미친다.
- 피장타율 및 피홈런의 감소
- 내야플라이의 감소
- 이닝 당 투구수의 감소
- ERA/RA의 감소
- FIP의 감소
- WAR의 증가

그라운드볼을 유도하는 것은 다음에 대해 약한 영향을 미친다.

- ERA의 감소
- RA의 감소
- ROE의 증가
- 삼진의 감소
- 볼넷의 감소

그라운드볼은 다음과 아무런 상관이 없다.
- 폭투
- BABIP
- 피안타율
- 피출루율
- K/BB
- Contact%
- 패스트볼 구속


아래는 작업에 사용된 엑셀파일이다. 참고하시기 바란다.