[세이버메트릭스] 수비 스탯 : FPct, RF, ZR, UZR, TZ, +/-(Fielding Bible)
타격 스탯과 Replacement Level에 이어, 이번에는 수비 스탯을 살펴보고자 한다.
1. FPct : Fielding Percentage
가장 단순하고 오랜 역사를 가지고 있으나 그만큼 엉성한 스탯이다. 단순히 해당 수비수가 얼마나 에러를 안 내고 수비했는지를 보여준다. 식은 아래와 같다.
FPct = (A+PO)/(A+PO+E)
A: Assists(다른 곳에서 아웃이 될 수 있도록 공을 던져준 것)
PO: Putouts(수비수 스스로 아웃을 기록한 것)
E: Error
당연히 에러를 안 내는 것이 좋은 수비이기는 하나... 에러를 안 내는 것이 전부가 아니라는 게 문제이다. 예를 들어, 수비수가 아무 것도 안 하고 가만히 서 있기만 해도 위의 식에 의하면 1.000으로 퍼펙트한 FPct를 얻을 수 있다. 날아오는 공에 손대지 않고 계속 가만히 있으면 모든 공이 다 안타로 처리될 뿐, 수비수의 에러가 되지는 않기 때문이다. 즉, 이 스탯은 단지 에러 발생만을 체크할 뿐, 수비수가 얼마나 넓은 범위를 커버하고 있는지 등에 대해서는 알 길이 없다.
2. RF : Range Factor
RF는 Bill James의 작품이다. FPct와는 달리 수비수가 실제로 얼마나 아웃을 만들기 위한 플레이에 관여했는지를 측정하기 위해 만들어졌다. 식은 아래와 같다.
RF = (PO+A)*9/Inn
Inn: Innings Played
단순한 식으로 계산이 쉽다는 막강한 장점이 있긴 한데... 너무 단순하다는 것도 문제가 된다. 실제로 몇 번의 수비 기회가 있었는지를 따지지 않고 결과적으로 아웃이 되거나 어시스트가 된 숫자만을 따지다 보니... 단지 우연히 많은 공이 자신에게 날아왔을 뿐인 수비수의 경우 본의 아니게(?) 좋은 RF 값을 가지게 된다. 게다가, 이름에서 알 수 있듯이 수비수의 수비 범위(Range)를 평가하기 위해 고안되었음에도 불구하고, 병살과 같이 Range와 별 상관없는 아웃을 구분하지 않음으로써 오차를 발생시키고 있다.
3. ZR : Zone Rating
Zone Rating은 80년대 말에 STAT,Inc.의 John Dewan에 의해 개발되었으며, 이후 2000년대 초반이 될 때까지 거의 유일한 "쓸만한 수비 스탯"으로 널리 사용되어 왔다.
먼저 아래의 그림을 보자.
(그림을 클릭하면 크게 볼 수 있음)
우선 필드를 C~X까지 22개의 구역으로 나눈다. (A, B, Y, Z는 파울지역이다)
다음 수비수의 포지션에 따라 각 구역을 "할당"한다.
내야와 외야를 나눠서 보는데, 내야수는 그라운드볼에만 책임이 있는 것으로 간주한다.
1루수는 V~X, 2루수는 O~T, 유격수는 H~L, 3루수는 C~F 지역으로 굴러가는 그라운드볼에 대해 각각 책임을 져야 하는 것이다. 여기서 G, N, U 등의 구역은 아무에게도 책임이 없음을 알 수 있다. 즉, 수비가 어찌할 수 없는 타구가 있다는 점을 인정하는 것이다.
ZR은 기본적으로 각각의 수비수가 자신의 수비 구역에 떨어지는 공 중에서 얼마만큼을 아웃으로 처리했는가의 비율이 된다. 즉,
ZR = 자기 구역에서 아웃 처리한 공/자기 구역에 떨어진 공
그런데 수비 쉬프트 같은 것이 존재하므로, 어떤 때에는 자기 구역이 아닌 곳에서도 아웃을 잡아낼 때가 있을 것이다. 이런 경우는 자기 구역에서 아웃을 처리한 것처럼 간주하여 계산한다. 즉, 자기 구역 이외의 필드에서 아웃을 1개 잡았다면, 분모와 분자에 모두 1을 더해주는 것이다. 이런 방식은 여러 문제점을 야기하는데... 다른 구역에서 아웃을 잡을 정도로 수비 범위가 넓은 수비수가 그 능력을 충분히 인정받지 못하는 결과를 낳게 된다.
그리고, 수비수는 자기 책임 구역 내의 한 점에 서 있다가 공이 날아오면 그 쪽을 향해 뛰어가는 것이므로, 수비수의 정면으로 날아오는 공을 잡는 것과 자기 책임 구역의 맨 구석까지 뛰어가서 다이빙 캐치로 공을 잡는 것은 수비 난이도에 있어서 차원이 다르다고 할 수 있다. 그러나, ZR에서는 이러한 부분이 전혀 고려되지 않는다.
ZR에 대한 자세한 설명은 아래 링크를 참조.
http://www.baseballthinkfactory.org/files/dialed_in/discussion/what_is_zone_rating/
4. UZR : Ultimate Zone Rating
UZR은 ZR의 단점을 보완하기 위하여 Mitchel Lichtman이 개발한 것이다. 그는 인터넷에서 "MGL"이라는 필명으로 잘 알려져 있으며, <The Book>의 공동 저자이기도 하다.
(그림을 클릭하면 크게 볼 수 있음)
UZR은 위의 다이어그램에서 64개의 구역(Zone)을 이용한다. 이것은 모든 페어 지역과 1, 3루 주변의 파울 지역을 포함하는 것이다. 내야수는 그라운드볼에만 책임이 있고, 라인드라이브와 플라이볼은 외야수의 몫이라는 점은 기존의 ZR와 동일하다. 그러나, ZR과 비교하여 가장 큰 차이는, ZR이 단순히 어떤 지역에 날아간 타구의 갯수만을 가지고 계산하는 데 비해, UZR은 특정 구역에 떨어진 공이 얼마만큼의 가치를 가지는가를 점수로 환산한 값(Average Run Value)을 반영하여 계산한다는 것이다. (여기에는 각 구역에 떨어지는 공에 대하여 수비 난이도가 제각기 다르다는, 어찌보면 당연한 생각이 들어가 있다.) 따라서, ZR이 단순히 0과 1 사이의 값을 가지는 데 비해, UZR은 점수(Runs)로 나타나게 된다. 리그 평균은 0점이며, 마이너스는 평균 이하, 플러스는 평균 이상을 의미한다.
예를 들어, Yankees의 Derek Jeter는 2005년 AL 유격수 골드글러브를 수상하였다. 그러나, UZR에 의하면 그의 2005년 유격수 수비는 -12.6으로 나타나고 있는데, 이는 Jeter의 좋지 않은 수비로 인해 평균적인 유격수에 비해 2005년 시즌에 소속팀이 12.6점 더 실점하게 만들었다는 의미이다. Jeter는 오랜 세월동안 세이버메트리션들의 단골 공격대상이었는데, 이는 UZR로 보아도 별로 다르지 않다.
UZR은 2000년대 초에 창안된 이후 MGL 본인에 의해 몇 가지 중요한 부분들이 보완되어 왔는데, 이를테면 구장 효과(park effect)를 적용하여 보정하고, 좌타/우타의 타구 방향이 다른 것을 적용하였으며, 타구의 속도까지 측정하여 반영하였다. 뿐만 아니라, 투수의 그라운드볼/플라이볼 성향이 미치는 영향도 고려하였고, 특정 주자와 아웃의 상황에 따라 타자의 타격 방향이 영향을 받는 것(예를 들어 무사 주자 없음일 때와 무사 주자 1루일 때 타구의 경향이 달라지는 것 등)까지도 반영시켰다. 이쯤되면 꽤 훌륭하게 업그레이드가 된 셈이다. 다만 포수의 수비에 대해서는 아직 좀 부족한 부분이 있는데... 이쪽으로는 Tom Tango 등에 의해 현재도 활발하게 연구가 진행되고 있다.
업그레이드 UZR에 대해서는 아래 참조.
http://www.baseballthinkfactory.org/files/primate_studies/discussion/lichtman_2003-03-14_0/
http://www.baseballthinkfactory.org/files/primate_studies/discussion/lichtman_2003-03-21_0/
5. TZ (혹은 TZR) : Total Zone
Total Zone은 Sean Smith에 의해 탄생하였다. Sean Smith는 대표적인 플레이어 퍼포먼스 예상 툴인 CHONE Projection으로 특히 유명하다.
TZ도 Zone Rating을 개량하고자 하는 시도에 의해 탄생한 것이다. 타구가 누구의 수비 구역에 떨어졌는지, 그리고 해당 수비수가 그 공을 처리했는지가 주 관심 대상이 된다. 그 결과값은 UZR과 유사하게 리그 평균 수비수에 비해 몇 점이나 더 실점을 막았는지, 혹은 실점을 허용했는지를 숫자로 표시해 준다. 어느 해의 TZ값이 +10이라면 1년 동안 수비를 통해 팀이 실점을 10점 덜 하도록 기여했다는 의미이다.
Sean Smith는 그의 사이트(Baseball Projection)에서 TZ를 바로 확인할 수 있도록 작업중이라고 하는데... 아직 완성되지 않은 것 같다. 그는 Retrosheet의 게임 데이터를 가지고 1956년부터 지금까지의 모든 플레이어에 대해 TZ 값을 계산하는 엽기적인 노가다를 하고 있는데, 노가다의 내용에 대해서는 아래 링크를 참고하기 바란다.
http://www.hardballtimes.com/main/article/measuring-defense-for-players-back-to-1956/
노가다의 결과가 궁금하지 않은가? 1986년까지의 결과가 입력되어 있는 아래 엑셀 파일을 받아서 직접 확인해 보기 바란다. 이런 엄청난 파일이 작성자 본인에 의해 인터넷에 공짜로 공개되어 있다는 것은 정말 감동적인 일이 아닐 수 없다.
한편, Sean Smith는 마이너리그 플레이어들에 대해서도 TZ를 적용하는 방대한 작업을 수행하였는데, 그 결과물은 THT의 동료 세이버메트리션인 Jeff Sackmann의 사이트인 Minor League Splits에서 확인할 수 있다.
TZ는 UZR과의 통계적 상관 관계가 괜찮은 편으로 나타나고 있다. 재미있는 것은 Sean Smith 자신도 UZR이 가장 나은 수비 스탯이라고 생각한다는 점이다.
http://www.hardballtimes.com/main/article/measuring-defense-for-players-back-to-1956/
* 참고 : 이후 확인해 본 결과 Sean Smith가 노가다를 완료하여 1871년부터 2008년까지의 모든 자료를 사이트에 업로드해 놓은 것을 발견하였다. PbP 데이터가 없는 1953년 이전 자료에 대해서는 assist, putout, error 등으로 추정했다고 한다. 위의 링크를 클릭하여 Babe Ruth나 Rogers Hornsby와 같은 전설 속의 인물들을 만나 보시기 바란다. 이런 엄청난 자료를 공짜로 접할 수 있는 게 그저 황송할 따름이다...
6. John Dewan's +/- System(Fielding Bible)
ZR의 창시자인 John Dewan은 누구보다도 ZR의 한계를 스스로 잘 알고 있었으므로, 그것을 개량하고자 하는 노력을 계속하게 된다. 그렇게 해서 ZR의 업그레이드 버전으로 내놓은 것이 바로 Plus/Minus System이다.
이 시스템의 기본적인 원리는 UZR과 동일하다. 즉, 각 수비수가 책임을 지게 되는 "영역"이 존재하지만, ZR과 달리 영역의 내부는 동일하지 않으며, 수비하기 쉬운 지역과 어려운 지역이 존재한다. 쉬운 지역에 떨어진 공을 처리하지 못하면 감점되고, 어려운 지역의 공을 처리하면 점수를 얻게 된다. 이 점수는 UZR이나 TZ에서와 마찬가지로, 1년동안 소속팀의 실점을 줄이거나 늘리는 데에 얼마나 기여했는가를 의미한다. 리그 평균은 여기에서도 0점이다.
문제는... 이것이 유료 정보라는 것이다. 인터넷에 샘플로 공개되어 있는 자료는 2005 시즌이 마지막이다. 게다가 시즌이 끝나고 나면 1년간의 데이터를 모아서 자료가 발간되는 구조이므로, 돈을 주고 구해 볼 생각이 있어도 시즌 중의 데이터를 실시간으로 확인하기는 어려울 것이다.
시스템의 기본적인 원리에 대해서는 아래 참조. 이 사이트에서 샘플 자료도 볼 수 있다.
http://www.billjamesonline.net/fieldingbible/overview.asp
정리.
수비 스탯은 타격이나 투수 스탯에 비해 종류도 적고, 여전히 논란의 여지가 많이 남아 있다. UZR이나 TZ, +/- 등에서는 타구의 종류가 상당히 중요하게 취급되는데, 그라운드볼이 아닌 어떤 타구가 라인드라이브인지 플라이볼인지 결정할 때에는 일정 부분 기록자의 주관이 들어갈 수밖에 없다. 각 수비수가 어떤 구역에 책임이 있는지를 설정하는 부분에 대해서도 역시 이견이 있을 수 있으리라고 본다. 게다가, 외야수의 송구 능력이라든지, 포수의 수비 능력 등에 대해서는 어떤 수비 스탯도 아직 명확한 답을 내놓지 못하고 있다.
이러한 여러가지 불완전한 부분에도 불구하고, 수비 스탯은 분명 참고할 만한 가치가 있다. 좋은 수비수와 나쁜 수비수의 차이가 존재함은 명백하다. 과연 특정 수비수의 수비 능력이 리그 평균에 비해 어느 정도인지, 우리가 할 수 있는 범위 안에서 최선을 다해서 사실에 가깝다고 믿어지는 값을 도출하는 것이다.
앞에서 소개한 여러 스탯 중에서, 나는 UZR을 즐겨 사용한다. RF나 ZR은 아쉬운 점이 너무 많으며, TZ나 +/-의 경우는 실시간으로 현재와 과거의 기록을 조회하는 일이 불가능하다. 반면 UZR은 Fangraphs에 가면 2002년부터 오늘까지의 데이터를 무료로 조회할 수 있다. 이쯤 되면 UZR은 선택이라기보다는 필수라고 해야 할 것이다. 다른 대안이 없으니 말이다...
Fangraphs에서 특히 매력적인 것은 UZR/150인데, 해당 포지션에서 한 시즌에 150게임을 뛴다고 가정하고 그에 맞춰 조정한 값을 나타내는 것이다.
추가 정보 : 수비에 대한 또 다른 자료로 David Pinto의 PMR(Probabilistic Model of Range)이라는 것이 있다. 그래프로 수비수의 능력을 보여주는데... 재미있으므로 여기도 한 번 들러 보시길 권한다.
http://www.baseballmusings.com/archives/018666.php
추가 정보 2 : Baseball Prospectus는 FRAR, FRAA와 같은 자체적인 수비 스탯을 가지고 있다. BP 사이트의 정의에 의하면 이들도 역시 특정 수비수의 책임 구역에 떨어지는 공을 그 수비수가 얼마나 처리했느냐를 가지고 계산하는 것으로 되어 있는데, UZR이나 +/- 보다는 신뢰도가 다소 떨어지는 것으로 여겨지고 있다.