Cardinals의 드라마틱한 플레이오프 진출 기념으로, 오래간만에 세이버메트릭스 포스팅을 해 본다.

Bill James는 이미 오래 전에 팀과 팀 간의 단기전 승률을 계산하는 "Log5 System"을 만들어 놓고 있었는데, "Baseball Abstarct 1981"에 처음 발표되었고, 이후 좀 더 일반적인 형태로 확장되었다. 그의 설명에 의하면 이런 이름을 붙인 것은 이 식이 각각의 팀을 승률 5할짜리 팀과 비교했을 때의 상대적인 값으로부터 계산하는 대수 체계(Logarithmic System)이기 때문이라고 한다.

로그 어쩌구 하는 이름도 그렇고, Bill James의 설명도 그렇고, 뭔가 엄청 복잡한 수식이 등장할 것 같지만, 실제 계산식은 무척 단순하고, 로그함수를 계산하는 일도 없다.

예를 들어, 팀 A와 팀 B가 1게임짜리 단판 승부를 벌인다고 치자. 종목은 꼭 야구가 아니더라도 상관은 없는데, 어쨌든 야구라고 치고, 이 둘은 같은 리그에 속해 있다. 해당 리그에서, 팀 A는 현재 6할의 승률을 거두고 있는 반면, B는 4할의 승률을 기록하고 있다. A와 B가 1게임을 했을 때 A가 이길 확률은 얼마일까?

이 계산을 위해서는, 먼저 A팀과 B팀의 log5 값을 구해야 한다. 이를 각각 log5a, log5b 라고 하자.

Bill James가 생각한 log5 값은, 해당 팀의 "Talent" 를 리그 평균에 비해서 상대적으로 나타낸 값이었다. A팀이 리그 전체(리그 평균 승률은 당연히 5할이고, 리그 평균 탤런트 수준도 0.5 이다)를 상대로 6할의 승률을 거두고 있다면, A팀의 상대적인 재능 수준(Talent Level)은 리그 평균에 비해 어느 정도일까? 아래와 같이 계산할 수 있다.


여기에서 0.5는 리그의 평균적인 재능 수준이고, 우변의 0.6은 이 팀의 승률이다.
역으로 이야기하면, 이 식을 만족하는 값을 A팀의 재능 수준, 즉 A팀의 log5 값으로 Bill James가 정의했다 라고 표현할 수 있을 것이다.

위의 식을 log5a에 대해 풀면,


즉, 리그 평균을 0.5라고 했을 때, A팀의 재능 수준은 0.750이다. 뒤집어 이야기하면, 재능 0.750짜리 팀이 재능 0.5짜리 팀(혹은 평균이 0.5인 리그 전체)을 상대로 경기를 하면 승률은 0.6, 즉 60%라는 것이다.

같은 방법으로, Log5b도 구해 보면,




동일한 식을 이용하여, 이제 A팀과 B팀이 단판 승부를 벌였을 때 각각의 승률을 예측할 수 있다.

A팀이 B팀에게 이길 확률을 Pab라고 하면,



처음의 식과 동일한 식에서, 리그 평균을 의미하던 0.500 대신 log5b, 즉 B팀의 재능 수준을 대입한 것이다. 계산 결과는 A팀이 이길 확률이 69.2%임을 보여준다.

같은 방법으로, B팀이 A팀에게 이길 확률을 계산하면, 30.8%이다.



보다 간단하게 계산할 수 있는 방법은 없을까?

리그 내에서 A팀의 승률을 Pa, B팀의 승률을 Pb라고 하여 식을 정리해 보자.

처음에 log5a를 구하던 식은 아래의 식이었다.


이 식을 log5a에 대하여 정리하면,


마찬가지로, log5b에 대하여 정리하면,


이제, 이 식들을 넣어서 Pab에 대하여 정리하면 아래와 같이 된다.


log5 등 불편한 항들이 사라지고 A, B팀의 승률만 남았다. 즉, 두 팀의 리그 내 승률만 알면 두 팀간 대결에서의 기대 승률을 계산할 수 있음을 알 수 있다.


이제 위의 식을 가지고 실습을 해 보자.

메이저리그는 내일부터 Division Series에 돌입한다. 8개 팀이 2팀씩 5전 3선승제의 단기전을 벌이게 되는 것이다.

페넌트레이스에서의 승패에는 운이 많이 개입하므로, 보다 실제 재능 수준에 가깝게 추정하기 위해, 시즌 득점/실점 자료를 바탕으로 Pythagenpat에 의한 Pythagorean Expectation을 계산하여 해당 팀의 리그 내 승률로 사용하였다.  (Pythagorean Expectation은 여기를 참조)

이렇게 계산한 Division Series 예측 결과는 아래와 같다.


Div. Series 기대승률은 3-0, 3-1, 3-2 승리 확률을 합산한 것이다.
3-0, 3-1, 3-2는 각각 어떻게 구할까? 고등학교 수학에서 배우는 조합을 이용하여 계산하면 된다.

위쪽의 예와 동일하게, 한 번의 대결에서 A팀이 B팀을 이길 확률을 Pab,  B팀이 이길 확률을 Pba라고 하면, n차전에서 시리즈가 A팀의 승리로 끝날 확률은 아래와 같다.


예를 들어, Cardinals가 Phillies에게 4경기만에 3-1로 승리하고 NLCS에 진출할 확률을 계산하면


이렇게 되는 것이다.

참고 : 위 식에서 "(n-1)C2"가 되는 이유는? 마지막 게임은 무조건 해당 팀이 이기게 되므로, 나머지 경기 중에서 두 게임을 이기는 경우의 수를 구하면 되는 것이다.

물론, 플레이오프에서는 5선발을 사용하지 않는 등 정규시즌과는 다른 로스터 운용을 하게 되므로, 실제로는 각 팀의 기대승률 자체가 변하게 되어, 위의 결과에서 오차가 생기게 된다. 하지만, 대략적인 전력상의 우열을 살펴보는 데에는 이정도로도 충분할 것이다.


P.S. 혹시 Bill James가 직접 출판했던 시절의 Baseball Abstract (1977년부터 81년까지)를 구할 수 있는 방법을 아시면 알려 주시길... 가끔 이베이에 올라오는 것 같기는 한데...



Today's Music : Tori Amos - Winter (Live 1992)



중고등학교때 헤비메틀을 많이 듣긴 했지만(팝음악을 들으면 나약한 음악이라고 구박을 받던 시절이었다), 사실 돌이켜보면, 사춘기 소년의 감성을 지배했던 음악은, 이런 곡들이었다. 십 몇 년을 들어도 질리지 않는 곡이다. 그다지 이쁘다고 할 수는 없는 Tori Amos의 얼굴이 너무 크게 잡혀서 약간 부담스럽긴 하지만... -_-;;;

Posted by FreeRedbird
:
메이저리그는 플레이오프 로스터 구성에 대해 다음과 같이 규정하고 있다.

일단, 기본적으로는 8월 31일 자정에

a) 25인 로스터에 포함되어 있었거나
b) Disabled List, Bereavement List, Suspended List에 있었던 선수

이들만 플레이오프 참가 자격이 있다. 이들이 "플레이오프 선수 풀"이 되어, 이중에서 25명을 골라서 플레이오프 로스터를 구성하는 것이다.

그런데, 이들 중 60일 부상자 명단에 올라 플레이오프에 아예 출전이 불가능한 경우, MLB 사무국의 허가를 얻어 해당 선수를 빼고 대체선수를 포함시킬 수가 있다. 이 대체선수는 8/31 현재 해당 구단 소속이면 누구라도 가능하다. (마이너리거도 가능) 단, 플옵 시작 전에 대체선수가 당연히 40인 로스터에는 포함되어 있어야 한다.

Cardinals의 8월 31일 25인 로스터는 어떤 모습이었을까?
MLB 게임데이를 찾아보니 이날은 Westbrook이 선발로 나와 타석에서 만루홈런을 쳤던 날이었다. -_-

Infielders - A Pujols, R Furcal, S Schumaker, D Freese, D Descalso, R Theriot
Outfielders - A Craig, J Jay, M Holliday, L Berkman, C Patterson
Catchers - Y Molina, G Laird
Pitchers - J Westbrook, M Rzepczynski, J Motte, K McClellan, M Boggs, C Carpenter, O Dotel, J Garcia, E Jackson, K Lohse, F Salas, A Rhodes

당시 DL에는 아래의 네 명이 있었다.
N Punto, L Lynn, E Sanchez, A Wainwright

이후 Punto와 Sanchez는 메이저리그 로스터에 복귀하였지만, Lynn과 Wainwright는 60일 DL에서 정규시즌 종료를 맞았다. 따라서, Cardinals의 플레이오프 선수 풀은 위에서 Lynn과 Wainwright를 제외한 27명과, Lynn 및 Wainwright의 대체 선수 2명으로 구성된다.

과거에는 대체선수 선발시 타자는 타자로만, 투수는 투수로만 대체해야 한다는 규정이 있었으나, 이 규정은 현재 적용되지 않고 있다. 다만, 플레이오프 시리즈 사이에 부상당한 선수를 추가로 대체하는 경우 (예: NLDS에서 부상당한 선수를 NLCS 진출시 빼고 다른 선수를 추가하는 경우) 에는 여전히 타자-타자, 투수-투수의 대체 규정이 적용된다고 한다. (링크 참조)

일단 로스터 풀에서 Lynn과 Wainwright를 대체할 선수 2명을 생각해 보자. 현재 40인 로스터에 포함되어 있으면서 8/31 당시 25인 로스터에 없었던 선수들은 다음과 같다.

Catchers - T Cruz, B Anderson
Infielders - T Greene, M Carpenter, Z Cox, P Kozma, M Hamilton
Outfieldes - A Chambers, S Robinson, A Brown
Pitchers - M Cleto, B Dickson, A Reifer

투수 셋 중 Reifer는 시즌 내내 부상이었고, Cleto와 Dickson은 콜업된 후 비석처럼 벤치에 앉아 있기만 하고 출전 기회조차 주어지지 않았으므로, 투수를 풀에 추가할 필요는 전혀 없어 보인다. 있어도 쓰지 않을테니 말이다.

타자들 중에서 플레이오프 출전을 고려할 만한 선수들은 Cruz, Greene, Chambers 정도인 듯 한데, 현재 Furcal과 Holliday의 건강 상태가 불투명한 것을 감안하면, 유격수 수비가 가능한 Greene과 외야 3포지션을 모두 소화할 수 있는 Chambers를 대체선수로 지정하는 것이 좋을 것 같다. 이들 둘은 40인 로스터 내에서 가장 빠른 선수들이기도 하다.

이렇게 하여, 29인의 플레이오프 선수 풀이 구성되었다. 다시 정리를 해 보면...
Infielders(8) - A Pujols, R Furcal, S Schumaker, D Freese, D Descalso, R Theriot, N Punto, T Greene
Outfielders(6) - A Craig, J Jay, M Holliday, L Berkman, C Patterson, A Chambers
Catchers(2) - Y Molina, G Laird
Pitchers(13) - J Westbrook, M Rzepczynski, J Motte, K McClellan, M Boggs, C Carpenter, O Dotel, J Garcia, E Jackson, K Lohse, F Salas, A Rhodes, E Sanchez

이중 25명을 골라야 하는데... 먼저 투수를 11명 데려갈 것인가, 12명 데려갈 것인가를 결정해야 한다.
과거의 예를 보면, TLR은 2004-2006년의 3년 동안은 계속 투수 11명을 데려갔었고, 반면 2009년 플레이오프 때에는 투수 12명을 선택하였다.

올해 같은 경우, Holliday나 Furcal같이 건강 상태가 불투명한 타자들이 포함되어 있으므로, 타자 쪽에 좀 더 인원을 보강하는 것이 나을 것 같다. 나 같으면 투수 11, 타자 14를 선택할 듯 하다.

투수 11명 중 선발 4명은 고민할 것도 없이 Carp, Garcia, Lohse, Jackson이다. Westbrook은 아예 로스터에서 제외하는 게 좋을 듯. 선발로도 별로고 불펜에 넣기에도 구위가 영 별로이다.
불펜 7명은 Motte, Rzep, KMac, Boggs, Dotel, Salas, Sanchez로 했으면 좋겠는데.. TLR은 좌완 두 명을 쓰고 싶어하므로 어떻게든 Rhodes를 집어 넣을 것 같지만.. 내 추천은 좌우 가리지 말고 그냥 제일 좋은 7명을 골라 가는 것이다. KMac은 후반기에 Rhodes보다도 더 삽질을 했지만, 선발 중 누군가가 일찌감치 무너지는 불상사가 발생할 경우 마운드에 올라가서 이닝을 먹어 줘야 하므로, 로스터에 포함시키는 것이 좋을 것 같다.

타자 14명 중 포수 2명은 그냥 확정이고... 남은 12명을 어떻게 구성하느냐인데... 내 추천은 아래와 같다.
INF - Pujols, Furcal, Freese, Schumaker, Theriot, Punto, Descalso
OF - Holliday, Berkman, Jay, Craig, Chambers
Patterson은 로스터 낭비이고... Greene은 예비군으로 남겨 두었다가 Furcal이 아예 출전 불가능인 경우에 한해 Furcal 대신 로스터에 넣으면 어떨까 한다.

여기까지는 내가 생각하는 최선의 25인이고.. 실제 Cardinals의 플옵 로스터는 아마도 이들 25명 중 누군가 한 명을 빼고 Rhodes를 포함하게 될 것이다. (누가 빠지느냐는 투수를 몇 명 데려가느냐에 따라 달라질 듯), 또한, 베테랑을 사랑하는 TLR의 취향을 고려할 때 Chambers 대신 Patterson이 포함될 가능성도 상당히 높다.
Posted by FreeRedbird
:
정규시즌이 끝난 시점에서, 당시 엄청 욕을 먹었던 Rasmus 트레이드의 득실을 다시 따져보기로 하였다.

이 트레이드는 아래와 같이 3대 3으로 이루어졌다. (White Sox와의 삼각 딜이긴 하지만, Blue Jays가 Jackson을 데려온 후 다시 트레이드 한 것으로 보고 그냥 Cards와 Blue Jays의 3:3 딜로 보아도 무방하다.)

Cardinals get Edwin Jackson, Marc Rzepczynski, Octavio Dotel
Blue Jays get Colby Rasmus, Brian Tallet, Trever Miller

그리고 이 트레이드로 인해, Jon Jay가 주전 CF가 되었고, KMac이 로테이션에서 불펜으로 옮겨갔다. 트레이드의 불펜투수 2명은 서로 맞교환했다고 보면 되므로 따로 더하고 뺄 것은 없어 보인다. 아.. 참.. 불펜에 좌완이 1명으로 줄어들면서 TLR이 계속 언론에 불평불만을 늘어놓은 결과 Mozeliak이 Arthur Rhoads를 추가 영입하게 되었는데, 이것은 트레이드의 직접적 득실과는 관계가 없으므로, 마지막에 별도로 살펴보도록 하자.

따라서,
이 트레이드로 인한 득은 데려온 3명 + Jay + KMac의 트레이드 이후 기여 수준이 될 것이고,
이 트레이드로 인한 실은 보낸 3명의 트레이드 이후 성적 및 KMac을 로테이션에 그냥 두었을 때의 기여 수준이 될 것이다.

우선. 얻은 것부터.
데려온 3명의 트레이드 이후 성적이다.
Edwin Jackson 0.7 WAR
Rzep the Scrabble 0.4 WAR
Octavio Dotel 0.9 WAR

Jon Jay의 8, 9월 두 달 성적은 총 0.8 WAR 이다.
Kyle McClellan의 8, 9월 두 달 성적은 -0.7 WAR 이다. -_-;;; KMac이 얼마나 불펜에서 삽을 펐는지 알 수 있다.

TOTAL 0.7 + 0.4 + 0.9 + 0.8 - 0.7 = 2.1 WAR

다음. 잃은 것을 계산해 보자.
보낸 3명의 트레이드 이후 성적이다.
Colby Rasmus -0.4 WAR
Brian Tallet -0.1 WAR
Trever Miller -0.1 WAR

Kyle McClellan은 선발로 17번 등판하여 104.2 이닝을 던져서 0.3 WAR를 기록하였다.
트레이드 후 Edwin Jackson이 12번 선발 등판했으므로, 똑같이 12번 선발로 나왔다고 보면 대략 74이닝에 0.2 WAR 정도가 된다.

TOTAL -0.4 + (-0.1) + (-0.1) + 0.2 = -0.4 WAR

따라서,
트레이드로 인한 올 시즌 득실 = 2.1 - (-0.4) = 2.5 WAR


이 트레이드는 팀 성적에 결국 2.5승 만큼 도움이 된 셈이다.

플레이오프 진출 여부가 마지막 날 1승 차이로 갈렸으므로, 이 트레이드는 Cardinals의 플옵 진출에 아주 결정적인 공헌을 했다고 볼 수 있다. 즉, 이 트레이드가 없었다면, 아마도 우리 대신 Braves가 플레이오프에 나갔을 것이다.

7월 말 트레이드 당시 이 블로그의 트레이드 득실 분석을 기록하시는지? 당시 나는 남은 두 달 동안 이 트레이드가 2.5 WAR의 이득을 가져다 줄 것으로 계산했었다. 정확히 맞춘 것이다. ^^v  물론 각 선수별 기여 수준은 내가 생각했던 것과는 상당히 달랐으니, 소 뒷걸음질 치다가 쥐 밟은 격으로 우연히 총 합계가 맞은 것 뿐이다. -_-;;;

당시 나는 Jackson이 제일 많이 기여할 것으로 생각했지만 결과적으로는 Dotel이 이 트레이드에서 가장 중요한 선수였음이 드러났다. 그리고, KMac의 불펜 전환은 긍정적인 효과를 줄 것으로 예상했었지만, 결국 두달 동안 무려 -0.7 WAR를 기록하여 팀에 오히려 해를 끼쳤다. KMac만 replacement level 수준에서 선방했어도 이 트레이드는 3승 이상 이득이었을 것이다.

어쨌거나, 트레이드는 소기의 목적을 달성했고, 우리는 플레이오프를 즐길 수 있게 되었다.
리그 최강 Phillies와의 NLDS는 당연히 어려운 시리즈가 되겠지만, 지난 32경기에서 23승 9패를 기록한 이 팀의 저력을 믿어 보자.


참고 : Arthur Rhoads의 Cards 합류 후 성적은 -0.3 WAR 이다. -_-;;;  좌완 릴리버가 꼭 2명이어야 하는 강박 관념에서 좀 벗어날 필요가 있다.


Today's Music : Quiet Riot - Winners Take All



아직도 흥분이 채 가시지 않는, 드라미틱한 플옵 진출을 기념하며...
Posted by FreeRedbird
: