인터넷의 발달이 가져온 가장 큰 변화는 역시 정보의 홍수라고 해야 할 것이다. 집에 앉아서 컴퓨터만 켜도, 예전 같으면 상상조차 할 수 없는 엄청난 정보에 접근할 수 있게 된 것이다. 늘어난 것은 정보의 양 뿐이 아니다. 정보의 전달 속도와 정보의 질 역시 이전과 비교할 수 없을 정도로 높아졌다. 지극히 진부한 표현이지만, 이정도라면 가히 "혁명"이라는 단어가 어울린다고 생각한다.

야구에 있어서도, 비슷한 정보의 혁명이 일어나고 있다. 단지 약간의 웹서핑을 통해, 우리는 이전에는 극소수의 전문가들만이 얻을 수 있었던 통계 데이터에 얼마든지 접근할 수 있는 것이다. 예를 들어, 메이저리그의 Raw Data를 원한다면 Baseball-ReferenceRetrosheet를 방문하면 된다. 플레이어의 가치(Value)를 평가할 수 있도록 2차적으로 가공된 자료를 원한다면, FangraphsBaseball Prospectus, The Hardball Times와 같은 훌륭한 사이트들이 있다. 어떤 마이너리거를 메이저리그에 콜업하면 얼마나 좋은 성적을 낼 지 궁금한가? Minor League Splits가 적절한 예상치를 대답해 줄 것이다. 여기까지 열거한 사이트들은 가장 대표적인 곳들일 뿐, 조금 더 웹서핑을 열심히 한다면 정말 매일매일 읽기만 해도 모자랄 만큼 풍성한 자료를 찾아낼 수 있다.

이런 데이터가 거의 대부분 공짜로 제공되고 있다는 것은 정말 엄청난 일이다. 인터넷 만세라도 부르고 싶은 심정이 될 만큼 말이다. 특히 Fangraphs나 Retrosheet의 모든 자료가 100%무료라는 사실은 놀라움을 넘어서 충격의 수준이다.

몇 년 전만 해도, 사정은 이렇게 좋지 않았다. 위의 사이트들 중 상당수가 존재하지도 않았을 뿐 아니라... 데이터의 공개 수준도 지금과 같지 않았던 것이다. 예를 들어...UZR을 개발한 Mitchel Lichtman은 2년 동안 Cardinals에 고용되어 일한 적이 있었는데, 그 기간 동안에는 UZR 데이터를 Cardinals 구단이 독점하였고, 일반에 전혀 공개되지 않았다. 하지만... Cardinals와의 계약이 끝난 지금... Lichtman은 Fangraphs 사이트를 통해 UZR 데이터를 전세계 모든 네티즌에게 무료로 공개하고 있다. 올 시즌 500이닝 이상 출장한 메이저리그 유격수 중 누가 가장 뛰어난 수비를 보여주고 있는지 궁금한가? 여기를 클릭해 보시기 바란다. 세이버메트릭스에 대해 별다른 지식이 없더라도, 결과값은 이렇게 쉽게 무료로 공유가 되는 것이다. 그들은 분명 특정 구단과 계약하거나 사이트를 유료화하여 돈을 벌 수도 있겠지만, 이렇게 정보의 개방을 선택하고 있다.

놀라움은 이런 정보의 개방성에서 그치지 않는다. 예를들어... Tom Tango나 MiTchel Lichtman 등이 운영하는 Inside The Book에서는 Tango, Lichtman, Sean Smith와 같이 현재 활발히 활동하고 있고 영향력도 막대한 유명 세이버메트리션들과 언제든 토론을 할 수 있다. Fangraphs의 블로그에서도 수많은 사람들이 세이버메트릭스의 아이디어나 계산식에 대해 열띤 토론을 벌이는 모습을 쉽게 볼 수 있다. 새롭게 연구된 내용들은 거의 항상 인터넷에 공개되고 공유되며, 야구와 세이버메트릭스를 사랑하는 여러 아마추어 네티즌들과 함께 토론을 벌이고, 그 과정을 통해 계속 업그레이드 된다. 세이버메트릭스는 완성된 답이 아니라 진화해 나가는 진행형이며, 그 과정에 누구든 참여할 수 있는 interactive한 세계이다.

이미 만들어져 있는 세이버메트릭스 계산식에 따른 결과값만을 찾아보는 것이 지루하고 심심하다면, 그럼 직접 계산해 보면 된다. 위의 사이트들을 잘 뒤져보고, 구글과 위키디피아에서 약간의 웹서핑을 추가로 한다면, 여러 스탯들이 어떻게 개발되고 어떠한 방법으로 계산되는지를 알 수 있다. 계산 방법을 이해했다면 이제 직접 계산하는 노가다는 엑셀에게 맡기면 된다. 물론 Baseball Prospectus에서 만든 복잡한 스탯들의 경우 계산이 어렵긴 하나, 요즘 유행하는 wOBA나 FIP, BABIP 등은 누구나 집에서 어렵지 않게 계산이 가능하다.


이를 과거의 야구 지식, 이를테면 스카우팅과 비교해 보자. 스카우팅은 고도의 훈련과 노력이 필요한 전문적인 분야이다. 스카우트가 되기 위해서는 체계적인 트레이닝을 받아야 하며, 집에서 혼자 해서 좋은 스카우트가 되는 것은 거의 불가능하다. 경험이 중요한 분야이기에, 스카우트들은 한때나마 선수생활을 했던 사람들인 경우가 많다. 각 플레이어에 대한 스카우팅 리포트는 대개 비밀 문서이고, 인터넷에 있다고 해도 거의 유로 정보이다. 요컨대, 우리와 같은 일반 아마추어 팬들이 쉽게 접근할 수 없는, 그들만의 고급 정보라는 것이다.

하지만, 세이버메트릭스의 문은 누구에게나 열려 있다. 위에서 소개한 사이트들을 비롯하여 수많은 사이트에서 언제든지 무료로 스탯을 얻을 수 있고, 엑셀만 조금 다룰 수 있다면 누구나 직접 계산까지 해 볼 수가 있다. 게다가 인터넷의 블로그와 게시판을 통해 직접 참여하여 의견을 주고받을 수도 있다. 약간의 관심만 있다면 누구나 참여하고 즐길 수 있다는 점에서, 정말 민주적이고 개방된 분야라고 할 수 있을 듯하다. 누구나 어렵지 않게 참여할 수 있으니 나처럼 운동신경이 전혀 없고 야구선수로서의 경험도 없는 완전 아마추어라도 얼마든지 즐길 수가 있는 것 아니겠는가...


* 이 글은 한국야구팬사이트에서도 보실 수 있습니다.

Posted by FreeRedbird

댓글을 달아 주세요

  1. BlogIcon 반바스틴 2009.10.07 14:40 Address Modify/Delete Reply

    정말 저런 자료가 공짜라는것에 대해 놀라움을 금치못합니다

    어느정도 지식만있으면 저사이트에서 몇시간동안 있을수있으니.... 뭐 그래도 개인역량에 달린문제이긴하지만요

    • BlogIcon FreeRedbird 2009.10.07 18:24 신고 Address Modify/Delete

      Retrosheet 같은 경우는 메이저리그 모든 게임의 기록을 통째로 보관하고 있으니까요.. 시즌 전체 게임 자료를 받으면 거의 무한대로 활용이 가능합니다. 이론적인 배경이 필요하시다면 The Hardball Times와 Inside the Book에 도움이 될 만한 좋은 글이 많으니 참고하세요...