Estadísticas Sabermétricas en la Spanish Softball League ¿Por qué no?

En el béisbol y el sófbol existen desde hace tiempo las estadísticas tradicionales, que te dan una idea del desempeño de un lanzador o de un bateador. En el béisbol profesional de más alto nivel, se han desarrollado unas estadísticas avanzadas que han buscado responder a ciertas preguntas; ¿Cuál es la contribución ofensiva real de un bateador? ¿Cuál sería la efectividad real de un lanzador independientemente del equipo que tenga en defensa? ¿Cuán valioso es un jugador en realidad para su equipo? ¿Cómo medir y comparar el desempeño de jugadores que militan en diferentes equipos, sea el equipo de cabeza o el de la cola?

Algunos “locos” de las estadísticas en América han conseguido responder a estas preguntas y ha significado una verdadera revolución en la forma de interpretar las estadísticas. Entrecomillo lo de locos, porque entre esos “locos” han participado grandes estudiosos de las estadísticas, matemáticos e incluso economistas graduados de las mejores universidades de EEUU y que tienen en común su pasión por el béisbol. Alrededor de esto se ha desarrollado lo que algunos piensan es una ciencia, llamada la Sabermetría. En la actualidad los equipos profesionales de alto nivel, utilizan estas estadísticas incluso para fijar la cuantía del contrato con sus jugadores.

Quizá solo has oído el termino Sabermetría después de ver la película Moneyball, protagonizada por Brad Pitt y Jonah Hill. En este largometraje basado en el libro de Michael Lewis, solo se ve la punta del iceberg de las estadísticas avanzadas pero hay mucho más. Nosotros particularmente nos hemos preguntado ¿Es posible aplicar las estadísticas sabermétricas a la Liga Española de Béisbol y/o a la de Sófbol? Sin duda tenemos limitaciones tecnológicas y de recursos para llevarlo a cabo con cierta precisión, pero ¿Por qué no intentarlo? Lo hemos hecho, con ciertos ajustes que describiremos más adelante. Empezamos con la Liga de Sófbol Femenina División de Honor llamada a partir de este año Spanish Softball League. Esperemos en el futuro cercano, hacer lo mismo con las ligas de béisbol.

Estadísticas Avanzadas Ofensivas

OPS (On Base Plus Slugging)

Empezamos por la más fácil de calcular. Se obtiene sumando el OBP (On-Base Percentage o Porcentaje de Embasado) y el SLG (Slugging o Potencia de bateo). En la película Moneyball resaltaban la relevancia del OBP, siendo más importante evitar que eliminen (lo que mide el OBP) a dar hit (que es lo que mide el AVG – Promedio de bateo). El SLG mide la capacidad de dar Hits Extrabases, que son los mejores batazos para obtener más anotaciones. Ambas estadísticas están en la frontera de lo tradicional y lo avanzado. Ambas nos sirven para medir dos de las mejores características de una bateadora. La suma de ambas, nos da una idea que tan completa es esa bateadora.

Estas son las líderes de OPS en la SSL 2021, finalizada la séptima jornada (Mínimo 30 apariciones al bate)

wOBA (Weighted On-base Average)

El wOBA (Promedio En base Ponderado) es una versión que mejora el OPS, asignándole un valor a cada evento ofensivo en términos de su impacto en la proyección de carreras. Esta es una herramienta muy útil para evaluar el verdadero valor ofensivo de cada bateadora. La fórmula según Fangraphs es esta:

El coeficiente de cada evento varía por año y de liga en liga, todos están basados en lo que ocurre en cada contexto determinado. En nuestro caso, para simplificarlo, usaremos coeficientes fijos aproximados. Además agregamos ajustes para valorar las bases robadas, outs en intento de robo y rodados para doble play. Para diferenciar el wOBA creado por Tom Tango (no estandarizado) al que hemos ajustado para la SSL, agregamos la letra “sho” quedando wOBAϷ

Estas son las líderes de wOBAϷ en la SSL 2021, finalizada la séptima jornada (Mínimo 30 apariciones al bate)

RC (Runs Created)

RC (Carreras Creadas) hace un cálculo de la aportación de una bateadora, tomando en cuenta sus eventos ofensivos. Es estadística de conteo dependiendo de las apariciones al bate, a diferencia del wOBA que es de promedio. La estadística hace una estimación de las carreras que produciría una jugadora a la ofensiva, independientemente de la producción de sus compañeras. No hay una fórmula estandarizada. La primera fórmula conocida para calcularlo y la más básica fue OBP*SLG*AB, después se utilizó RC = ((H + BB) * TB) / (AB + BB) de la cual han derivado fórmulas más complejas. Es la que hemos utilizado, haciendo ajustes para nuestra liga. Agregamos þ a la nomenclatura quedando RCþ y así la diferenciamos de la RC no estandarizada más común.

Pero ¿cómo sabemos que los ajustes a la fórmula dan un resultado correcto? La prueba del algodón sería que el total de RCþ de la liga, tendría que ser un número muy aproximado al número totales de carreras. El total de carreras realizadas en la SSL 2021 hasta la séptima jornada fueron 796. En nuestra fórmula no se toma en cuenta como evento ofensivo las bases obtenidas por error, ya que no están disponibles fácilmente. Por eso es que tenemos que hacer la prueba con las carreras limpias totales en la liga, que fueron 516. Hacemos el cálculo y este es el resultado:

La gráfica de abajo a la izquierda muestra el total de carreras limpias permitidas por cada equipo hasta la séptima jornada, mostrándose al final el total de ER en la liga (516). La gráfica de abajo a la derecha muestra el cálculo hecho con nuestra fórmula de las RCþ totales de cada equipo. La suma total da la cifra de 490,5. La aproximación es del 95%, mucho más eficaz que la mayoría de las vacunas para el covid, por lo que damos por válida la formula.

Estas son las líderes de RCþ en la SSL 2021, finalizada la séptima jornada

Otra forma de obtener las carreras creadas, que se ha popularizado entre los sabermétricos, es el wRC (Weighted Runs Created – Carreras Creadas Ponderadas) de Tom Tango. La fórmula es:

Es una estadística dinámica y se necesitan más datos, dejando de ser sencilla para obtenerla en la SSL. No descartamos usarla en el futuro. Con el wRC también se puede obtener el wRAA (carreras ponderadas por encima del promedio), usando la fórmula: wRAA = ((wOBA – liga wOBA) / escala wOBA) × PA

Son las fórmulas más usadas para obtener cuantas victorias aproximadas ha significado el aporte ofensivo de cada jugadora para su equipo. Sería una introducción muy básica del famoso WAR (Wins Above Replacement – Victorias Sobre el Reemplazo) que tan de moda está en el béisbol de élite.

Sin embargo el RCþ, aunque no es perfecto (el wRC tampoco lo es), nos simplifica mucho el trabajo. Podemos calcular el RAR (Runs Above Replacement – Carreras Sobre el Reemplazo) con una simple fórmula: RC de la jugadora, menos RC de su reemplazo. Solo quedaría obtener el RC del reemplazo que se suele fijar en el 75% del RC promedio de la liga.

Seguidamente para calcular el WAR ofensivo, de una forma básica, sería con la fórmula RAR/10. Se toma como referencia la cantidad de diez carreras que se considera el mínimo para obtener una victoria segura. De una forma más específica se puede calcular por cada liga, calculando el promedio de carreras por partido de todos los equipos y multiplicándolo por dos. En nuestro caso después de 7 jornadas de SSL, el promedio de carreras por juego/equipo es de 5.85. El doble (equivalente a una victoria) sería 11,7, por lo que sería el cálculo más aproximado: RAR/11,7. De todas maneras no difiere mucho de la fórmula del principio del párrafo.

De momento no calcularemos el WAR de la SSL, dejaremos esa tarea para más adelante. Solo hemos dado la información básica. Si queréis saber más pinchar en los enlaces y al final de esta publicación en los links de referencias.

Estadísticas Avanzadas Pitcheo

Nosotros particularmente hemos desarrollado tres fórmulas para responder ciertas preguntas en cuanto al pitcheo:

¿Qué lanzadora tiene mejor control? Respuesta: FCþ (Factor de Control)
¿Qué lanzadora es más dominante sin tomar en cuenta el control?: Respuesta: FKþ (Factor K)
¿Qué lanzadora es la más dominante, tomando en cuenta todos los eventos de responsabilidad de la lanzadora y también los hits recibidos? Repuesta FDþ (Factor Dominante)

FCþ (Factor de Control)

Empezamos exponiendo el Factor de Control. Sería una especie de OBP permitido, pero sin tomar en cuenta los hits. Se toma en cuenta los Wild Pitch, pero con una puntuación menor ya que buena parte es responsabilidad de la cátcher. Entre más bajo el FCþ, mejor control de la lanzadora.
La fórmula sería: (BB + HBP + (0.5*WP)) / (AB+BB+HBP)*1000

Líderes en FCþ de la SSL 2021, finalizada la jornada 7 (mínimo 25 entradas lanzadas):

FKþ (Factor K)

Podíamos haber tomado el promedio de ponches por cada siete entradas para ver qué tan dominante es una lanzadora, pero nos pareció poco. Hemos tomado en cuenta también el AVG permitido a las bateadoras. Entre más alto el valor del FKþ, más dominante es la pitcher. Es una estadística que nos sirve también como predictiva. Si una lanzadora destaca en este renglón, pero no en los demás, es muy posible que mejorando su control sea de las mejores de la liga. Así ha quedado la fórmula: (K*2 + (AB – H))/AB*7)

Líderes en FKþ de la SSL 2021, finalizada la jornada 7 (mínimo 25 entradas lanzadas):

FDþ (Factor Dominante)

Para saber que tan dominante es una lanzadora no solo debemos tomar en cuenta los ponches y los hits permitidos, también es importante tener en cuenta el control que tiene. Esta es una estadística muy completa para evaluar a una lanzadora, que utiliza y une las dos estadísticas anteriores en una sola. Porque una pitcher no solo puede ser dominante ponchando, también lo es con buen control. La fórmula es: (FKþ / FCþ)*100.

Líderes en FDþ de la SSL 2021, finalizada la jornada 7 (mínimo 25 entradas lanzadas):

DB% (Porcentaje de corredoras Dejadas en Base)

Realmente lo que mide es el porcentaje de corredoras que llegan a base y no anotan carrera. Muchas de esas corredoras pudieron eliminarse en jugadas de doble play, jugadas en base como tratando de avanzar o atrapadas robando y no necesariamente quedaron en base. Es una estadística curiosa que puede significar dos cosas; el equipo a la defensa ayuda a la pitcher y/o la pitcher es capaz de sobreponerse a situaciones complicadas. Por lo general se cree más en la última opción.

Líderes en DB% de la SSL 2021, finalizada la jornada 7 (mínimo 25 entradas lanzadas):

WHIP (Walks plus Hits per Innings Pitched – Boletos más Hits por Entradas Lanzadas)

Es una estadística muy usada en la actualidad y refleja la capacidad de una lanzadora de evitar que le lleguen a base las bateadoras. Es muy fácil de calcular. La fórmula es: WHIP = (Walks + Hits) / Innings

Líderes en WHIP de la SSL 2021, finalizada la jornada 7 (mínimo 25 entradas lanzadas):

FIP (Fielding Independent Pitching – Pitcheo Independiente de la Defensa)

Es quizá la mejor fórmula creada por Tom Tango y sirve para determinar la verdadera efectividad de un Pitcher. El ERA está muy determinado por la calidad del equipo que está a la defensiva. El FIP busca valorar eventos que dependen exclusivamente del lanzador y no de la defensa (Bb, hits, K’s y HRs). La fórmula es:

Pero ¿se adapta esta fórmula a la SSL? Los ponches, boletos y bateadoras golpeadas no hay duda que son responsabilidad de la lanzadora pero los jonrones, en una liga que el 80% de ellos son dentro del campo, no lo creemos. Además, vemos a menudo un batazo que no debió pasar de sencillo convirtiéndose en Home Run porque la exterior atacó mal la bola. También tenemos la benevolencia excesiva de los anotadores con las defensoras y la teoría del “esfuerzo ordinario” para realizar una jugada, que muchas veces es mal aplicado castigando finalmente a las pitchers.

¿Y si no nos valen los home runs para medir el FIP, como podemos hacerlo? Nosotros hemos optado por una solución que aunque no perfecta, nos ayuda a valorar con bastante certeza cuan efectiva es una lanzadora en la SSL. Sustituimos los jonrones por los extrabases y le hemos puesto menos relevancia en la ecuación. Y seguro que pensaréis que es una peor solución, pero tomando en cuenta que un buen porcentaje de extrabases es responsabilidad de la pitcher y al no tener los recursos para medir los “Hard Hits” de todos los batazos (sería mejor solución) es lo mejor que se nos ocurrió. De esa manera la formula quedaría así: FIPþ = ((5 * HX) + (3 * (BB + HBP)) – (2 * K)) / IP + 3,5 (constante)

Líderes en FIPþ de la SSL 2021, finalizada la jornada 7 (mínimo 25 entradas lanzadas):

RSAAþ (Runs Saved Above Average – Carreras Salvadas Sobre el promedio)

Si el FIP es en los pitchers el equivalente al wOBA de los bateadores, las RSAA sería lo equivalente a las RC. Si las buenas bateadoras son capaces de producir carreras con eventos ofensivos, las buenas lanzadoras son capaces de evitar carreras con eventos contrarios. La RSAAþ intenta medir (o predecir) de alguna manera, las carreras que evitaría una pitcher para lograr victorias a su equipo. Los cálculos para medir el valor de un pitcher de las principales plataformas de estadísticas sabermétricas (Fangraphs, Baseball Reference, Baseball Prospectus), son extremadamente complejos. Nosotros hemos querido simplificar eso de alguna manera con la siguiente formula:

RSAAþ = [ (RAlgA – FIPþ + DB% + (FDþ*0.1)) / 7 ] * IP

Donde RAlgA son las carreras promedio de la liga por juego y por equipo. Los demás valores ya los hemos explicado previamente. Sería la única estadística de pitcheo, de las presentadas aquí, que es de conteo y se va sumando durante las entradas lanzadas. Al ser acumulativa no necesita un mínimo de inning para valorar a las pitchers, aunque a más entradas mayor es el aporte. También, al ser la única estadística comparativa con el resto de la liga de las expuestas, se puede dar el caso de haber valores negativos.

Estas son las líderes de RCþ en la SSL 2021, finalizada la séptima jornada

Estadísticas Avanzadas Defensivas

Quizá la defensa es una de las partes más importantes de nuestro deporte, después del pitcheo. Sería un logro poder valorar bien a las defensoras, pero no es nada fácil. Esta parte será una tarea pendiente. Llevamos años pensando cómo es posible hacer una medida de la defensiva de nuestra liga sin los medios y recursos que tiene la MLB, que cuenta con Statcast. En la elite utilizan el UZR (Ultimate Zone Rating). Se utiliza cámaras y escáneres especiales para medir varios parámetros como, el alcance, potencia de tiro, entre otros valores y lo va comparando con jugadores de la misma posición. Aun usando la última tecnología, hay debate sobre si es el método apropiado para valorar defensivamente a los jugadores. Nosotros creemos que puede haber una forma más artesanal de conseguir valorar la defensa de una jugadora, por lo menos mejor que el promedio defensivo que es lo que disponemos ahora mismo. Estaremos rompiéndonos la cabeza en los próximos meses e intentaremos presentar algunas ideas.

De momento les hemos presentado nuestras propuestas para las estadísticas avanzadas de la Spanish Softball League. Próximamente estaremos haciendo lo mismo para la Liga de Béisbol 1ª Div (siempre que tengamos disponibles estadísticas) y la Spanish Baseball League. ¿Te gustaron las propuestas? ¿Alguna sugerencia? Ponte en contacto con nosotros. Un saludo a toda la comunidad del béisbol y el sófbol.

Escrito por Jose Ramil
Twitter @joseramil, Instagram @joseramil70
Publicado por Ramón Carrasco
Twitter @Monchoes007. Instagram @monchoes007

Los datos se tomaron en la WEB de estadísticas de la Liga SSL 2021 de la Real Federación Española de Béisbol y Sófbol

Referencias

Sobre el autor del post

José Ramil

See author's posts

Béisbol y Sófbol en estado puro

Estadísticas Sabermétricas en la Spanish Softball League ¿Por qué no?

Estadísticas Avanzadas Ofensivas

OPS (On Base Plus Slugging)

wOBA (Weighted On-base Average)

RC (Runs Created)

Estadísticas Avanzadas Pitcheo

FCþ (Factor de Control)

FKþ (Factor K)

FDþ (Factor Dominante)

DB% (Porcentaje de corredoras Dejadas en Base)

WHIP (Walks plus Hits per Innings Pitched – Boletos más Hits por Entradas Lanzadas)

FIP (Fielding Independent Pitching – Pitcheo Independiente de la Defensa)

RSAAþ (Runs Saved Above Average – Carreras Salvadas Sobre el promedio)

Estadísticas Avanzadas Defensivas

Sobre el autor del post

José Ramil

Me gusta esto:

Leave a Reply Cancel Reply

Estadísticas Avanzadas Ofensivas

OPS (On Base Plus Slugging)

wOBA (Weighted On-base Average)

RC (Runs Created)

Estadísticas Avanzadas Pitcheo

FCþ (Factor de Control)

FKþ (Factor K)

FDþ (Factor Dominante)

DB% (Porcentaje de corredoras Dejadas en Base)

WHIP (Walks plus Hits per Innings Pitched – Boletos más Hits por Entradas Lanzadas)

FIP (Fielding Independent Pitching – Pitcheo Independiente de la Defensa)

RSAAþ (Runs Saved Above Average – Carreras Salvadas Sobre el promedio)

Estadísticas Avanzadas Defensivas

Sobre el autor del post

José Ramil

Comparte esto:

Me gusta esto:

Leave a Reply Cancel Reply