Critério de Desempate

Um texto sem números sobre os números no futebol: Parte 2 – A primeira nova estatística

Você definitivamente sabe o que é uma média móvel. Pode não saber calcular, pode não ter a definição precisa na ponta da língua, mas não é um conceito de outro mundo. Só que eu aposto que você não sabia o que era uma média móvel lá naquele passado distante pré-pandemia em que a gente podia aglomerar. Se há menos de um ano você foi apresentado a esse conceito e hoje ele te é familiar, não há porque ter medo do xG.

Em uma frase, pra facilitar a vida de todo mundo: xG mede a qualidade dos chutes. Quanto maior, melhor. E é isso, você já está preparado pra entender quando isso aparecer na sua tela. Sim, é “quando”, e não “se”. Vou falar mais disso em breve, mas antes quero contextualizar bem o que é essa estatística. Eu já falei sobre isso aqui no Critério de Desempate, mas o novo desafio é falar sem usar números. Então vamos em frente.

xG é uma corruptela para expected goals, ou gols esperados. Vai ser difícil emplacar uma tradução pra sigla, que já está consolidada, e a primeira alternativa de tradução vai coincidir com a sigla do Globo Esporte. Anglofonismos à parte, é o seguinte: cada chute a gol tem um xG. O valor desse xG é a chance de o chute virar em gol.

E isso aqui é crucial pra coisa toda: essa chance é calculada diretamente a partir de centenas de outros chutes anteriores parecidos com aquele. Ou seja, é baseado em uma tendência de acontecimentos semelhantes do passado. Toda essa coisa de Ciência de Dados, na verdade, é isso aí: olhar pra registros do passado e tentar encontrar tendências numéricas pra acontecimentos futuros.

Agora, o que caracteriza um grupo de chutes como semelhante? Bom, aí vai de cada um. O modelo mais simples (mais ingênuo, mais didático, qualquer desses adjetivos serve) usa só a distância para o gol e o ângulo do chute. Muitos modelos usam o tipo da assistência (passe, cruzamento, lateral), parte do corpo (pé, cabeça, barriga), bola parada ou não, contra ataque ou não, se teve rebote, drible, pressão…

O modelo do Statsbomb inclui a altura da bola. O modelo do Wyscout tem um parâmetro manual pra dizer se a jogada era perigosa ou não. O modelo da Globo usa a altura do goleiro. Qualquer outra coisa pode virar parâmetro. Quem executa o chute é uma informação relevante? O dia da semana? A cotação do dólar? Tudo o que fizer sentido e tornar o número mais preciso serve de parâmetro de um modelo.

Com isso, dá pra ver como o xG é complexo. Paradoxalmente, ele é simples: é só um número. É fácil comparar um monte de chute diferente usando essa métrica. Ele te dá um caminhão de informação de jogos, inclusive os que você nunca viu, em um segundo. É bem mais informativo que total de passes trocados ou distância percorrida por um jogador. E também é um ótimo preditor de gols, mas acho que isso já é informação demais, fica aí só pra registro.

Mas não se enganem, que aqui não tá ainda a Resposta para a Vida, o Universo e Tudo Mais (que é um número, e se vocês acharam que eu ia quebrar a regra do texto, sinto muito, continuem procurando). O xG é insuficiente. Ele só fala de chutes a gol, e não necessariamente quem chuta melhor joga melhor. Ou, mesmo que a premissa seja verdadeira, ele ainda não explica como um time cria boas oportunidades de gol.

Essa é uma máxima da análise de dados: uma estatística sozinha não diz muita coisa. Sempre é preciso encaixar bem no contexto. Uma análise estatística de qualidade envolve entender tanto o que os números dizem quanto o que os números não dizem. Em um jogo de futebol, tem muito mais passes que chutes; como o segundo seria suficiente pra entender tudo o que aconteceu na partida?

Por conta disso, ainda que o xG seja uma estatística final pra muita gente, pode ser também um ponto de inflexão pra gente dar chance a mais e mais leituras numéricas do futebol. A função principal do xG é entender melhor o jogo que a gente ama tanto. Uma função secundária é gerar curiosidade, sejam elas filosóficas ou analíticas. A minha, em particular, é tentar entender mais aspectos do jogo a partir das análises de dados. As possíveis curiosidades para o público é o que vamos discutir na sequência desta série.

.

Mostrar mais

Rodrigo Salvador

Rodrigo Salvador é matemático industrial e mestre em Engenharia de Produção. Nas horas vagas e algumas outras, entusiasta da análise de dados no futebol

Artigos relacionados

Botão Voltar ao topo