Muito além dos mapas de calor: O que é e para que serve Controle de Campo

A coluna apresenta os dados de rastreamento, que mostram como explorar ou causar os erros no futebol

O texto de hoje fecha o que eu imagino ser um ciclo introdutório nessa coluna, abordando os três tipos de dados disponíveis e o que se pode extrair deles. No primeiro texto, a partir de dados de relatório das partidas – esses que são encontrados facilmente em qualquer fonte – foram apresentados mosaicos de desempenho dos times ano a ano. O segundo texto falou sobre xG, que é uma métrica calculada inicialmente a partir dos dados de eventos da partida (cada chute, cada passe, como foram feitos, a ordem em que foram feitos, etc).

O tópico de hoje é baseado nos dados de rastreamento, que monitoram a posição dos jogadores ou jogadoras durante a partida. Diferente dos anteriores, este tipo de dado é muito raro de ser encontrado; gratuitamente, só conheço pequenas amostras de empresas como StatsBomb, Wyscout e Metrica. Além disso, por ser muito específico, não é simples de ser simulado. Por conta disso, a menção a esse tipo de dado hoje vai quebrar um princípio da coluna e vai extrapolar o Campeonato Brasileiro. Mas como o objetivo ainda é mostrar aplicações, então vou explicar o que é o Controle de Campo.

[foo_related_posts]

O que é controle de campo

Quando eu estava escrevendo minha dissertação de mestrado, estava na dúvida sobre como falar sobre a origem de um assunto: afirmar objetivamente e correr o risco de ser contrariado, ou simplesmente deixar pra lá. A sugestão que recebi foi iniciar a frase com “de acordo com o nosso conhecimento”. Com isso, a afirmação pode ser objetiva e também contrariada, porque você abre o espaço para o aprendizado. Rigor científico é uma coisa, né?

Acabei não usando na dissertação, mas agora a oportunidade parece ideal: de acordo com o meu conhecimento, o Controle de Campo é um conceito desenvolvido por uma equipe da empresa Hudl (dedicada à análise esportiva). A pesquisa e a construção do modelo foram lideradas por William Spearman, que hoje é analista de dados no Liverpool.

Figura 1- Modelo de Controle de Campo (Fonte: Willian Spearman, no canal Friends of Tracking)

A imagem é quase auto explicativa, até mais bonita que a descrição, mas vamos lá. Na Figura 1, o time azul ataca para a esquerda e o vermelho para a direita (sem trocadilhos políticos aqui). A área colorida indica a probabilidade de posse da bola, caso ela seja direcionada para aquela região: quanto mais forte a cor, maior a chance daquele time reter a posse. As áreas brancas são espaços em que a chance é próxima de 50% para cada time.

Notem o seguinte: o modelo não leva em conta apenas a posição do jogador ou jogadora. Ele considera a velocidade de todos os atletas, a velocidade da bola e até as incertezas inerentes ao jogo (como um domínio ruim, por exemplo). Pra ser honesto, não sei como são incluídas variáveis como vento e condição do gramado – mas estádios com menos estabilidade nessas variáveis ainda não têm esse tipo de aplicação, então acho que não faz tanta diferença.

Para que serve o Controle de Campo

Na estreia da coluna, eu mencionei um reconhecimento que recebi de um trabalho em uma competição de dados, promovida pelo Seattle Sounders. O trabalho que eu apresentei lá foi justamente baseado em Controle de Campo. E é exatamente o mesmo exemplo que eu vou usar aqui pra falar sobre a aplicação. A quem interessar possa, a apresentação está neste link.

Um uso comum do Controle de Campo é identificar movimentos feitos pelos jogadores que criam boas oportunidades de gol. Pense em um time trocando passes até uma bola enfiada nas costas do(a) lateral. O movimento do(a) atleta que vai receber o passe é decisivo, e ele é bem identificado por essa análise.

O que eu vou apresentar aqui é o outro lado da moeda. É o ponto de vista da defesa. É usar o Controle de Campo para minimizar erros. Até porque esse é o principal caminho para as vitórias. Como sempre diz o Leandro Iamin, apresentador do podcast da Trivela, 99% de todos os jogos são ruins, mal jogados. O futebol é um jogo de erros, e quanto menos forem cometidos, maior a chance de sucesso.

As quatro imagens a seguir foram geradas por este colunista a partir de dados da Metrica Sports. Estes dados são deliberadamente maquiados, isto é, não há informação sobre quais são os times e a qual jogo se referem. Então eu, também deliberadamente, resolvi que é um Grenal. Ninguém vai me provar que não é.

Figura 2 – Os eventos do jogo sendo a) Passe para trás b) Passe para frente c) Recuperação d) Finalização

Vejam na sequência como se deu: na primeira imagem, o Grêmio pressiona a saída de bola do Inter, e o volante recua a bola pro goleiro. Na segunda, o(a) goleiro(a) alivia a pressão pra um chute pra direita. O Grêmio recupera a bola na terceira imagem. Com espaço suficiente pra avançar, a quarta imagem mostra o momento da finalização a gol – que foi bloqueada e gerou um escanteio.

O erro do goleiro pode ser evidente no campo, mas a correção nem sempre é tão clara. No pós-jogo, usando o Controle de Campo, o(a) goleiro(a) vai ver que o passe foi direcionado pra uma região dominada pelo(a) adversário(a). Nessa situação, ele teria pelo menos 4 melhores opções de passe, que estão destacadas na Figura 3.

Figura 3 – Possíveis destinos para o passe do goleiro, para manutenção da posse

Das cores para os números: o passe que o(a) goleiro(a) fez teve, segundo o modelo, 3% de chance de ser recebido por um(a) companheiro(a). Considerando os(as) jogadores(as) marcados como possíveis destinos para passes, as chances de manter a posse de bola e, consequentemente, ter mais chances de aliviar a pressão, seriam 97,5%, 91,4%, 91,8% e 88,7%, respectivamente de acordo com a numeração.

Como se calcula o Controle de Campo

Haha, não, não, até parece que eu vou detalhar isso aqui, não é o objetivo. Mas se por acaso você sabe ou quer saber, entra em contato comigo no Twitter.

O futuro do Controle de Campo

O uso dos dados de rastreamento não é limitado ao Controle de Campo. Aqueles mapas de calor, que o leitor certamente conhece bem, já são oriundos de tais dados. Particularmente, acho que o uso melhor dessa informação é feito em segmentos do jogo, em históricos de jogos e considerando interações com adversários, mas isso é tópico pra outro espaço.

Já existem, e há espaço para mais, métricas que incrementam esse modelo. Uma questão direta é perceber que o Controle de Campo permite perceber boas opções de passe para manter a posse, mas não indica necessariamente a melhor opção de passe, que coloca o time em uma posição mais vantajosa. Alguns modelos como EVP, VAEP, g+ e xT já estão circulando nos bastidores dos grandes clubes do mundo.

Um campo bem interessante em desenvolvimento é o da Visão Computacional. Tem a ver com aquela Realidade Aumentada, que são projeções e/ou leituras computacionais que acompanham o que acontece em um vídeo.

Vincular Visão Computacional e Controle de Campo pode ser uma revolução no modo de gerenciar um time de futebol. Sabe o engenheiro que avisa o piloto por rádio como está cada peça do carro dele? Imagine o que um(a) treinador(a) pode fazer com essa telemetria a seu favor. Talvez isso seja um mundo utópico, mas talvez a gente ainda veja algo nesse sentido enquanto sente saudade do tempo em que o diferencial do jogo era mandar o talismã aquecer.

Bom, com isso considero a coluna introduzida. Enquanto eu preparo uma análise voltada para o Brasileiro, com dados fáceis de alcançar e compreender, os próximos textos devem trabalhar algumas hipóteses e procurar respostas nos números para dúvidas do nosso dia-a-dia.

Quer ler os outros textos do Critério de Desempate? Clique aqui.