La possession est le casse-tête de l’analyse du football. Ces modèles tentent de le résoudre.


En 2011, un développeur de logiciels nommé Sarah Rudd en a eu marre des statistiques de football conventionnelles. Il était facile de compter le nombre de passes qu’un joueur a tenté et complété, mais toutes les passes ne sont pas égales. « Nous savons que le pourcentage de réussite est une mesure terrible pour évaluer à quel point vous êtes bon passeur », m’a-t-elle dit. Que valaient vraiment ces actions ?

Lors d’une conférence à Harvard cet automne-là, Rudd, qui avait lancé un blog analytique après avoir parlé au propriétaire des Sounders de Seattle, Adrian Hanauer, de « Moneyball, mais pour le football », a présenté une meilleure façon de valoriser les actions. Elle a divisé le jeu en 37 états différents, déterminés par des facteurs tels que l’emplacement du ballon et l’organisation défensive, et a calculé la probabilité que chaque état aboutisse à un but ou à un chiffre d’affaires. Chaque fois qu’un joueur faisait passer le ballon d’un état à un autre, par exemple en dribblant sur l’aile ou en jouant une passe décisive, il était crédité du changement des chances de marquer de son équipe. Soudain, une passe n’était pas seulement complète ou incomplète – elle avait une valeur de but attendue.

Le concept sur lequel Rudd a frappé est parfois appelé « valeur de possession », et c’est un élément important de l’analyse du football. Au cours des dernières années, alors que les données sont devenues plus largement disponibles, de plus en plus de personnes ont commencé à essayer de mesurer la grande majorité confuse du jeu qui se déroule entre les tirs. Nous avons vu un boom dans diverses approches du même problème Rudd était curieux : dans quelle mesure une action sur le terrain change-t-elle la probabilité de marquer (et, pour certains modèles, de concéder) ?

« Le travail que Rudd a fait couvre vraiment toutes les parties importantes de la philosophie des modèles de valeur de possession », a déclaré Javier Fernandez, l’ancien responsable de l’analyse sportive au FC Barcelone. « La question fondamentale que tout le monde veut résoudre est : « Comment modéliser l’état du jeu à tout moment, et que pouvons-nous en tirer au sujet de la récompense future ? » « 

De nos jours, il existe tout un tableau périodique des différents modèles de valeur de possession. Mais pourquoi y en a-t-il autant – et que nous montre chacun exactement ?

Le type de modèle de valeur de possession le plus simple est basé sur l’emplacement : la probabilité moyenne de continuer à marquer où que se trouve le ballon. Passer ou dribbler vers le but de l’adversaire améliore généralement les chances de marquer de l’équipe, de sorte que les joueurs qui font progresser le ballon ajoutent de la valeur avec leurs actions, tandis que les joueurs qui passent en arrière ou retournent le ballon perdent de la valeur. C’est l’idée derrière Karun Singhmodèle populaire de menace attendue (xT).

Mais l’emplacement ne fait pas tout. Une passe du cercle central vers le haut de la surface peut être une passe en profondeur précieuse qui met un attaquant en tête-à-tête avec le gardien, ou ce peut être un lob sans valeur dans une foule de défenseurs. « Avec seulement des emplacements xy, il est vraiment difficile de dire : « Est-ce réellement une passe productive à faire ? » « , a déclaré Rudd. Pour des valeurs de possession plus précises, vous avez besoin d’un contexte sur ce que font vos coéquipiers et vos adversaires loin du ballon.

Le problème est que la plupart des données sur le football ne vous disent pas ce qui se passe en dehors du ballon. Pour deviner ce qu’ils ne peuvent pas voir, certains modèles utilisent des fonctionnalités d’historique de possession, telles que la vitesse à laquelle le ballon s’est déplacé vers le haut du terrain, comme indicateurs de la désorganisation défensive. « Il pourrait y avoir un léger biais » lors de l’utilisation de proxies, a déclaré le data scientist du Club de Bruges Jan Van Haaren, qui a aidé à développer le modèle VAEP avec un groupe d’apprentissage automatique à la KU Leuven. « Mais je pense toujours que c’est mieux que d’utiliser aucun contexte du tout. »

De tels modèles d’apprentissage automatique peuvent prendre en compte plus d’informations sur le jeu qu’un simple emplacement. Ils peuvent faire la différence entre une passe et un carry, et ils peuvent mesurer la valeur d’une action comme un take-on qui ne fait pas progresser le ballon. D’un autre côté, il est plus difficile d’interpréter pourquoi un modèle basé sur un arbre valorise une situation comme il le fait. «Nous savions qu’il y aurait beaucoup de choses sur la possession que nous voulions mesurer. Mais nous avions besoin de beaucoup de données », a déclaré Matthias Kullowatz, qui a conçu les objectifs d’American Soccer Analysis a ajouté le modèle (g+). « Si vous n’avez qu’un seul exemple d’arrière droit ayant le ballon au drapeau de coin, vous obtiendrez une estimation potentiellement merdique de la valeur. »

Bizarrement, l’une des parties les plus difficiles de la valeur de possession est d’établir ce qu’est une « possession ». Le modèle EPV de données de suivi de pointe de Fernández le définit comme la fenêtre entre un coup d’envoi et un but pour l’une ou l’autre équipe (ou la fin d’une mi-temps). La plupart des autres modèles comme g+ comprennent la « possession » comme le font les fans : une séquence de contrôle du ballon par une équipe qui se termine par un but ou un chiffre d’affaires. Mais il n’est pas toujours facile de dire quelle équipe contrôle le ballon, et l’idée qu’une équipe perd toute chance de marquer après un revirement peut produire des valeurs drastiques qui n’ont pas de sens pour le football. Par exemple, un milieu de terrain dont la dernière passe du haut de la surface est bloquée peut se faire marteler par le modèle pour avoir jeté une possession précieuse, même si son équipe est toujours en bonne position pour récupérer le ballon et marquer.

Nils Mackay, qui a publié son propre modèle alors qu’il était encore étudiant, a résolu ces problèmes en modifiant la fenêtre du modèle PV de Stats Perform d’estimer la probabilité de marquer sur la possession actuelle aux 10 secondes suivantes. « De cette façon, vous n’avez jamais qu’un événement soit la fin de quelque chose », a-t-il déclaré. « Quand nous avons fait cela, nous avons vu que les chiffres s’alignaient beaucoup plus sur l’intuition. Les joueurs peuvent toujours être sévèrement pénalisés s’ils perdent le ballon, mais souvent ce ne sera pas aussi sévère s’il y a encore de la valeur dans ce qu’ils ont fait.

Le revers tout aussi délicat du problème du chiffre d’affaires est de savoir comment évaluer les coups. Vous pourriez penser que tout comme une ailière augmente les chances de marquer de son équipe de 5% à 30% en passant le ballon à un attaquant devant le but, l’attaquant l’envoie à 100% lorsqu’elle trouve le filet ou à 0% lorsqu’elle manque. Mais cette approche conduit à des valeurs de tir importantes et volatiles similaires à la différence inconstante entre les buts et les buts attendus. Lorsque l’équipe de la KU Leuven a introduit une version de VAEP qui utilise des valeurs de tir de type xG, le nombre de joueurs est devenu beaucoup plus stable.

Un modèle EPV de données de suivi montre comment la valeur de possession augmente à mesure qu’un jeu devient plus menaçant. FERNÁNDEZ ET AUTRES.

Les futurs modèles de valeur de possession verront davantage le jeu. StatsBomb retravaille son modèle OBV en utilisant des images fixes de diffusion pour capturer les positions hors ballon. Connaître l’environnement du porteur du ballon ne fera pas que rendre les valeurs de possession plus précises ; cela permettra des types de mesure que les données d’événement ne peuvent pas faire. Le modèle EPV de données de suivi de Fernández divise la valeur de possession en modèles de composants pour des valeurs plus fines et un meilleur aperçu de la prise de décision des joueurs. Il peut même attribuer une valeur de but à des actions telles que des courses fictives qui manipulent la défense mais ne touchent jamais le ballon.

À quoi servent tous ces modèles de valeur de possession ? Dans les clubs, l’une des applications les plus précieuses est le recrutement. Liverpool a utilisé la valeur de possession pour aider à repérer son équipe qui a conquis l’Europe avec un budget modeste. Le suivi des modèles de données peut également offrir des informations tactiques. « Si vous pouvez dire à un joueur, lorsque l’adversaire joue un 4-4-2, les deux CM laissent de l’espace dans cette situation particulière, parfois cela suffit », a déclaré Fernández. « Un entraîneur m’a dit un jour que si vous ne pouvez dire à un joueur qu’une seule chose qui peut améliorer son jeu, il va vous aimer pour toujours. »

Quant à Rudd, son travail sur la valeur de possession lui a permis de décrocher un emploi à Arsenal, où elle était jusqu’à récemment responsable de l’analyse. Mais cela offrait également la récompense intrinsèque de se rapprocher un peu plus de ce sport impossible. « Je me souviens avoir lu un commentaire qui disait: » Nous ne pouvons pas quantifier la capacité de Santi Cazorla à séparer deux défenseurs «  », a-t-elle déclaré. « Et j’étais comme, ‘Oh ouais?’ « 

Découvrez nos dernières pronostics de football.



Laisser un commentaire