Peu d'actions et peu de buts, peu de % de tirs ratés ou réussis en effet.Et des scores serrés avec prédominance de 1-0 1-1 0-1 .Les sabermetrics sont issues de baseball, basketball et hockey sur glace etc...Où en effet plus de points, de tirs avec des terrains plus petits.
Une méthode connue avait été améliorée en favorisant ces scores under 2,5 buts, avec une pondération (je vais pas développer ), mais ce sont les travaux essentiels de Maher, Dixon-Coles qu'on trouve facilement.Ceux de Ianis Nzoufras et d'autres encore...Pas le temos de tout lire mais pour ceux que çà interesse, sur le site Academia je reçois les mails qui me proposent les travaux universitaires liés aux sports, des fois des trucs Bayesiens j'ai pas le matériel et le temps pour ça, mais certains trucs sont intéressants..en anglais et de niveau universitaire, je lâche un peu niveau maths des fois, beaucoup.
Au delà, plus précis,, les tirages aléatoires tels ceux de Fabien Torre, par exemple.
La facilité de monter le ballon de la surface du gardien à celui de l'adversaire serait forte qu'un % de finalisation face au gardien faible ou nul donnerait toujours un nombre de buts espérés très faible.Et si une équipe ne remonte qu'une fois le terrain, mais finalise le but 100% du temps donnerait qu'un but espéré.
L'interprétation des données qui amènent ces xG sont donnent une idée de leur densité de pertinence.C'est pourquoi plus il y a de critères plus on a des chiffres pas versatiles.En effet on peut s'y perdre sur tous les critères retenus.
Pour statsMalherbe je sais pas si il compare à une moyenne ou prend les données brutes du match, il y a plusieurs façons de créer les xG d'un match passé.
J'estime un nombre de but attendu par équipes mais me sers pas de fréquence de tirs etc...juste buts marqués encaissés un truc tout simple., mais avant match.
Pour les xG d'un match passé, une équipe peut sur ou sous performer, selon le modèle choisi, je retrouverai quelques liens qui explique ça il y a 2 façons de les créer : données du matchs et données du matchs comparées à une moyenne (équipe ou ligue je sais plus)...et là il peut y avoir sur ou sous performance...Un Malherbe qui plante 2 fois avec un xG de 0,4 par exemple..
Edit: par exemple le dernier truc que j'ai reçu :
https://www.academia.edu/keypass/N1IyaX ... load-paperhttps://www.academia.edu/2483597/An_Exp ... load-paperIci on y parle du SMC.. (Et de Nîmes)
https://www.academia.edu/keypass/U3VsS0 ... load-paperDimitris Karlis a aussi publié des choses interessantes
https://www.academia.edu/1317954/Bivari ... card=titleComme Ioannis Ntzoufras
https://www.academia.edu/1008432/Statis ... load-paperLes travaux de Maher, Dixon et Coles sont la base on les trouve facilement sur internet, ils ont amélioré un vieux manuel de statistiques d'une société anglaise du 19 ou début 20 eme siècle qui était la bible des premiers statisticiens.Quand à ma fameuse méthode B.A.S.I.L. je me suis aperçu qu'elle existait en bonne partie là dedans (l'estimation de buts, pas la distribution de probabilité)..Je me sers donc d'un peu tout ça et trouvé une façon de simplifier la pondération plus importante des dernières performances comme Dixon et Coles, mais sans un modele de chaînes de Markov qui sont plus performantes, selon Rue et Salvesen.Pour intégrer le facteur forme.
Un match en 10 mn avec une calculatrice scientifique à tableur (ou exel, Open Office) et un ou deux site de classement, j'ai déjà vu si Malherbe gagne ou pas.Généralement j'inverse le résultat...Pour calculer le classement final d'un championnat impossible, par contre.
La méthodes Massey j'ai pigé tout seul, elle est finalement assez simple, mais il faut un matériel puissant.Pour une poule de "Round Robin" c'est pratique. Pas pour un championnat.La méthode Elo est bien décrite sur ClubElo (clubs) ou EloRatings(équipés nationales).
Prévoyez la plaquette d'anti-migraine, ou le fût de Fischer !