www.forumsmc.com

Forum des supporters du Stade Malherbe Caen
Nous sommes le 01 Nov 2024 01:18

Heures au format UTC + 1 heure




Poster un nouveau sujet Répondre au sujet  [ 224 messages ]  Aller à la page Précédente  1 ... 11, 12, 13, 14, 15

Quel titre ?
Savoie repartir 4%  4%  [ 1 ]
Allez Petits à Petit ! 0%  0%  [ 0 ]
En voiture Simone ! 8%  8%  [ 2 ]
Se taper Denise ? Oh ! 17%  17%  [ 4 ]
Gaze ton petit. 17%  17%  [ 4 ]
Cheikh Berry 17%  17%  [ 4 ]
Berryzina 38%  38%  [ 9 ]
Nombre total de votes : 24
Auteur Message
Répondre en citant le message  MessagePosté: 24 Mar 2021 11:07 
Hors ligne
Avatar de l’utilisateur

Inscription: 31 Aoû 2005 21:06
Messages: 19558
Localisation: En Papabloguie
Pour info, « Bon week-end Pascal» est une marque déposée Abidbol de Le Forum depuis 2017.

_________________
Make Le Forum great again !


Haut
 Profil  
 
Répondre en citant le message  MessagePosté: 24 Mar 2021 12:18 
Hors ligne

Inscription: 31 Aoû 2005 21:06
Messages: 3065
Localisation: Tourlaville
Ce fut un titre gagnant ou tu as été crucifié ?


Haut
 Profil  
 
Répondre en citant le message  MessagePosté: 24 Mar 2021 15:18 
Hors ligne
Avatar de l’utilisateur

Inscription: 31 Aoû 2005 21:06
Messages: 9725
Localisation: 15e de Huis' Treham
Huisgonde a écrit:
Huisgonde a écrit:
Tiens, d'ailleurs, y'a une incohérence, curieux de voir du coup pourquoi et comment il tombe dessus.

Sur la page de Caen, "maintien possible à partir de 36 points", mais sur la page de Ligue 2, "possible à partir de 33 points".

S'il existe un scenario où le 17e a 33 points, c'est donc possible pour Caen sans point supplémentaire aussi. Donc ça doit pas être les mêmes simulations de part et d'autres...

J'pense que basile va m'éclairer.


Comme Basile ne m'a pas éclairé, j'ai demandé à Fabien Torre directement.

Premier élément, il faisait 1 million de simulations par le passé mais un peu moins désormais pour économiser son CPU (il ne m'a pas dit combien).

Secundo, sur le cas que je lui ai donc remonté, il m'a dit que c'était effectivement étrange, il a regénéré cet aprem (avec plus de scenarios apparemment) pour trouver le problème mais il n'est pas réapparu (maintenant, le minimum possible pour se maintenir est descendu à 32pts, et sur notre page, on peut donc logiquement se maintenir sans points supplémentaires). Il va guetter si ça se reproduit mais ça n'aurait pas du arriver en gros.

Troisième enseignement, le nombre de points probable n'a pas bougé sur sa nouvelle simulation pour le 17e : toujours 39.


Bon, même si ça n'intéresse pas grand monde, à part basile (et p'tete Hastings ou BigDudu), j'ai la raison finale de ce "bug" (apparemment ça l'a tourmenté un peu :D).

Parmi toutes les simulations effectuées à ce moment-là :
- Il est arrivé au moins une fois qu'une équipe se maintienne qu'avec 33 points (avec Caen bien sûr maintenu) --> Le site indique "Maintien possible à partir de 33 points".
- Caen descendait à chaque fois s'il restait à 35 points, il ne commençait à se maintenir qu'à 36. --> Le site indique "Maintien possible à partir de 36 points."

En d'autres termes, dans les simulations effectuées où le maintien était possible entre 33 et 35 points, Caen atteignait au moins 36 points (dans ces derniers cas, il aurait donc pu se permettre un nul de moins par exemple, mais aucune simulation n'a sorti ça = c'est l'exemple parfait que ça ne simule pas tous les cas possibles).


Haut
 Profil  
 
Répondre en citant le message  MessagePosté: 24 Mar 2021 16:42 
Hors ligne
Avatar de l’utilisateur

Inscription: 11 Oct 2013 15:38
Messages: 7700
M'étonnerait qu'un topic ait porté ce nom, pour un match en 2017 en tous cas.Et pas contre Toulouse , un match gagné par chaque en 2017.
Âpres l'expression je l'ai déjà lue ici, aussi.Dans un autres contexte.
Et avec Pau, ce serait pas de bol de manquer de titre.
Ex:
Pas de pot ce week-end, Pascal.

Entre temps merci huisgonde pour ton investissement, en effet si les résultats de Malherbe m'intéressent autant que beaucoup ici, leur prévision et les différentes façons de les présager m'intéresse tout autant.
J'aurais pas eu l'idée de contacter l'auteur d'une page et c'est bien heureux qu'il soit disponible, et qu'il garde pas totalement secrète sa procédure (il est chercheur, il vend pas son truc, çà fait la différence). Celle de fiveforty truc est, pour celui qui comprend l'anglais, complexe, complète et faut vraiment s'y connaître.
À 10 journées de la fin du championnat, sans compter les différences de goal average, il y a des milliers de scénarios différents et une simulation de millions de matchs (je dirais au moins 1000 fois la réalité il reste une centaine de matchs à jouer).... Certains scénarios "extrêmes" peuvent donner des résultats surprenants et contradictoires, sur plusieurs équipes et en particulier les relégables.
Exemple on perd tous nos matchs et les actuels relégables les gagnent.Il faut plus de points pour se maintenir.À l'inverse si le ventre mou s'effondre, il faut moins de points pour se maintenir.
Il ne parle plus de (ou j'ai pas retrouvé) son choix de simuler le gagnant du match et des classements finaux avec la moyenne de gagnants domicile / matchs nuls / gagnants extérieurs - 1N2- il est de 41% domicile 32% de nuls et 27% de matchs gagnés la l'extérieur actuellement par exemple.Un réel rapport de force avec un rapport offensif défensif entre chaque équipe est plus fiable mais plus compliqué, car différent à chaque match...ça pourrait expliquer pourquoi il y a eu moins de scénarios simulés, ça demande plus de calculs.
En tous cas remercions le , et si on peut lui dire qu'on s'intéresse à son travail, ça peut lui faire plaisir.


Haut
 Profil  
 
Répondre en citant le message  MessagePosté: 24 Mar 2021 17:11 
Hors ligne
Avatar de l’utilisateur

Inscription: 31 Aoû 2005 21:06
Messages: 9725
Localisation: 15e de Huis' Treham
basile a écrit:
À 10 journées de la fin du championnat, sans compter les différences de goal average, il y a des milliers de scénarios différents et une simulation de millions de matchs (je dirais au moins 1000 fois la réalité il reste une centaine de matchs à jouer).... Certains scénarios "extrêmes" peuvent donner des résultats surprenants et contradictoires, sur plusieurs équipes et en particulier les relégables.
Exemple on perd tous nos matchs et les actuels relégables les gagnent.Il faut plus de points pour se maintenir.À l'inverse si le ventre mou s'effondre, il faut moins de points pour se maintenir.

Je l'ai dit un peu plus tôt, il y a 3^le nombre de matches restant à jouer. Il reste 8 journées, 80 matches à jouer, donc 3^80 possibilités (un nombre à 38 zéros, donc c'est bien loin de pouvoir tout couvrir)

Citation:
Il ne parle plus de (ou j'ai pas retrouvé) son choix de simuler le gagnant du match et des classements finaux avec la moyenne de gagnants domicile / matchs nuls / gagnants extérieurs - 1N2- il est de 41% domicile 32% de nuls et 27% de matchs gagnés la l'extérieur actuellement par exemple.Un réel rapport de force avec un rapport offensif défensif entre chaque équipe est plus fiable mais plus compliqué, car différent à chaque match...ça pourrait expliquer pourquoi il y a eu moins de scénarios simulés, ça demande plus de calculs.


Comme j'ai dit également, il a affiné un peu sa méthode en prenant en compte le classement (si c'est une équipe de haut de tableau contre une autre équipe de haut de tableau, ce sera pas pareil que si c'est contre une équipe de bas de tableau). Pas plus de détail que ça en revanche.

Mais le principe, c'est bien ça - il me l'a d'ailleurs confirmé. Sur une simulation, chaque résultat est déterminé selon une probabilité. Par exemple, si le modèle de la rencontre est ton 41%-32%-27%, il génère un nombre au hasard entre 1 et 100. Si ce nombre est entre 1 et 41, c'est 1. Si c'est entre 42 et 73 ce sera N, si c'est entre 74 et 100, ce sera 2. Et il fait ça pour tous les matches restants, ça fait donc un classement final pour un scenario. Il le répète un grand nombre de fois, et il a donc un grand nombre de scenarios.

Ce que je ne sais pas, par contre, c'est si le modèle de probabilité utilisé ("haut de classement" ou "bas de classement"), est figé pour un club, je le pense (on pourrait imaginer qu'un club de bas de tableau gagnant tout passerait haut de tableau, mais je pense que non, le club garde son "statut" pour tout le scenario).


Haut
 Profil  
 
Répondre en citant le message  MessagePosté: 24 Mar 2021 20:05 
Hors ligne
Avatar de l’utilisateur

Inscription: 11 Oct 2013 15:38
Messages: 7700
Dans le cas où un club mal classé gagne 3 points une journée, ses chances augmenteraient la journée suivante, il aurait plus de "force" à jouer face à son adversaire.

L'enchaînement dans le calendrier des adversaires et de leur "force" , leur position ou nombre de points doit donner , à chaque scénario ou hypothèse pour une équipe, quelque chose qui finit par se ressembler...comme des courbes qui se superposent ou un nuage de points dense , avec sur des milliers de milliers de suppositions, quelques points épars.

41/32/27 c'est la moyenne de ligue 2 de "1N2" avant la dernière journée (il a pas dû bien changer depuis soccerstat le donne en bas de page du classement ligué 2 avec par exemple 1,3 buts marqués par équipe à domicile et 1,03 buts marqué(s) en moyenne par une équipe à l'extérieur, et les % de scores par exemple 15% de 1-1 , 16% de 1-0 , 10% de 0-0 etc...).
Evidemment en tant que moyenne elle peut s'appliquer à une poignée de matchs dans une journée, mais le premier qui reçoit le dernier il est bien plus pertinent d'oser 65% / 20% / 15% par exemple.La simulation sera plus efficace.

À chaque fin de journée les données qui représente la force qui doit être utilisée pour un rapport de force (toute méthode de pronostique confronte une donnée d'une équipe à celle d'une autre il a peut-être pas développé sa cuisine ça se comprend) doit actualisée en vue de la confrontation avec l'équipe rencontrée la journée suivante.
En pratique passer de haut à bas de classement ou l'inverse (comme les % de promotion ou relégation qui sont donnés on peut voir des équipes y apparaître ou disparaître) c'est rare...
Un coefficient selon le classement et/ou le nombre de points (ou de goals averages ou encore buts pour but contre etc..) , et à partir de là établir la probabilité du 1N2 du match, effectuer la génération du % aléatoires suffisamment de fois pour avoir une convergence cohérente et établir le nombre de points marquée -ou pas- par chaque équipe à chaque journée. Journée par journée pour avoir une dynamique, comme prendre en compte la forme pour pas figer le classement.
Après ça dépend des capacité de calcul.À la main, avec exel ou une calculatrices scientifique tableur programmable, il faut une bonne demi-journée pour simuler le classement final , en probabilisant tous les matchs à l'avant dernière journée.Sans logiciel de calcul programmable comme WinBug ou R il en y en a d'autres, impossible sur plusieurs journées.Les simulations Monte-Carlo , chaînes de Markov etc...j'avoue que je vais pas au bout.La méthode Massey sur 20 équipes il faut des matrices de 20x38 et résoudre une équation à 20 inconnues, donc aussi du matériel adapté.
Fiveforty utilise un peu tout ça, ils décrivent leur procédé mais pas totalement.

L'astuce est de faire simple et efficace.Ce serait un coefficient selon le classement (haut ou bas de tableau, la ligue 2 est ventripotente la vraie différence se fait entre les candidats à la promotion et ceux de la relégation. Entre les 2 c'est même niveau, même coef. et plus simple est l'estimation du rapport de force, plus l'ordi reste disponible pour tester un maximum de cas, ce qui donne des estimations plus sûres.)..

Encore un pavé pour écrire qu'une équipe devrait pouvoir voir son classement évoluer dans les simulations et peut-être entrer dans une des catégories haut et bas de tableau, au fil des journées simulées par semaine.Sauf si une équipe voit son parcours simulé linéairement jusqu'à la dernière journée, mais j'en doute, car le classement de chaque équipe évolue à chaque journée, on peut le consulter sur site.
Bonne journée, je sais pas si vous aurez la journée pour lire ça, et je trouvais que j'avais pas assez écrit ce mot.Il fait déjà nuit.


Haut
 Profil  
 
Répondre en citant le message  MessagePosté: 24 Mar 2021 21:56 
Hors ligne
Avatar de l’utilisateur

Inscription: 11 Oct 2013 15:38
Messages: 7700
J'avais essayé ça mais entrer la liste le donne toujours une erreur...même une pour une liste d'une partie d'échec connue trouver sur FIDE ou un site aussi fiable .Le Basile, boulet.
https://www.remi-coulom.fr/Bayesian-Elo/
On peut simuler le classement d'un tournoi d'échecs et aussi donc celui d'une ligue de football..il suffit d'adapter le document .txt qui doit avoir une certaine nomenclature pour être interprété par le programme, mais on peut remplacer les paramètres d'un gagnant aux échecs dans une partie d'un tournoi par celui d'un match de foot .Les nuls sont possibles.De mémoires, on obtient le classement et les probabilités..
Jamais eu le temps et l'énergie de me pencher sérieusement sur le problème.


Haut
 Profil  
 
Répondre en citant le message  MessagePosté: 24 Mar 2021 22:06 
Hors ligne
Avatar de l’utilisateur

Inscription: 10 Jan 2006 19:13
Messages: 32067
Localisation: La Commune.
Je viens de lire basile.
Je pars prendre de l'aspirine.
A +

_________________
« La victoire a beaucoup de parrains tandis que la défaite est orpheline » (Talleyrand).


Haut
 Profil  
 
Répondre en citant le message  MessagePosté: 24 Mar 2021 22:10 
Hors ligne
Avatar de l’utilisateur

Inscription: 11 Oct 2013 15:38
Messages: 7700
L'ibuprofène est plus efficace.Crois moi.


Haut
 Profil  
 
Répondre en citant le message  MessagePosté: 24 Mar 2021 22:15 
Hors ligne
Avatar de l’utilisateur

Inscription: 10 Jan 2006 19:13
Messages: 32067
Localisation: La Commune.
Bon, j'ai pris une Grimbergen à la place, mais merci quand même !

_________________
« La victoire a beaucoup de parrains tandis que la défaite est orpheline » (Talleyrand).


Haut
 Profil  
 
Répondre en citant le message  MessagePosté: 24 Mar 2021 22:58 
Hors ligne
Avatar de l’utilisateur

Inscription: 31 Aoû 2005 21:06
Messages: 9725
Localisation: 15e de Huis' Treham
Bah avec Excel, c'est assez simple de le faire de manière linéaire, si tu appliques le même modèle à chaque match ou en tout cas un typologie de modèles fixes.

Si tu veux tout recalculer au fur et à mesure juste sur le classement, c'est déjà plus difficile, effectivement R saurait plus faire, Excel aurait déjà plus de mal.

Mais bon on peut toujours corser les modèles en ajoutant des variables, y'aurait une infinité de possibilités.

Faut pas oublier que le foot est le sport le plus indécis, où une surprise peut arriver le plus frequemment. Ce pourquoi les americains ont du mal avec ce sport d'ailleurs (et ils sont fans de toutes stats en tout genre). Y'a qu'à voir les stats sorties par StatMalherbe. Même sur un match ça colle jamais à la réalité.


Haut
 Profil  
 
Répondre en citant le message  MessagePosté: 25 Mar 2021 11:24 
Hors ligne

Inscription: 31 Aoû 2005 21:06
Messages: 3065
Localisation: Tourlaville
François de Malherbe a écrit:
Bon, j'ai pris une Grimbergen à la place, mais merci quand même !

Pourquoi une Grimm ? La Leffe c'est plus radical


Haut
 Profil  
 
Répondre en citant le message  MessagePosté: 25 Mar 2021 15:52 
Hors ligne
Avatar de l’utilisateur

Inscription: 11 Oct 2013 15:38
Messages: 7700
Peu d'actions et peu de buts, peu de % de tirs ratés ou réussis en effet.Et des scores serrés avec prédominance de 1-0 1-1 0-1 .Les sabermetrics sont issues de baseball, basketball et hockey sur glace etc...Où en effet plus de points, de tirs avec des terrains plus petits.
Une méthode connue avait été améliorée en favorisant ces scores under 2,5 buts, avec une pondération (je vais pas développer ), mais ce sont les travaux essentiels de Maher, Dixon-Coles qu'on trouve facilement.Ceux de Ianis Nzoufras et d'autres encore...Pas le temos de tout lire mais pour ceux que çà interesse, sur le site Academia je reçois les mails qui me proposent les travaux universitaires liés aux sports, des fois des trucs Bayesiens j'ai pas le matériel et le temps pour ça, mais certains trucs sont intéressants..en anglais et de niveau universitaire, je lâche un peu niveau maths des fois, beaucoup.
Au delà, plus précis,, les tirages aléatoires tels ceux de Fabien Torre, par exemple.

La facilité de monter le ballon de la surface du gardien à celui de l'adversaire serait forte qu'un % de finalisation face au gardien faible ou nul donnerait toujours un nombre de buts espérés très faible.Et si une équipe ne remonte qu'une fois le terrain, mais finalise le but 100% du temps donnerait qu'un but espéré.
L'interprétation des données qui amènent ces xG sont donnent une idée de leur densité de pertinence.C'est pourquoi plus il y a de critères plus on a des chiffres pas versatiles.En effet on peut s'y perdre sur tous les critères retenus.
Pour statsMalherbe je sais pas si il compare à une moyenne ou prend les données brutes du match, il y a plusieurs façons de créer les xG d'un match passé.
J'estime un nombre de but attendu par équipes mais me sers pas de fréquence de tirs etc...juste buts marqués encaissés un truc tout simple., mais avant match.
Pour les xG d'un match passé, une équipe peut sur ou sous performer, selon le modèle choisi, je retrouverai quelques liens qui explique ça il y a 2 façons de les créer : données du matchs et données du matchs comparées à une moyenne (équipe ou ligue je sais plus)...et là il peut y avoir sur ou sous performance...Un Malherbe qui plante 2 fois avec un xG de 0,4 par exemple..

Edit: par exemple le dernier truc que j'ai reçu :
https://www.academia.edu/keypass/N1IyaX ... load-paper

https://www.academia.edu/2483597/An_Exp ... load-paper

Ici on y parle du SMC.. (Et de Nîmes) https://www.academia.edu/keypass/U3VsS0 ... load-paper
Dimitris Karlis a aussi publié des choses interessantes
https://www.academia.edu/1317954/Bivari ... card=title
Comme Ioannis Ntzoufras https://www.academia.edu/1008432/Statis ... load-paper

Les travaux de Maher, Dixon et Coles sont la base on les trouve facilement sur internet, ils ont amélioré un vieux manuel de statistiques d'une société anglaise du 19 ou début 20 eme siècle qui était la bible des premiers statisticiens.Quand à ma fameuse méthode B.A.S.I.L. je me suis aperçu qu'elle existait en bonne partie là dedans (l'estimation de buts, pas la distribution de probabilité)..Je me sers donc d'un peu tout ça et trouvé une façon de simplifier la pondération plus importante des dernières performances comme Dixon et Coles, mais sans un modele de chaînes de Markov qui sont plus performantes, selon Rue et Salvesen.Pour intégrer le facteur forme.
Un match en 10 mn avec une calculatrice scientifique à tableur (ou exel, Open Office) et un ou deux site de classement, j'ai déjà vu si Malherbe gagne ou pas.Généralement j'inverse le résultat...Pour calculer le classement final d'un championnat impossible, par contre.

La méthodes Massey j'ai pigé tout seul, elle est finalement assez simple, mais il faut un matériel puissant.Pour une poule de "Round Robin" c'est pratique. Pas pour un championnat.La méthode Elo est bien décrite sur ClubElo (clubs) ou EloRatings(équipés nationales).

Prévoyez la plaquette d'anti-migraine, ou le fût de Fischer !


Dernière édition par basile le 25 Mar 2021 16:28, édité 4 fois.

Haut
 Profil  
 
Répondre en citant le message  MessagePosté: 25 Mar 2021 15:53 
Hors ligne
Avatar de l’utilisateur

Inscription: 11 Oct 2013 15:38
Messages: 7700
boulle a écrit:
François de Malherbe a écrit:
Bon, j'ai pris une Grimbergen à la place, mais merci quand même !

Pourquoi une Grimm ? La Leffe c'est plus radical

Parce qu'avec les Grimm, on conte mieux les chiffres.


Haut
 Profil  
 
Afficher les messages postés depuis:  Trier par  
Poster un nouveau sujet Répondre au sujet  [ 224 messages ]  Aller à la page Précédente  1 ... 11, 12, 13, 14, 15

Heures au format UTC + 1 heure


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité


Vous ne pouvez pas poster de nouveaux sujets
Vous ne pouvez pas répondre aux sujets
Vous ne pouvez pas éditer vos messages
Vous ne pouvez pas supprimer vos messages

Rechercher:
Aller à:  
cron
POWERED_BY
Traduction par: phpBB-fr.com