Förändring av WPPR-rankingen - page 4 - Tävlingar

c_p

Citera

och då ganska "linjärt" (d v s den minskar alla tävlingar ungefär lika mycket jämfört med den mest värda tävlingen).

Hur vill du att den ska funka då? Vill du att den ska vara mer aggresiv mot tävlingar med fler blåbär? Det är därför k finns där! K däremot angriper stora poängskillnader mellan de stora elefanterna, medan den knappt gör nån skillnad för de lägre rankade.

Pal

Citera

Hur vill du att den ska funka då? Vill du att den ska vara mer aggresiv mot tävlingar med fler blåbär? Det är därför k finns där! K däremot angriper stora poängskillnader mellan de stora elefanterna, medan den knappt gör nån skillnad för de lägre rankade.

Jag vill ha en konstant (eller en del av formeln) som jag kan förändra för att ändra avståndet mellan tävlingar på ett icke-linjärt sett. D v s att t ex det procentuella avståndet mellan GPO och PMO ändras mer än mellan EPC och SO. De flesta formler jag har testat hittills ändrar de två avstånden ungefär lika mycket när man pillar på konstanterna eller dylikt. Jag lyckas alltså få kurvan brantare eller flackare, men jag lyckas inte få noderna på kurvan att röra sig åt olika håll (eller åtminstone olika mycket uppåt/nedåt), vilket jag vill för att kunna laborera mig fram till inbördes förhållanden som känns rimliga.

Problemet med PAPA är att det är mindre skillnad i svårighetsgrad mellan att vinna PAPA och att vinna EPC, än det är skillnad i svårighetsgrad mellan att gå vidare till slutspel i PAPA och att gå vidare till slutspel i EPC (eftersom det är ganska många bra spelare i bägge tävlingarna, men en massa blåbär i EPC som inte finns alls i PAPA). Det är alltså svår att hitta en balans där både vinnaren, #16 och #40 i PAPA får en rättvis poäng jämfört med vinnaren, #48 och #120 i EPC.

Vad gäller placering/poäng så är ju ett alternativ att enbart bygga på poäng. Placeringen säger ingenting om poängskillnaden, men poängen säger allt om placeringen.

Jag ska förfina mitt ark så att du bara har några få celler du kan pilla på, dels för konstanter och dels för dina formler (e heter EXP(1) på excelliska, men i övrigt är det ju ren matte). Sedan får du ett mail.

Nu ska jag äta.

Pal

Nu har jag skapat en väldigt enkel formel. Varje spelare lägger helt enkelt till P/Pmax. Då får jag följande tabell:

PAPA 11: 11,3 (100)
EPC 07: 11,1 (99)
SO 08: 6,3 (56)
PMO 08: 4,3 (38)
GPO 08: 2,9 (26)
Brazil: 1,4 (13)
PAPA B: 2,6 (23)
Monthly: 3,0 (27)
De 24 bästa: 11,1 (99)
De 24 sämsta: 0,001 (0,009)

Här tycker jag att EPC är övervärderad och att GPO är undervärderad.

Men å andra sidan kanske det mest beror på de sjuka ingångsvärderna, och om man räknar om retroaktivt så ser det bättre ut?

c_p

Citera

Jag vill ha en konstant (eller en del av formeln) som jag kan förändra för att ändra avståndet mellan tävlingar på ett icke-linjärt sett. D v s att t ex det procentuella avståndet mellan GPO och PMO ändras mer än mellan EPC och SO.

Det är ju extremt svårt att skräddarsy formeln så. Då måste man titta på vilka spelare som är med och försöka manipulera formeln efter deras rank och poäng. Och även om man lyckas så kommer ju rankinglistan ändras ganska radikalt med det nya systemet och då blir stämmer det ju ändå inte sedan...

Citera

Jag lyckas alltså få kurvan brantare eller flackare, men jag lyckas inte få noderna på kurvan att röra sig åt olika håll (eller åtminstone olika mycket uppåt/nedåt), vilket jag vill för att kunna laborera mig fram till inbördes förhållanden som känns rimliga.

Om jag förstår dig rätt så är det ungefär det som min formel Utdelning=A/(A/5-1-K+1^k+K/(535/535)) gör (det är samma formel som förut bara det att jag uttryckt B som en funktion av A). A ger störst utslag i början av kurvan (för storspelare) medan k ger störst utslag senare. (K korrigerar litegrann för poängskillnad mellan storpelare.)

Citera

Vad gäller placering/poäng så är ju ett alternativ att enbart bygga på poäng. Placeringen säger ingenting om poängskillnaden, men poängen säger allt om placeringen.

Precis! Därför räcker det med att enbart använda poängen - placeringarna får man med i formeln på köpet! Dock är poängerna så godtyckliga i nuläget att jag nog är mer för att betona placeringar i alla fall.

Citera

Problemet med PAPA är att det är mindre skillnad i svårighetsgrad mellan att vinna PAPA och att vinna EPC, än det är skillnad i svårighetsgrad mellan att gå vidare till slutspel i PAPA och att gå vidare till slutspel i EPC (eftersom det är ganska många bra spelare i bägge tävlingarna, men en massa blåbär i EPC som inte finns alls i PAPA). Det är alltså svår att hitta en balans där både vinnaren, #16 och #40 i PAPA får en rättvis poäng jämfört med vinnaren, #48 och #120 i EPC.

Sant! Det har jag inte tänkt på, och det är ett problem för distribueringsformeln, "halvcirkeln". Detta har jag i nuläget ingen idé om hur man löser bäst..

Pal

Ey, CP! Jag fick en idé. Vad tror du om att strunta i dubbel-formel-modellen, och istället helt enkelt dela ut poäng beroende på hur många rankingpoäng man har bakom sig? Har man folk med X antal rankingpoäng bakom sig så får man Xformel poäng?

Jag ska mecka till nåt sånt så får vi se hur det blir.

c_p

Jag tycker det låter vanskligt. En listplacering är ju alltid en listplacering, men antal rankingpoäng bakom sig är svårare att se konsekvenserna av. Och det får ju stora konsekvenser för lågrankade spelare varje gång ett antal nya spelare kliver in på rankinen. Jag tror även att listan mår bra av att folk förstår hur den fungerar, så ju enklare desto bättre.

Ju mer jag tänker på det ju mer förespråkar jag att använda enbart placeringarna. Ärligt talat - om det skiljer 50 eller 100p mellan Bowen och Elwin säger väl egentligen ingenting? Den ena hade mer flyt en viss dag, och så blev det så. Det viktigaste är att vi får till ett begripligt och fungerande system. Och kör vi algoritmen på ett större antal spelare jämnas nog ojämlikheten ut rent statistiskt.

Prova med denna formel och se vad du får för några tävlingar:

A=4000
k=2,1
Utdelning = A/(A/5-1+R^k)

Den är ganska flack för spelare fram till position 50 ungefär, sedan minskar utdelningen drastiskt, vilket borde ge PAPA ett högt värde jämfört med EPC. Är resultatet inte bra så prova att öka A och öka k (A kan ökas rejält men k är känslig som fan).

johan

Citera

Problemet med PAPA är att det är mindre skillnad i svårighetsgrad mellan att vinna PAPA och att vinna EPC, än det är skillnad i svårighetsgrad mellan att gå vidare till slutspel i PAPA och att gå vidare till slutspel i EPC (eftersom det är ganska många bra spelare i bägge tävlingarna, men en massa blåbär i EPC som inte finns alls i PAPA).

Det är ju visst en massa blåbär med i PAPA, men de deltar i B- och C-divisionerna. Du måste nog ta med alla PAPA-deltagarna oavsett division för att få en deltagardemografi som motsvarar andra tävlingar.

Men då ser man ju förstås att det är galet svårt att ta sig till slutspel...

Pal

Alvar: Jag har inte hunnit tvätta excelfilen, men jag fortsätter mecka i morgon.

Johan: Ja, Josh föreslog samma lösning: Att baka in B/C-divisionerna när man rankar tävlingen, men sen distribuera poängen med 53 som sista plats.

GUD

Jag är mycket imponerad av er energi och optimism, det här är ju skitsvårt, se bara på en i viss mån jämförbar situation i världsgolfrankingen, där man kört femtielva olika system genom åren och det fortfarande blir ett klart diskutabelt resultat.
Bara att göra ranking baserat på tävlingsplaceringar är svårt, och när man sen dessutom har ett antal olika geografiska arenor med ganska dåligt utbyte sinsemellan, då blir det ju snabbt en mardröm.
I en sportstatistikers perfekta värld skulle jag vilja se allting (som skall skapas ratingpoäng utifrån) köras i form av matcher, mycket lättare att jobba med och mycket mer välutforskad mark. Men då har vi ju redan PARS förstås så då behöver vi inte uppfinna hjulet (=Glicko) igen.

(Man/ni kan ju leka med tanken att faktiskt följa denna modell och gå så långt att man också omvandlar kvalresultat till matcher, dvs om 40 spelare deltog i kvalet så räknar man om det till att #1 vann 39 matcher mot respektive #2-#40, #2 förlorade mot #1 men vann mot #3-#40, osv (tror inte PARS tar med kvalspel alls väl? betala-för-flera-försök-systemet kan kanske sägas sabba lite, men man kan argumentera för att se det som en del av sporten). Det finns i mitt tycke oändliga fördelar med att hålla sig inom matchratingsystemen, vare sig man kör Glicko(/-2) eller Elo.)

Pal

Testade med Johans/Josh förslag, och får då följande tabell:

PAPA: 14,8   100%
EPC: 11,1   75%
SO: 6,3   42%
PMO: 4,3   29%
GPO: 2,9   19%
BPT: 1,4   10%
PAPA B: 3,6   24%
PAPA C: 1,0   7%
Monthly: 3,0   20%
Best 24: 11,1   75%
Worst 24: 0,001   0,007%

Här har alltså C-divisionens spelare bidragit till B-divisionens ranking, och bägge har bidragit till A-divisionens ranking.

GPO känns undervärderad och BPT har jag inte koll på. I övrigt känns det okej.

Nu ska jag testa lite alvarliga formler.

Pal

GUD: Det var lite den tanken jag var inne på med Xformel-idén.

Pal

Alvar: Den formeln ger EPC mer än PAPA. Om jag mixtrar med konstanterna kan jag få förhållandet mellan EPC och PAPA rätt, men då blir GPO värd 5% av PAPA, vilket är lite väl undervärderat.

Pal

Nån som har erfarenhet av http://research.microsoft.com/osa/apg/details.aspx ?

johan

Jag har ingen erfarenhet av TrueSkill för jag har ingen Xbox, men det ser ut att vara en variant av Glicko. Kanske lite simplare, för den har inte med tidsaspekten (tid sedan senaste match) för att avgöra osäkerheten sigma.

Å andra sidan så är ju Glicko utvecklat för schack, där det lätt kan gå många månader eller år mellan två tävlingsdeltaganden för en spelare, medan Xbox-spelare bara gör uppehåll för att sova (om ens det).

Men den viktiga idén bakom det hela är hur man hanterar tävlingar med fler än två deltagare. Helt enkelt så bryter man isär slutresultatet i en massa individuella matcher. Om vi kollar på resultaten från årets Stockholm Open tex:
1 PFJ
2 KGB
3 PER
4 IFK
5-8 TFF
5-8 C P
5-8 JOE
5-8 TTA
9-76 resten

Då räknar man med att Jongma vann en match mot var och en av alla deltagarna (dvs 75 matcher), KGB förlorade mot PFJ men vann mot alla andra. Femmorna förlorade fyra matcher, spelade tre oavgjorda och vann 68, osv...

Sedan finns det en viss tröghet inbyggt i systemet, som gör att om ett blåbär råkar vinna PAPA så gör han/hon inte nödvändigtvis ett jättekliv i rankingen (med det nuvarande systemet kan man gå från noll till 116p, dvs plats 21 på rankingen), utan det klassas som en olycka. På samma sätt kan en topprankad spelare komma sist i en blåbärstävling utan att förlora särskilt mycket.

PARS-rankingen är baserad på Glicko, för den som inte kände till det.

Pal

Allright, Alvar! Nu har jag boxat lite på dina idéer, och kokat ihop följande (på engelska, orkar inte översätta nu):

Allright, here's a place based proposal for tournament ranking:

Each player gets a value (call it X) calculated using the formula C/(C+r^c) where:

C = A constant that determine how big numbers the system should use. Setting it to 1 gives PAPA 16 points, setting it to 10 gives 136 points and setting it to 100 gives 1096 points. It doesn't change the relation between the tournaments.

r = Each players ranking position.

c = A constant that determines how steep the curve should be. Decreasing it means that the number of players is of bigger significance, increasing it means the top ranked players is of bigger significance.

Then I added up all the X values of players #2 - #2598 and gave to #1. And then the X values of player #3 - #2598 and gave to #2. And so on, all the way down to player 2597. I.e. all players get the sum of the players below them. Lets call this new value Y.

The curve is quite steep for the first 50 players, going from 7.4 to 1.5 points for the Y value. Then there's a soft turn from #50 to #300 who gets 0.4 points. After that, it is linear towards the end. Tweaking the c constant is an easy way to alter the formula later on, if we want to change this curve.

The reason for the Y value is to include the number of players in the system into the formula. Only using the X value would give #1 (and #2, and #3, etc) the same amount, no matter if there was 3 or 3000 players in the system.

Then I added up all the Y values of all participants in a tournament, and using C=10 and c=1.6 this gave:

PAPA 11:   136,2 -   100%
EPC 07: 117,9 -   87%
SO 08: 64,4 -    47%
PMO 08: 45,0 -   33%
GPO 08: 42,0 -   31%
BPT 08:   17,5 -   13%
PAPA B:   37,2 -   27%
PAPA C: 4,37 -   3,1%
Monthly:   27,9 -   20%
Best 24:   89,0 -   65%
Last 24:   0,02 -   0,014%

This is including the four opt-outs.

GPO is still a bit underestimated I think, but I believe that when we recalculate the standings retroactively, the germans will get more points than they currently have, raising the level of GPO. We will know after more extensive simulations with more data.

What do you think about this one?