Ny modell tilbyr fysikk-inspirert rangeringsevaluering


Ny modell tilbyr fysikk-inspirert rangeringsevaluering

I (a) viser vi et tilfeldig vokst nettverk med Poisson ut-grad. I (b) viser vi de bakre marginalene for fire representative noder, farget for å matche (a), og sammenligner de oppnådd med metoden vår med de nøyaktige resultatene av uttømmende oppregning. Til tross for tilstedeværelsen av korte sykluser, tilnærmer vår tilnærming til trosforplantning marginalene ganske tett, og matcher ikke bare midlene, men formene til disse distribusjonene. Kreditt: Fysisk gjennomgang E (2022). DOI: 10.1103/PhysRevE.105.L052303

Verden er full av rangeringer og rekkefølger. De dukker opp i tennis – som i French Open, som ender med en endelig rangering av mesterspillere. De dukker opp i pandemier – som når offentlige helsemyndigheter kan registrere nye infeksjoner og bruke kontaktsporing for å skissere nettverk av spredning av COVID-19. Systemer med konkurranse, konflikt og smitte kan alle gi opphav til hierarkier.

Imidlertid blir disse hierarkiene observert i ettertid. Det gjør det vanskelig å vite sannheten rangeringer av systemet: Hvem var egentlig den beste spilleren? Hvem smittet hvem? “Du kan ikke gå tilbake i tid og lære nøyaktig hvordan dette skjedde,” sier SFI-postdoktor George Cantwell. Man kan bygge en modell av nettverket og sammenligne alle mulige utfall, men en slik brute-force-tilnærming blir raskt uholdbar. Hvis du prøvde å rangere en gruppe med bare 60 deltakere, for eksempel, når antallet mulige permutasjoner antallet partikler i det kjente universet.

For en nylig artikkel publisert i Fysisk gjennomgang E, samarbeidet Cantwell med SFI-professor Cris Moore, en informatiker og matematiker, for å beskrive en ny måte å evaluere rangeringer på. Målet deres var ikke å finne ett sant hierarki, men å beregne spredningen av alle mulige hierarkier, med hver enkelt vektet etter sannsynligheten.

“Vi var villige til å ikke være helt riktige, men vi ønsket å få gode svar med en viss følelse av hvor gode de er,” sier Cantwell. Den nye algoritmen er inspirert av fysikk: Rangeringer er modellert som samvirkende enheter som kan bevege seg opp eller ned. Gjennom den linsen oppfører systemet seg som et fysisk system som kan analyseres ved hjelp av metoder fra spinnglassteori.

Rett etter starten av COVID-19-pandemien begynte Cantwell og Moore å tenke på modeller for hvordan sykdom sprer seg gjennom et nettverk. De anerkjente raskt situasjonen som et bestillingsproblem som dukker opp over tid, ikke ulikt spredningen av et meme på sosiale medier eller fremveksten av mesterskapsrangeringer i profesjonell idrett. “Hvordan bestiller du ting når du har ufullstendig informasjon?” spør Cantwell.

De startet med å tenke seg en funksjon som kunne score en rangering på nøyaktighet. For eksempel: En god rangering vil være en som stemmer overens med resultatene av matchups 98 % av tiden. En rangering som stemmer overens med utfall bare 10 % av tiden ville være elendig – verre enn en myntflipp uten noen forkunnskaper.

Et problem med rangeringer er at de vanligvis er diskrete, noe som betyr at de følger hele tallene: 1, 2, 3 og så videre. Den rekkefølgen antyder at “avstanden” mellom første- og andrerangerte medlemmer er den samme som mellom andre og tredje. Men det er ikke tilfelle, sier Cantwell. Toppspillerne i et spill, over hele verden, kommer til å være tett sammen når det gjelder ferdigheter, så forskjellen mellom topprangerte spillere kan være nærmere enn det ser ut til.

“Du ser ganske ofte at lavere rangerte spillere kan slå høyere rangerte spillere, og den eneste måten modellen kan gi mening og passe til dataene er ved å presse alle rekkene sammen,” sier Cantwell.

Cantwell og Moore beskrev et system som evaluerer rangeringer basert på et kontinuerlig nummereringssystem. En rangering kan tildele et hvilket som helst reelt tall – heltall, brøk, uendelig repeterende desimal – til en spiller i nettverket. “Kontinuerlige tall er lettere å jobbe med,” sier Cantwell, og disse kontinuerlige tallene kan fortsatt oversettes tilbake til diskrete rangeringer.

I tillegg kan denne nye tilnærmingen brukes til å forutsi noe om fremtiden, som utfallet av en tennisturnering, og også utlede noe om fortiden, for eksempel hvordan en sykdom har spredt seg. “Disse rangeringene kan fortelle oss rekkefølgen av idrettslag fra best til verst. Men de kan også fortelle oss i hvilken rekkefølge folk i et samfunn ble smittet med en sykdom,” sier Moore. “Selv før postdoktoren hans jobbet George med dette problemet som en måte å forbedre kontaktsporing i en epidemi. Akkurat som vi kan forutsi hvilket lag som vil vinne en kamp, ​​kan vi utlede hvem av to personer som smittet den andre da de kom i kontakt med hverandre.”

I fremtidig arbeid sier forskerne at de planlegger å undersøke noen av de dypere spørsmålene som har dukket opp. Mer enn én rangering kan være enig med data, men radikalt uenig med andre rangeringer, for eksempel. Eller en rangering som virker feil kan ha høy usikkerhet, men ikke være unøyaktig. Cantwell sier at han også ønsker å sammenligne modellens spådommer med utfall fra virkelige konkurranser. Til syvende og sist, sier han, kan modellen brukes til å forbedre spådommer i et bredt spekter av systemer som fører til rangeringer, fra infeksjonssykdomsmodeller til sportsspill.

Cantwell sier at han vil holde på pengene sine – foreløpig. “Jeg er ikke helt klar til å begynne å satse på det,” sier han.


Kan ‘belief propagation’-algoritmen nøyaktig beskrive komplekse nettverkssystemer?


Mer informasjon:
George T. Cantwell et al., Trosforplantning for permutasjoner, rangeringer og delordre, Fysisk gjennomgang E (2022). DOI: 10.1103/PhysRevE.105.L052303

Sitering: Ny modell tilbyr fysikk-inspirert rangeringsevaluering (2022, 6. juni) hentet 7. juni 2022 fra https://phys.org/news/2022-06-physics-inspired.html

Dette dokumentet er underlagt opphavsrett. Bortsett fra enhver rettferdig handel for formålet med private studier eller forskning, kan ingen del reproduseres uten skriftlig tillatelse. Innholdet er kun gitt for informasjonsformål.