Estudiar les xarxes de xarxes per entendre un món interconnectat
La revista Nature Communications publica dos articles del grup de recerca Alephsys Lab de la URV que expliquen com optimitzar el tractament de big data en sistemes complexos
El grup de recerca Alephsys Lab de la URV ha trobat com simplificar els sistemes complexos al màxim, però amb la mínima pèrdua d'informació, cosa que permet tractar les dades de forma fidedigna i eficient. Aquests sistemes poden representar les estructures i les relacions que trobem al món, i el seu estudi ajudarà a entendre i resoldre grans problemes d'àmbits tan diversos com la biologia, la tecnologia o la sociologia.
Per què Gangnam Style té 2,3 mil milions de visites a YouTube, és a dir, una de cada tres persones que viuen a la Terra? Més enllà del contingut en sí, la viralitat de qualsevol informació es pot estudiar des del punt de vista estructural: això vol dir fixar-nos en l'estructura sobre la qual es difon la informació, i no en si el videoclip és divertit o si la cançó és enganxosa. En aquest cas, l'estructura està formada per les persones que comparteixen el vídeo amb els seus contactes que, al seu torn, el tornen a compartir. Es dibuixa així una xarxa on les persones són nodes i les relacions entre elles (amics, familiars, companys de feina...) són les connexions entre aquests nodes.
Entendre el món i els seus problemes a través de la connectivitat entre els seus elements és el que fan investigadors com l'Alex Arenas, del grup de recerca Alephsys Lab de la Universitat Rovira i Virgili (URV) de Tarragona. Al grup estudien sistemes complexos, és a dir, sistemes formats per unitats en interacció que presenten un comportament global, que no és la suma directa dels seus comportaments individuals. Aquesta interacció forma una xarxa on les unitats o nodes (que poden ser persones, però també cèl·lules, o medicaments, o ordinadors...) tenen connexions molt heterogènies. Aquests sistemes, per tant, serveixen per representar problemes en camps molt diferents, com ara la biologia, la tecnologia o la societat.
Però la realitat és complexa i, per representar-la, els sistemes complexos ho han de ser encara una mica més: "Les xarxes no són úniques, sinó que a la natura, a la tecnologia... trobem diferents xarxes que estan connectades entre elles", explica l'investigador Alex Arenas. Pensem, per exemple, en Facebook i Twitter: les dues són xarxes que connecten persones, però les connexions (la "llista d'amics", per dir-ho de forma senzilla) no són les mateixes en una i altra xarxes. Quan això passa, diem que la xarxa té diverses capes.
"En els darrers anys hem saltat a un nou nivell de coneixement en aquest camp, que és considerar el món com un conjunt de xarxes totes elles interconnectades entre sí, amb diferents significats i funcions, però que no es poden estudiar de forma aïllada", explica Arenas. Això permet entendre els sistemes de forma més fidedigna, però té un problema: com més informació hi ha (i, tornant a l'exemple de Facebook i Twitter, estem parlant de milers i milers de terabytes d'informació), més lent, difícil i costós és processar-la.
Simplificar un problema per resoldre'l més fàcilment
És aquí on entren en joc els darrers avenços de l'Alephsys Lab, que ha aconseguit identificar els nodes i les capes més rellevants en qualsevol xarxa per tal de simplificar el sistema al màxim, però perdre la mínima informació. "El que fem és una reducció estructural d'aquesta informació", explica Alex Arenas: "analitzem quines d'aquestes capes es poden fusionar per arribar al punt òptim en què la quantitat d'informació és màxima amb el mínim de capes". A grans trets, aquelles capes que són més redundants entre elles són les que es poden fusionar.
"Avui dia tenim accés a dades com mai a la història i tenim eines per processar dades. El problema és l'encaix entre el volum de dades de què disposem i el volum que aquestes eines poden processar", explica l'investigador. El tractament massiu de dades (el que es coneix com big data) serà un dels grans reptes d'aquest segle. "La solució passa per reduir primer aquestes dades massives, per després processar-les", conclou. És a dir, treballar per empetitir el problema, abans de treballar per solucionar-lo.
El node més versàtil
Però, tornant a Gangnam Style i la viralitat, si volem que el nostre vídeo sigui vist i compartit pel major número de persones, caldrà difondre'l a través del node més central de la xarxa. El node més central és, explicat de forma senzilla, aquell que quan transmet informació arriba a més gent, i que s'assabenta de tot abans que ningú. Aquest node és fàcil d'identificar en una única xarxa, però què passa quan la xarxa té diverses capes? Una persona, per exemple, pot ser molt activa i molt influent a Twitter, però no tant a Facebook, o viceversa.
Una solució passa per buscar no el node més central en cada capa, sinó aquell que està més ben compensat en totes les capes. D'això, a l'Alephsys Lab, en diuen el node més versàtil, i han determinat com trobar-lo. "Això podria canviar totalment els sistemes de rànquing i la forma com entenem la navegació en un sistema multicapa", explica l'investigador Alex Arenas. Les aplicacions són moltes: des de la forma com els cercadors indexen i jerarquitzen les pàgines fins a com funcionen els sistemes de recomanació. "L'objectiu final és enriquir l'accés global a la informació i, en definitiva, donar a l'usuari més capacitat d'explorar el món", conclou Arenas.
La recerca de l'Alephsys Lab és aplicable a qualsevol tipus de sistema complex. Els seus resultats s'han publicat a la revista Nature Communications i ja es poden utilitzar per al tractament de dades, tant en el cas de reduir l'estructura de xarxes multicapa com de trobar nodes versàtils en xarxes multicapa interconnectades. Aquests estudis formen part del projecte Plexmath, del 7è Programa Marc (FP7) europeu. A més, el grup posa a disposició una eina lliure, anomenada MuxViz, que permet analitzar dades de sistemes complexos i incorpora aquests dos darrers avenços.