Las redes también se pueden correlacionar y comparar para saber si son similares o están relacionadas. Si tenemos hipótesis relacionales podemos comprobarlas o refutarlas usando el procedimiento de asignación cuadrática (quadratic assigment procedure), más conocido como QAP Correlation (correlación QAP). Este procedimiento nos permite averiguar si hay correlación o similitud entre matrices adyacentes (1-modo, cuadradas), y entre matrices adyacentes y atributos.
QAP Correlation
Por ejemplo, he investigado las relaciones que se producen dentro de una clase de 30 alumnos mediante varios indicadores relacionales: con qué compañeros habla de asuntos de clase (red académica), qué compañeros tienen unas ideas similares a las suyas (red ideológica) con qué compañeros se reúne fuera de la universidad (red de ocio). Además, preguntamos por el género de los estudiantes (atributo género) y la nota o promedio académico (atributo nota). La pregunta es si hay correlación o similitud entre estas diversas redes, es decir, si hay asociación o se asemejan o se superponen las relaciones académicas, ideológicas, de ocio, de género y nota. Tengo tres grandes hipótesis:
hipótesis a) las relaciones académicas se correlacionan con la nota o promedio académico, es decir, se producirán relaciones en clase entre personas de similar nota (red académica y atributo nota)
hipótesis b) las relaciones de ocio se correlacionan con el género, es decir, se producirán relaciones fuera de la clase entre personas del mismo género (red de ocio y atributo género)
hipótesis c) las relaciones ideológicas se correlacionan con las relaciones de ocio, es decir, se producirán relaciones fuera de la clase cuando haya relaciones por tener ideas similares (red ideológica y red de ocio)
Realizaremos QAP Correlation en el software UCINET, ya que este programa tiene la ventaja que permite estudiar si dos redes se relacionan entre sí a través de varios estadísticos: correlación de Pearson, Euclidean distance, Hamming distance, Match coefficient, Jaccard coefficient, Goodman-Kruskal Gamma y Hubert Gamma.
El más importante es Pearson correlation, que indica la asociación entre dos variables, en este caso las variables serán las matrices relacionales o redes. El proceso es diferente que en la estadística tradicional, aunque la interpretación es igual. En QAP Correlation (correlación QAP) primero se calcula el coeficiente de correlación entre las celdas correspondiente de dos matrices observadas (p.ej. red ideológica y red de ocio). Se compara si dos actores se relacionan en la matriz A (red ideológica) y si también se relacionan en la matriz B (red de ocio). Posteriormente las columnas y filas van permutando miles de veces y se crean matrices ficticias y cada vez se calcula un nuevo coeficiente de correlación. Estos coeficientes de correlación de las matrices ficticias se comparan con el coeficiente de correlación obtenido de relacionar las matrices observadas (red ideológica y red de ocio). Si pocas veces (<0,05) la correlación entre las matrices ficticias es mayor o igual significa que la correlación entre las dos matrices observadas (red ideológica y red de ocio) no ocurre por casualidad, y por tanto, hay relación significativa (correlación) entre las matrices observadas.
Particularmente, me gusta usar también Jaccard coefficient cuando se trabaja con atributos que son variables binarias y las matrices o redes también son binarias, es decir, que las celdas contienen 1 y 0, donde 1 indica relación entre los nodos y 0 inexistencia de relación entre los nodos.
El procedimiento para realizar QAP Correlation en UCINET es el siguiente:
1- Si tenemos que relacionar redes adyacentes con atributos debemos transformar los atributos en matrices adyacentes. Vamos a: Data > Attribute to matrix
Introducimos el archivo de atributos. Si tenemos varios atributos en el mismo archivo debemos seleccionar en “Value” qué atributo transformaremos a matriz. Si el atributo en una variable nominal (categórica) en “Method” dejamos Exact Matches, que indica que dos actores se relacionarán entre sí si coincide el mismo atributo o categoría. Es decir, si Juan y Pedro tienen el mismo género (hombre) en la matriz que se creará aparecerán relacionados (1). Como yo tengo tres atributos en un mismo archivo, género, residencia y nota, deberé realizar este procedimiento dos veces, uno para género y otro para nota Primero para crear la matriz adyacente “género” y después para crear la matriz adyacente “nota” (el atributo “Residencia” no lo uso esta vez). Si el atributo es una variable ordinal o escalar (como la variable nota que oscila entre 0 y 10) en “Method” elegiremos “Absolute difference” que es la resta en la nota de un actor y la nota de otro actor. También podemos usar “Difference” aunque obtendremos una matriz con número negativos o bien “Square difference”, la diferencia de nota elevada al cuadrado. No hay un método para los atributos o variables ordinales o escalares mejor que otro, lo más conveniente es probarlos todo y comprobar si hay resultados diversos en la correlación. Por tanto, en este paso habremos obtenido dos matrices adyacentes (matriz de género y matriz de nota) a partir de dos atributos.
2- Comprobar las hipótesis mediante QAP Correlation: Tools > Testing Hypotheses > Dyadic (QAP) > QAP Correlation
Nos aparecerá una subpantalla. Pinchando en “Browse” introducimos todas las matrices que nos interesa averiguar si están correlacionadas: red académica, red ideológica, red de ocio, red género, red nota. Podemos dejar el número de permutaciones que viene por defecto y donde iniciarán las permutaciones. Si queremos aumentar el número de permutaciones para aumentar la confiabilidad, simplemente colocaremos un número más elevado y el programa tardará más tiempo en procesar el resultado
3- La hoja de resultados (Output) nos indica los valores de la correlación de Pearson y la significación. Si la significación es menor de 0,05 entre dos redes indica que esas dos redes correlacionan, es decir, se asemejan, si las superponemos son parecidas. El valor de la correlación de Pearson indica la fuerza y dirección de la correlación. Cuanto más alejada de cero sea el valor de la correlación de Pearson más fuerte es la asociación, correlación o similitud. El signo indica la dirección: si es signo negativo indica que al aumentar los valores de la red, disminuye los valores de la otra red. Por ejemplo, si la correlación es positiva entre dos redes indica que son redes similares; si la correlación es positiva entre una red y un atributo indica que las relaciones se producen entre actores con similar atributo (indica homofilia); si la correlación es negativa entre dos redes indica que una matriz es la inversa de otra; si la correlación es negativa entre una red y un atributo indica que las relaciones ocurren entre actores de diferente atributo (indica heterofilia).
hipótesis a) red académica y nota. No hay correlación significativa (p = 0.189)
hipótesis b) red de ocio y género. Sí hay correlación significativa (p=0.047), aunque es una asociación débil (QAP correlation = 0.036) y positiva, lo cual indica que las relaciones de ocio se producen entre actores del mismo género, los hombres salen mayoritariamente con otros hombres, y las mujeres con mujeres (homofilia)
hipótesis c) red ideológica y red de ocio. Sí hay correlación significativa (p=0.000) y es una relación fuerte (QAP Correlation = 0.574) y positiva. Las personas que tienen ideas similares suelen salir para ocio juntas, las redes se asemejan, por tanto hay relación entre relaciones ideológicas y de ocio.
QAP Correlation está especialmente diseñado para el análisis de redes. También podemos realizar una QAP Linear Regression (Regresión lineal QAP) y buscar qué conjunto de relaciones y atributos explican alguna red, o bien una QAP Logistic Regression (Regresión logística QAP) cuando la variables dependiente es un matriz binaria.
Si tenéis dudas, no dudéis en contactarme
Si te gustó este artículo por favor compártelo por Facebook, Twitter, Google+ o LinkedIn