![]() Exploración de datos Diagramas de dispersión
Supongamos una muestra de tamaño n sobre una
población multivariante de dimensión ![]() Entendemos por población multivariante de dimensión m aquella en la que a cada individuo muestral se le observan exactamente m características o variables. Podemos estar interesados en cada una de las m variables de forma independiente, en cuyo caso no necesitaremos el diagrama de dispersión. Pero lo más común en este tipo de muestras es estudiar si unas variables se relacionan con otras de algún modo, o si existe dependencia entre ellas. En un diagrama de dispersión se escogen dos variables distintas entre las m posibles, numeradas por a y b, tales que ![]() Si los puntos forman una nube más o menos amorfa, podemos suponer que ambas variables no se interrelacionan, o lo que es lo mismo, el conocimiento de una no aporta información sobre la otra. Pero si ambas variables tienen un patrón de comportamiento conjunto, esto se verá en el diagrama de dispersión. El siguiente ejemplo pretende dar luz sobre lo recién comentado.
A continuación se transcribe una muestra simulada de tamaño 12 en la que a cada individuo muestral se le midieron 3 variables.
© BioMates, 2003 |