Cómo utilizar Parcelas cuantiles para comprobar los datos Normalidad en R

November 28

Histogramas dejan mucho a la interpretación del espectador. Una mejor manera gráfica en R para saber si sus datos se distribuyen normalmente es mirar a una llamada cuantil-cuantil (QQ) parcela.

Con esta técnica, se traza cuantiles uno contra el otro. Si se comparan dos muestras, por ejemplo, sólo tiene que comparar los cuantiles de ambas muestras. O, para decirlo de manera un poco diferente, R hace lo siguiente para la construcción de una parcela QQ:

  • Se ordena los datos de ambas muestras.
  • Traza estos valores ordenados el uno contra el otro.

Si ambas muestras dona € ™ t contienen el mismo número de valores, R calcula valores adicionales por interpolación para la muestra más pequeña para crear dos muestras del mismo tamaño.

Cómo comparar dos muestras de datos

Por supuesto, que dona € ™ t tiene que hacerlo todo por ti mismo, sólo tiene que utilizar la función qqplot () para eso. Así que, para comprobar si las temperaturas durante la actividad y durante el resto se distribuyen por igual, sólo tiene que hacer lo siguiente:

> Qqplot (beaver2 $ temp [beaver2 $ activ == 1],
+ Beaver2 $ temp [beaver2 $ activ == 0])

Esto crea una parcela donde los valores ordenados se trazan unos contra otros.

Cómo utilizar Parcelas cuantiles para comprobar los datos Normalidad en R


Entre los corchetes, puede utilizar un vector lógico seleccionar los casos que desee. Aquí se selecciona todos los casos en que la activ variable es igual 1 para la primera muestra, y todos los casos en que esa variable es igual a 0 para la segunda muestra.

Cómo utilizar una parcela R QQ para comprobar la normalidad de los datos

En la mayoría de los casos, usted dona € ™ t quieren comparar dos muestras entre sí, pero comparar una muestra con una muestra teórica que viene de una determinada distribución (por ejemplo, la distribución normal).

Para hacer una gráfica de QQ esta manera, R tiene la función qqnorm especial (). Como su nombre lo indica, esta función dibuja su muestra en contra de una distribución normal. Simplemente da la muestra que desea representar en un primer argumento y añadir los parámetros gráficos que te gusta.

R crea entonces una muestra con los valores procedentes de la distribución normal estándar, o una distribución normal con una media de cero y una desviación estándar de uno. Con esta segunda muestra, R crea la trama QQ como se ha explicado antes.

R también tiene una función qqline (), que añade una línea a su parcela normal de QQ. Esta línea hace que sea mucho más fácil de evaluar si usted ve una clara desviación de la normalidad. Cuanto más cerca de todos los puntos se encuentran a la línea, más cerca está la distribución de la muestra viene a la distribución normal. La función qqline () también toma la muestra como un argumento.

Ahora quiere hacer esto por las temperaturas durante tanto el activo y el período de inactividad del castor. Usted puede utilizar la función qqnorm () dos veces para crear dos parcelas. Para los períodos inactivos, puede utilizar el siguiente código:

> Qqnorm (beaver2 $ temp [beaver2 $ activ == 0], principales = 'Inactivo')
> Qqline (beaver2 $ temp [beaver2 $ activ == 0])

Usted puede hacer lo mismo para el período activo al cambiar el valor de 0 a 1.

Cómo utilizar Parcelas cuantiles para comprobar los datos Normalidad en R