Cómo hacer frente a los valores faltantes en R

July 14

La función cor () en R puede hacer frente a la falta de valores de datos de múltiples maneras. Para ello, se establece el uso argumento a uno de los posibles valores de texto. El valor para el argumento uso es especialmente importante si se calculan las correlaciones de las variables en una trama de datos. Al establecer este argumento para diferentes valores, se puede

  • Utilice todas las observaciones mediante el establecimiento de uso = "todo". Esto significa que si thereâ € ™ s cualquier valor de NA en una de las variables, la correlación resultante es NA también. Este es el valor predeterminado.
  • Excluir todas las observaciones que tienen NA durante al menos una variable. Para ello, se establece use = 'complete.obs'. Tenga en cuenta que esto le puede dejar con sólo unas pocas observaciones si los valores perdidos se propagan a través del conjunto de datos completo.
  • Excluir observaciones con valores de NA por cada par de variables que examina. Para ello, se establece el uso argumento = 'pares'. Esto asegura que se puede calcular la correlación de cada par de variables sin perder información debido a los valores que faltan en las otras variables.

De hecho, se puede calcular diferentes medidas de correlación. Por defecto, R calcula el coeficiente de correlación de Pearson estándar. Para los datos que no se distribuyen normalmente, puede utilizar la función de cor () para calcular la correlación de Spearman, o tau € ™ s Kendallâ. Para ello, hay que establecer el método de discusión en el valor adecuado.