Cómo usar factores o datos numéricos en R

April 26

Antes de intentar describir sus datos en R, hay que asegurarse de que sus datos están en el formato correcto. Esto significa

  • Asegurarse de que todos sus datos están contenidos en una trama de datos (o en un vector si ita sola variable ™ € sa)
  • Asegurar que todas las variables son del tipo correcto
  • Verificar que los valores están procesados ​​correctamente

Algunos de los datos pueden tener sólo un número limitado de valores diferentes. Por ejemplo, la gente puede ser hombre o mujer, y usted puede describir la mayoría de los tipos de cabello con sólo unos pocos colores.

A veces más valores son teóricamente posible, pero no es realista. Por ejemplo, los coches pueden tener más de 16 cilindros en sus motores, pero usted wonâ € ™ t encontrar muchos de ellos. De una forma u otra, todos estos datos pueden ser vistos como categórica. Según esta definición, los datos categóricos también incluye datos ordinales.

Por otro lado, tiene datos que pueden tener una cantidad ilimitada de valores posibles. Este doesnâ € ™ t significa necesariamente que los valores pueden ser cualquier valor que quiera. Por ejemplo, el kilometraje de un coche se expresa en millas por galón, normalmente se redondea a toda la milla. Sin embargo, el valor real será ligeramente diferente para cada coche.

Lo único que define cuántos valores posibles se permite es la precisión con la que usted expresa los datos. Los datos que puede ser expresado con cualquier nivel deseado de precisión es continua. Tanto los datos en escala de intervalo y los datos de relación de escala son generalmente los datos continuos.

La distinción entre los datos categóricos y continuos Isna € ™ t siempre claro sin embargo. La edad es, en esencia, una variable continua, pero ita € ™ s menudo expresada en el número de años transcurridos desde el nacimiento.

Usted todavía tiene una gran cantidad de valores posibles, si haces eso, pero ¿qué pasa si nos fijamos en la edad de los niños en su escuela secundaria local? De repente usted tiene sólo cinco, tal vez seis, valores diferentes en sus datos. En ese momento, usted puede obtener más de su análisis, si usted trata de que los datos tan categórica.

Al describir sus datos, es necesario hacer la distinción entre los datos que se beneficia de ser convertido en un factor y los datos que necesita para mantenerse numérico. Si usted puede ver sus datos como categóricas, convirtiéndola en un factor de ayuda con el análisis de la misma.