Dentro de nuestro recorrido por la categoría de Gráficos estadísticos, totalmente nuevos en Excel 2016, vamos a continuar hoy con los gráficos Cajas y bigotes.
Categoría gráficos estadísticos
Recomiendo un artículo muy interesante, que me sirvió para aclarar algunas dudas
Los gráficos estadísticos se dividen en dos grupos: el primero es histograma, que incluye histograma y pareto y el segundo es cajas y bigotes.
Valores atípicos en gráficos de Cajas y bigotes
El gráfico pinta estos valores por encima y /o debajo de los valores que reconoce como máximos y mínimos de la muestra. En Excel 2016 se utiliza el estándar Tukey, que considera un valor atípico si se encuentra 1.5 veces de la longitud de la caja y se conoce como rango intercuartílico para cada uno de los extremos de la caja.
Veamos un ejemplo:
Calculamos el rango intercuartílico como Q3-Q1, donde Q3 es cuartil3 y Q1 es cuartil1, es decir, los límites por encima y por debajo de la caja. Estamos trabajando con la fórmula que excluye la mediana de cálculo de cuartiles.
- RIC = 95-(-40) =135
El límite de rango permitido para la muestra, como no atípico, es decir, para la definición de valores máximos y mínimos admitidos según el estándar Tukey se calcula como 1.5 por el RIC recién obtenido.
- Rango permitido = 1.5*135=202.5
A partir de ese rango obtenemos los límites
- Límite inferior = -40-202.5 =-242.5
Todos los valores mayores o iguales a -242.5 están en el rango de valores permitidos y no se consideran anomalías.
Todos los valores menores que –242.5 están fuera del rango de valores permitidos y se consideran anomalías.
- Límite superior= 95+202.5=297.5
Todos los valores menores o iguales a 297.5 están en el rango de valores permitidos y no se consideran anomalías.
Todos los valores mayores o iguales a 297.5 están fuera del rango de valores permitidos y se consideran anomalías.
Incluir la mediana en el cálculo de los cuartiles
Como comenté en la entrada anterior, tenemos la posibilidad de configurar el tratamiento que deseamos dar al cálculo de cuartiles primero y tercero, incluyendo o no, el valor de la mediana en los mismos. De forma predeterminada, la mediana no se toma en cuenta, está excluida, de tal forma la caja es mayor, más grande, lo que indica menor concentración en los datos.
Podemos obtener estos valores con las funciones de Excel, QUARTILE.EXC() o QUARTILE.INC() y/o mediante las opciones de configuración de propiedades del gráfico.
Esta imagen muestra los valores calculados y el gráfico correspondiente al excluir la mediana.
Esta imagen muestra los valores calculados y el gráfico correspondiente al incluir la mediana.
De esta forma termina el recorrido por los gráficos estadísticos en Excel 2016. En la próxima entrada hablaremos de los gráficos de cascada, otra novedad de esta versión del producto.
Este artículo forma parte de la serie dedicada a MS Office Excel 2016.