martes, 1 de junio de 2010

HISTOGRAMA


Un histograma es una representación gráfica de una variable en forma de barras, donde cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical (Y) se representan las frecuencias, y en el eje horizontal (x) los valores de las variables, normalmente señalando las marcas de clase, es decir, la mitad del intervalo en el que están agrupados los datos.

CUANDO ULTILIZARLO:
Como norma, se utiliza cuando se estudia una variable continua, como edades, pesos, medidas o alturas de una muestra.

Sus valores se agrupan en clases, es decir, valores continuos.

En los casos en los que los datos son discretos (no-numéricos), es preferible un diagrama de sectores.

PARA QUE SIRVE:
Permite resumir gran cantidad de datos y facilita el análisis de los mismos evidenciando esquemas de comportamiento y pautas de variación que sería difíciles de captar en una tabla numérica.

Revela la media, la variabilidad de los datos y la forma de la distribución.

Permite detectar anomalías, la existencia de datos que provienen de dos distribuciones distintas, los valores que aparecen con más frecuencia, etc...

Permite comunicar información de forma visual, clara y sencilla sobre situaciones
complejas.

Es una herramienta muy útil cuando un equipo se enfrenta con la tarea de analizar datos con muchas variaciones.
Se puede usar como ayuda en las fases de un proceso de solución de problemas e incluso para el seguimiento de los avances en las acciones de mejora realizadas, para un análisis de Antes-Después.

CONTRUCCIÓN:
Aunque existen diversos programas informáticos que nos ayudan a generar histogramas, incluso en Excel, detallaré los pasos necesarios para la elaboración de un histograma a mano, para facilitar la comprension su funcionamiento.

Paso 0


Preparar los datos
Como en todas las herramientas de análisis de datos, el primer paso consiste en
recoger estos de forma correcta o asegurarse de la adecuación de los
existentes.
Los datos deben ser:
- Objetivos: Hechos, no en opiniones.
- Exactos: Debemos asegurarnos que la variabilidad de la medida no desvirtúa la variabilidad del proceso en estudio.
- Completos: Se debe registrar toda la información asociada a cada
toma de datos (máquina, hora del día, empleado, etc) en previsión de los posibles futuros
análisis que puedan ser necesarios.
- Representativos: Deben reflejar la realidad de la población.

Paso 1

Determinar los valores extremos de los datos y el rango de los datos
Identificar en la tabla de datos originales el valor máximo, el valor mínimo y el rango. Rango es igual al dato mayor menos el dato menor. (R = Valor max - Valor min).

Paso 2


Obtener los números de clases que tendrá el histograma.
Clases: Son los intervalos en que se divide la característica sobre la que se han
tomado los datos. El número de clases es igual al de barras del Histograma.
El mínimo para un histograma deberían ser 40 datos. Pueden darse menos si el
histograma original ha sido estratificado.
Tenemos que tener cuidado en no perder la pauta de comportamiento de los datos al escoger un número de clases erróneo.
Un criterio usado frecuentemente es que el número de clases debe ser aproximádamente a la raíz cuadrada del número de datos. Por ejemplo, la raíz cuadrada de 30 ( número de artículos) es mayor que cinco, por lo que se seleccionan seis clases.
Todas las clases tendrán el mismo intervalo.
No habrá solapamiento entre distintas clases.

Paso 3

Establecer la amplitud/longitud de clase: es igual al rango dividido por el número de clases.

Paso 4


Construir los intervalos de clases, anotando los límites de cada uno: Los intervalos resultan de dividir el rango de los datos en relación al resultado del PASO 2 en intervalos iguales.
Los límites de la primera clase incluirán el valor mínimo de los datos.

Paso 5

Calcular la frecuencia de cada clase
Determinar el número de datos que están incluidos en cada una de las clases
(frecuencia de clase).
El recuento se hará de la siguiente forma:
Empezar con el primer dato de la lista e identificar la clase en la cual está
incluido. Señalar para dicha clase, una "marca". Repetir el mismo proceso para
cada dato de la muestra tomada.
Para facilitar el recuento final se dibujan las "marcas" en grupos de cinco,
cuatro verticales y el quinto cruzándolos. La suma de las "marcas" para cada clase corresponde a la frecuencia de la misma.
Comprobar que el número total de datos es igual a la suma de las frecuencias
de cada clase.

Paso 6


Dibujar los ejes
El eje vertical (Y) representa las frecuencias adaptando la escala a las frecuencias encontradas.
El eje horizontal (X) representa los valores y la amplitud de la característica de los datos.
Este eje se divide en tantos segmentos como clases se hayan definido.
Marcar los límites de los intervalos de clase.
Marcas el eje con la característica representada y las unidades de medida
empleadas.

Paso 7


Graficar el histograma
Dibujar las barras verticales correspondientes a cada clase. Su base está
situada en el eje horizontal y su altura corresponderá a la frecuencia de la
clase representada.

Paso 8


Identificar el Gráfico
Cuando proceda, poner el título, las condiciones en que se han recogido los
datos, los límites de tolerancia nominales, etc. Estas notas ayudan a los demás
a interpretar el gráfico y sirven de recordatorio de la fuente de los datos.

INTERPRETACIÓN DE LAS PAUTAS DE VARIACIÓN
Este paso es clave a la hora de la realización de un histograma.
Uno de los propósitos del análisis de un Histograma es identificar y clasificar la pauta de variación del conjunto de datos estudiado (Media, Rango, forma) y elaborar una explicación a dicha pauta, que relacione la variación con el proceso en estudio.

El resultado de este análisis es una hipótesis sobre el funcionamiento del proceso o sobre la causa del problema en estudio.


Por ser una hipótesis es necesario confirmarla o descartarla, recogiendo otros datos que nos den información más específica sobre dicha hipótesis.

La experiencia del grupo de trabajo en la interpretación de gráficos es fundamental en la utilización de esta herramienta, ya que no existen reglas fijas que se puedan utilizar para explicar de forma precisa las pautas de variación en cualquier situación.


Los equipos de trabajo deben profundizar en el proceso estudiado para utilizar esta herramienta de forma eficaz.


Estas son algunas formas típicas de la variación que pueden ayudar a clasificar Histogramas y consejos generales sobre posibles causas.

Pautas típicas de variación:


Distribución Normal (en forma de campana)

Forma simétrica con un pico en la mitad del recorrido de los datos.
Es la distribución natural para los datos de gran cantidad de procesos. Por esta circunstancia se llama Distribución Normal.
La desviación respecto a esta forma puede indicar la existencia de problemas o influencias externas al proceso.
Sin embargo la forma de campana no asegura, por sí misma y sin analizar su valor medio y el recorrido de los datos, que el proceso funcione de forma correcta.

Distribución Bimodal (doble campana o doble pico)
Un marcado valle en el centro de la distribución con picos a ambos lados.
Esta forma, generalmente, es la combinación de dos distribuciones y nos sugiere la
presencia de dos poblaciones distintas.
Deberán trabajarse los datos para separar las distintas poblaciones.

Distribución en peine
Valores altos y bajos se alternan de forma regular.
Esta pauta de variación es típica de errores de medición, errores en la forma
de agrupar los datos para la construcción del Histograma o sesgos sistemáticos
de redondeo.
En este caso revisar inicialmente los procesos de recogida de datos y
construcción del Histograma.

Distribución Normal con un pico aislado
El proceso con un pico aislado será una anormalidad o deficiencia en el proceso pero que no sucede de forma normal.
Se deben analizar las condiciones en que se presenta el pico tratando de
estratificar los datos.
Estos picos unidos a distribuciones sesgadas o truncadas indican falta de
eficacia en la eliminación de elementos defectuosos.


Distribución con un pico en el extremo
Un pico situado en un extremo de una distribución regular.
Esta forma se presenta cuando la cola de una distribución regular se ha cortado
y acumulado en una sola categoría en el extremo del recorrido de los datos.
Suele indicar un registro poco cuidadoso o sesgado de los datos. Muchas veces la causa es el redondeo a los límites de especificación.

Distribución sesgada o truncada
Su forma es asimétrica, con un pico descentrado dentro del recorrido de los
datos, las colas descienden: bruscamente en un lado y suavemente en el otro.
Esta distribución es típica de procesos con límites prácticos a un lado del valor
nominal o a datos parciales de un proceso (distribuciones con parte de los
datos suprimidos).

A TENER EN CUENTA
Es importante representar los límites de especificaciones u otros estándares, respecto de los resultados aceptables y considerarlos en la fase de análisis e interpretación de los Histogramas ya que:
-Los límites de especificaciones a menudo influyen en el proceso y sobre la
pauta de variación de los datos.
-El conocimiento detallado de estándares es esencial para la correcta
interpretación de las distribuciones sesgadas, truncadas y con picos extremos.
-También se necesitan a menudo los límites para interpretar otras formas de
Histogramas y decidir sobre los siguientes pasos a dar por el grupo de trabajo.
Incluso ante una distribución perfecta de campana, el grupo de trabajo debe
plantearse cuestiones tales como:
¿La distribución se encuentra dentro de los límites?

DEBEMOS EVITAR
-Los datos no adecuados
-Muestra pequeña y poco representativa.
-Aceptar las conclusiones como hechos y no como una hipótesis.

Espero que esta herramienta os sea de utilidad
Recordad que existen diversos programas que os pueden ayudar a la elaboración de un histograma, utilizadlos, ya que lo más importante es la preparación, la toma de datos y el análisis, no crear el histograma.
Un Saludo

4 comentarios: