Posts tagged ‘Distribución normal’

Normalmente asumimos que nuestros datos siguen una distribución Normal, pero en realidad, no es siempre así. Obtenemos un resultado, por ejemplo, en el cálculo del Cpk, y no sospechamos que tal vez, no estén reflejando la realidad. Cuanto más se aparten nuestros datos de la Normalidad, cuando esta sea un requisito del modelo estadístico, aumentará el error de los mismos, y nos alejaremos de las buenas decisiones.
Analicemos este grupo de datos
96, 95, 97, 95, 95, 97, 102, 100, 101, 103, 105, 106, 103, 102, 100, 103, 102, 103, 104 y 105
Nota: Respetar el orden de los datos
¿Cómo verificamos si estos datos siguen una distribución normal?
a. Realizando, por ejemplo, la Prueba de normalidad de Kolmogorov – Smirnov (KS).
i. H0: La distribución es Normal (Hipótesis nula)
H1: La distribución no es Normal (Hipótesis alternativa)
ii. Si trabajamos con un intervalo de confianza de 95 %, nuestro α será 0,05.
iii. Tomaremos el p-valor como prueba estadística
iv. La regla de decisión
Si el valor p, de esta prueba, es menor que el nivel de significancia elegido (α =0,05), se rechaza H0 (se acepta H1), y se concluye que se trata de una población No Normal. Si no podemos rechazar la H0, asumiremos que la distribución es Normal
v. Tomar la decisión de aceptar o rechazar H0.
¿Cómo lo hacemos en Minitab?
a. Cargamos una columna con los datos a verificar en la planilla Minitab
b. Seleccionamos la ruta descripta en la figura siguiente

c. Aceptando en Test de Normalidad, se abre el siguiente cuadro de diálogo.

Completamos la variable seleccionada, en nuestro caso es la columna 1 (C1)
Elegimos el test seleccionado (KS),
Colocamos el título
Hacemos click el OK
Aparece el siguiente gráfico

El Valor p es menor que α (0,05), por lo tanto, rechazamos la H0, No es una distribución Normal.
Si la distribución debe ser Normal, como requisito para el modelo estadístico que vamos a utilizar, debemos intentar normalizar los datos.
Utilizaremos la transformación de Box Cox
Seleccionamos la ruta descripta en la figura siguiente

Aceptando en Test de Box Cox.
Se abre el siguiente cuadro de diálogo:

Seleccionamos la columna a analizar
Hacemos click en Opciones (abre el 2do cuadro de diálogo)

Elegimos la columna donde salvar los nuevos datos
Seleccionamos el Lamda óptimo
Hacemos click el OK en los 2 cuadros de diálogos

Nos aparece la columna 2 (C2) con los datos transformados y el gráfico de la variación de Lamda,

Volvemos a realizar el test de normalidad
Realizamos el ensayo de Normalidad, pero sobre la columna de datos transformados.

El Valor p es igual que α (0,05), por lo tanto, No rechazamos la H0, asumimos que se Normalizó la distribución.

Ahora si podemos efectuar el cálculo de la capacidad del proceso con los datos normalizados.

Espero que les haya resultado útil.

Es muy probable que ya manejen este tema y no les resultará nuevo este concepto, pero muchas veces siento que es oportuno volver a principios básicos para nuestra operación diaria.

En un mundo ideal, cualquier producción podría producir productos perfectos. Podría no ser necesario efectuar el control de calidad dado que cada unidad del lote de un comprimido de 125 mg exactos contiene el 100 % de la droga declarada reproduciendo el diseño original del producto.

Desafortunadamente, en el mundo real de la producción, muchos factores se combinan e interactúan para hacer cada unidad única.

Temperatura, humedad, materiales utilizados, la parametrización de las máquinas, todo puede variar y afectar al producto. Los elementos actuales que salen del proceso de producción pueden ser más delgados, más gruesos, más largos o más cortos, más pesados o más livianos, diferentes de sus dimensiones ideales.

Si cada uno de los ítems producidos podría ser testeado, poco necesaria sería la estadística para control de calidad. Las formas de dosificación individuales que resultan ser insatisfactorias podrían descartarse y sólo los artículos buenos se liberarían para su distribución posterior. Pero en la mayoría de los casos el 100% de muestreo es difícil si no imposible y el gasto probablemente sería prohibitivo tanto para el fabricante como para el consumidor. La variación inevitable de la calidad del producto y las limitaciones económicas hacen necesaria alguna forma de control estadístico de la calidad para cualquier proceso de fabricación.

El desafío es económico tanto para el productor como para el consumidor: para el productor que desea reducir el número de artículos rechazados, para el consumidor que espera recibir únicamente productos que correspondan estrictamente a sus propias especificaciones.

El interés común no solo debería ser el control del proceso de manera de obtener productos de calidad aceptables para el cliente, sino también la optimización del proceso para mejorar continuamente los productos. El uso de las técnicas estadísticas en Control de Calidad y la optimización de métodos es la más eficiente forma para alcanzar estos objetivos.

Conceptos básicos

La primera idea que debemos tener siempre en nuestra mente es: “hay una variación natural en todo”. Un proceso de manufactura está principalmente afectado por el entorno, los materiales, los métodos, las máquinas y también los operadores. Cuando la variación de un proceso es la suma de un gran número de parámetros independientes teniendo individualmente poca influencia en toda la variación, este proceso puede ser descrito por la distribución normal bien conocida caracterizada por la media y la desviación estándar. Los parámetros independientes se llaman causas naturales, aleatorias o inherentes de la variación. La eliminación de cualquiera de estas causas menores es en su mayoría no rentable y a menudo no imposible.

Cuando un proceso de fabricación falla repentinamente, está bajo la influencia de causas de variación aislables o asignables. Por el contrario, estas causas son generalmente exteriores al proceso, fáciles de localizar, fáciles de eliminar y, por tanto, rentables.

Para un proceso de fabricación, el objetivo de importancia principal es distinguir entre las variables aleatorias y las causas de variación asignables. Trabajar sin tener este objetivo siempre como principio sería engañoso. Aún hoy en día, un gran error de juicio a menudo consiste en suponer que cada accidente de proceso o no conformidad se debe a una causa asignable y esto sin tener en cuenta la variación natural del proceso. La consecuencia principal de los sobre seteos de los equipos es por un lado la pérdida de tiempo y por otro lado conducir en el peor de los casos a un aumento artificial de la variación del proceso.

Tomemos el ejemplo de un producto cuya característica durante la producción varía en realidad como la curva de gauss de la figura siguiente.

Si el operador a cargo del proceso toma un ítem individual y mide su característica, existe una probabilidad que esta medición se realice en posición cerca a más 3 sigma. Si este operador es informado acerca de la variación del proceso y no está acostumbrado a alguna estadística básica, configurará la máquina para poner dicho punto en la posición 0 correspondiente al valor objetivo central.

Entonces, la distribución de producción se traduce a la derecha, dando una nueva curva de distribución. En esta situación hay una probabilidad de tomar un ítem que característico está en la posición cerca de menos 3 sigma. Utilizando siempre el mismo razonamiento, los trabajadores pondrán la máquina de nuevo a la meta Valor en posición 0. La nueva distribución de producción corresponderá a otra curva a le izquierda de la inicial.

Con la mejor de las intenciones, desde el ajuste hasta el ajuste, el operador está incrementando la variación natural del proceso. En el peor de los casos puede ser el doble de la inicial.

Por lo que parece una gran necesidad de herramientas estadísticas que permitan, en primer lugar, estudiar y luego controlar la variación del proceso.

Continuando con las herramientas que tenemos para el análisis de la causa raíz de nuestros problemas, escogimos un par de ellas, pienso que son las más conocidas y quiero aprovechar para refrescarlas, me refiero a:

En este artículo nos vamos a referir al uso de los Histogramas para ver cómo están conectadas las posibles causas con el problema y cuáles causas parece que hace el mayor daño.

El propósito de la fase de análisis de datos de causa problema (última etapa antes de intentar solucionar el problema), es clasificar las posibles causas.

Muchas veces tenemos la tentación de ir para adelante con análisis parciales sobre el tema y la intención de resolver el problema de una sola vez, pero SEAMOS PACIENTES. Porque perseguir todas las causas posibles, es gasto de energía, tiempo, dinero eliminando síntomas relacionados y quizás no las causas. Sin duda, usted hará un mejor análisis para orientar con precisión la causa antes de iniciar el proceso de eliminación.
Así que tenga paciencia, haga el ejercicio y luego encontrará la causa raíz

Propósito y aplicaciones de los histogramas

Un histograma, es usado para mostrar la distribución y variación de un conjunto de datos (medidas de longitud, diámetro, peso, duración, costos, etc.)

Ud. puede presentar la misma información en una tabla, sin embargo, el formato gráfico usualmente es más fácil de interpretar.

Aplicaciones técnicas de los histogramas en el análisis de causa raíz incluyen:

  • Presentación de los datos para determinar cuáles son causas dominantes de un problema
  • Entender la distribución de ocurrencia de distintos problemas, causas, consecuencias, etc.

En la distribución de histograma, es importante mencionar un concepto estadístico básico, llamado distribución normal, este es el caso donde un conjunto de observaciones es distribuido uniformemente alrededor de un punto central, o valor esperado. Si los datos de una distribución normal son presentados en un histograma, la gráfica empezará a decaer a ambos lados de este valor central. La representación es simétrica y luce como una campana.

Etapas para confeccionar un histograma

  1. Contar el número de datos (N) – para producir un histograma válido al menos deberíamos tener 30 datos.
  2. Calcular la distancia numérica (R) entre el valor mayor y el menor de los datos.
  3. Dependiendo del valor de N, dividir R en un número de datos de C que puede ser hallado en la siguiente tabla:

 

# de datos (N) # de clases (C)

< 50

5 – 7

50 – 100

6 – 10

100 – 250

7 – 12

> 250

10 – 20

 

  1. Determinar el ancho de cada clase (H), esto es calculado a través de la siguiente fórmula:

H = R/C

  1. Determinar los valores menores y mayores para cada clase individualmente estableciendo el valor mínimo del conjunto de datos como el valor más bajo para la primera clase. Encontrar el valor más alto para este tipo mediante la adición del ancho de la clase con el valor más bajo. El valor más alto de una clase, a su vez se convierte en el valor más bajo de la clase siguiente. recordar que el valor más bajo siempre se incluye en su clase (Esto es, ≥ valor menor), mientras que el valor superior pertenece a la clase siguiente (Esto es, < valor superior)  
  2. Construir el histograma (para simplificar su construcción usar Excel). Marcar las clases a lo largo del eje horizontal yla Frecuenciaa lo largo de la vertical, utilice las barras verticales para indicar la distribución entre las clases.

Algunos ejemplos de interpretaciones de histogramas pueden ser:

  • Un pico mostrando el valor medio para el proceso que no está centrado, frecuentemente tiene una causa para ello, la cual podría ser interesante estudiarla
  • Dos claros picos podrían provenir de dos diferentes poblaciones de datos tales como dos operadores, dos turnos, dos vendedores, etc. Esto debería ser chequeado.
  • Un patrón de corte que no muestra signos de reducción progresiva sugiere que los datos están siendo sometidos a un proceso de selección durante o después de la recolección
  • Un patrón en forma de peine indica que fueron definidas demasiadas clases y algunas clases son incapaces de capturar datos.

Un ejemplo del uso de un Histograma

Un local de comida usa distintos repartidores para efectuar la  entrega de los pedidos a sus clientes. Una de sus cartas de presentación es la entrega antes de los 20 minutos de recibido el pedido.

Frecuentes quejas sobre entregas tardías repentinamente comenzaron a ocurrir.

Cuando el dueño del local habló sobre los reclamos con los repartidores, ellos se mostraron sorprendidos, no arrojaron explicación alguna sobre el hecho, y prometieron cumplir con el estándar.

Luego de un breve período de reducción de los reclamos, los mismos comenzaron a aumentar otra vez hasta los niveles anteriores.

El dueño del local comenzó a tomar nota de los reclamos y a registrar cuál era el repartidor que había efectuado la entrega.

Luego de varias semanas de registro, analizó los datos (el diagrama resultante es mostrado más abajo). Cuando el repartidor fue enfrentado con los datos reconoció que estaba teniendo serios problemas mecánicos con la moto, los cuales le impedían hacer su entrega eficientemente, de ahí la demora en las entregas.

Les dejo el Histrograma y espero que les haya resultado útil.