Estadística aplicada – Primera parte
En Estadística lo primordial es esencialmente la obtención de procedimientos que permitan reducir los riesgos inherentes. Si bien el andamiaje matemático requerido para su desarrollo es relativamente complejo, no es necesario para tener una idea intuitiva del concepto y así evitar errores comunes.
La noción de riesgo es antigua, pero recientemente ha recobrado mucha importancia en el ámbito de la calidad, existiendo incluso una Norma ISO (31010) que sistematiza algunas técnicas para su evaluación.
Por ejemplo, tenemos que diseñar inspección de contenedores, aceptables sólo cuando la proporción de unidades no conformes no supera determinado límite. Supongamos, además, que la inspección es destructiva. Entonces no se puede realizar inspección 100%.
Intuitivamente, se toma una muestra pequeña (de tamaño fijo) de cada lote, y si en esa muestra hay hasta cierta cantidad límite de unidades no conformes (límite de aceptación), el lote es aceptado, y en caso contrario, rechazado. En este simple e intuitivo procedimiento tenemos dos posibles estados del sistema (los estados constituyen los parámetros desconocidos del objeto a estudio): lotes conforme y no conforme, y, además, pérdidas debido a los errores de decisión. Pérdidas por falsa aceptación y por falso rechazo: por cada lote falsamente rechazado y por cada uno falsamente aceptado se sufren pérdidas, generalmente económicas, no necesariamente del mismo valor.
Si la probabilidad de falsa aceptación es 0.01, se interpreta intuitivamente que, a largo plazo, aproximadamente 1 de cada 100 lotes no conformes es falsamente aceptado. Si a su vez, la pérdida por falsa aceptación es de $300, promedialmente estaremos perdiendo por lote (300 x 0.01) = $3 (riesgo de falsa aceptación o riesgo del consumidor). Es decir, este riesgo es la pérdida media inherente a ese procedimiento de inspección, sufrida al inspeccionar lotes no conformes. De forma análoga se define el riesgo del proveedor.
Este simple ejemplo ilustra la esencia del concepto: riesgo es la pérdida media que se sufre por aplicación repetida del mismo procedimiento a unidades experimentales correspondientes al mismo estado, es decir, hay tantos riesgos como estados.
Intuitivamente, cuanto más grande sea la muestra, más chicos van a ser estos riesgos, pero mayores van a ser los costos. Matemáticamente se puede establecer un tamaño muestral para que la “suma” de los costos de inspección más los riesgos sea mínimo (buen balance costo/beneficio), esto es justamente la tarea de los llamados planes de muestreo (ver por ejemplo, la Norma ISO 2859).También se puede realizar un balance de riesgos: por ejemplo, si el número de aceptación es 5 y luego se lo reduce a 4 (manteniendo fijo el tamaño muestral), se reduce el riesgo del consumidor a costa de un aumento del riesgo del proveedor.
Prácticamente todos los conceptos metrológicos y de Control de Calidad modernos se basan en el concepto de riesgo, por ejemplo, el de límite de detección que ya no se corresponde con un límite “perceptivo” (por ejemplo, mínima concentración para detectar viraje de indicador), sino al concepto de riesgo: la mínima concentración tal que las probabilidades de falso positivo y falso negativo sean inferiores a valores preestablecidos (generalmente 0.05) (ISO 11843), la estimación de Incertidumbre Expandida de medición, que permite relacionar los límites de aceptación con los límites de tolerancia y los riesgos de falsa conformidad y falsa no conformidad (JGCM 106:2012), etc.
Las pruebas de hipótesis son procedimientos en los cuales se debe decidir entre dos hipótesis mutuamente excluyentes (prácticamente cualesquiera afirmaciones estadísticas, por ejemplo, “la distribución es normal”, “las medias son iguales”, etc.), una llamada nula (H0) y la otra (H1), alternativa. Los riesgos se controlan en la práctica mediante el nivel de significación (“α”), que esencialmente es la máxima probabilidad de falso rechazo de H0 (“máxima” porque puede haber varios “casos” en H0 -en este caso se dice que la hipótesis es compuesta-, por ejemplo “la media es menor o igual a 10”; para cada valor de la media contemplada en H0, existe una probabilidad distinta de falso rechazo de H0); para un tamaño muestral dado, a menor α menor probabilidad de falso rechazo de H0 y mayor probabilidad de falso rechazo de H1 (β).
Con estas simples nociones, sin necesidad de complejas formulaciones matemáticas se pueden evitar errores comunes, como veremos muy escuetamente, por razones de espacio, en los siguientes puntos.
- Nivel de significación y tamaño muestral
Error común: mantener fijo α = 0.05 (valor predeterminado); si el tamaño muestral es grande (como suele suceder a nivel industrial) y se sigue manteniendo el mismo α, β será muy pequeño, y lejos de proteger H0, se tiende a rechazarla en demasía (la prueba tiene tantos datos que detecta cualquier apartamiento de H0 por pequeño que sea, se podría decir que, con suficientes datos, prácticamente cualquier prueba de hipótesis siempre tiende a rechazar H0). Conclusión: si el tamaño muestral es grande (por ejemplo 1000) debería pensarse en reducir α.
- Multiplicidad de pruebas para las mismas hipótesis
Por ejemplo, varias pruebas de normalidad. ¿Qué pasa si con una se acepta H0 y con otra se la rechaza?
El procedimiento aplicable puede establecer que se acepta H0 cuando todas las pruebas la aceptan, cuando sólo una la acepta, o alguna variante intermedia. Cualquiera de esos procedimientos es correcto, el primero aumenta α tal vez mucho (es muy exigente para aceptar la normalidad),lo que no es válido es elegir el procedimiento luego de realizar los experimentos.
- Manejo de no conformidades en Control de Calidad de lotes
Se estipula por ejemplo que se deben tomar 20 muestras ¿qué pasa si alguna resulta no conforme? ¿Se sacan otras muestras? ¿Si sacamos otra muestra, el control de los lotes quedó “desbalanceado” porque de algunos se saca más y de otros menos? ¿Tiene sentido estadístico?
Una solución simple podría ser, por ejemplo, establecer en el procedimiento que el lote se acepta si 20 de 22 muestras son conformes, de este modo, si las primeras 20 fueron conformes, no es necesario sacar otras muestras. Los riesgos se calculan en base a ese criterio perfectamente válido: 20 de 22 muestras deben ser conformes.
Bibliografía
- Norma ISO 11843 (Capability of detection)
- Norma ISO 2859 (Sampling procedures for inspection by attributes)
- BIPM JCGM 106:2012 (Evaluation of measurement data-The role of measurement uncertainty in conformity assessment)
- UNIT – ISO/IEC 31010:2009 (Gestión del riesgo- Técnicas de evaluación del riesgo)
Encargado del Laboratorio de Metrología y Control de Procesos y Cursos de Estadística y Metrología Asesoría y Consultoría en Estadística y Control de Procesos