Detector de Valores Atípicos IQR
Usa los métodos Tukey 1.5×IQR y
MAD
para identificar y visualizar rápidamente valores atípicos
🔍 Métodos de Detección
Método Tukey (1.5×IQR)
- • Límite Inferior: Q1 - 1.5 × IQR
- • Límite Superior: Q3 + 1.5 × IQR
- • Método clásico, uso generalizado
- • Consistente con diagramas de caja
Método MAD
- • Basado en Desviación Absoluta Mediana
- • Más robusto ante valores extremos
- • Ideal para distribuciones sesgadas
- • Umbral defecto: 3 × MAD
Formatos de Datos Soportados:
- Separados por coma: 1.5, 2.8, 9.1, 16.2
- Separados por espacio: 1.5 2.8 9.1 16.2
- Separados por línea: un número por línea
- Notación científica: 1.23e-4, 5.67E+8
- Modo series: usa "Nombre del Grupo: valor1, valor2, valor3" por línea para comparar múltiples grupos
- Ignora automáticamente texto y caracteres especiales
Universal Standard (R, Python, Google Sheets)
Linear interpolation method, default standard for modern data science software
Tus resultados de cálculo y diagrama de caja aparecerán aquí al instante
Por favor, ingresa al menos 4 números arriba para comenzar a calcular
Resultados del Cálculo
Estadísticas Básicas
Cuartiles
Resumen de 5 Números
Valores Atípicos Detectados
Los siguientes puntos de datos son identificados como valores atípicos usando el método :
Resumen de Series Agrupadas
¿Qué son los valores atípicos?
Un valor atípico (Outlier) es un punto de datos que difiere significativamente de otras observaciones en un conjunto de datos. Pueden deberse a variabilidad en la medición, errores experimentales o ser una novedad real. Identificarlos correctamente es crucial para la limpieza de datos y análisis estadístico.
Regla de Tukey 1.5×IQR
Este es el método más utilizado para detectar valores atípicos, propuesto por John Tukey:
- Calcular el Primer Cuartil (Q1) y el Tercer Cuartil (Q3)
- Calcular el Rango Intercuartílico (IQR = Q3 - Q1)
- Límite Inferior = Q1 - 1.5 × IQR
- Límite Superior = Q3 + 1.5 × IQR
- Cualquier valor fuera de estos límites es un posible valor atípico
Método MAD (Desviación Absoluta de la Mediana)
MAD es un método más robusto, especialmente adecuado para distribuciones asimétricas:
- Calcular la mediana de los datos
- Calcular la diferencia absoluta de cada punto con la mediana
- MAD = La mediana de estas diferencias absolutas
- MAD Modificado = 1.4826 × MAD (para consistencia con distribución normal)
- Valor Atípico: Desviación de la mediana > 3 × MAD Modificado
¿Cuándo usar qué método?
| Escenario | Método Recomendado |
|---|---|
| Datos simétricos | Ambos métodos funcionan bien |
| Datos sesgados | MAD es más robusto |
| Combinar con diagrama de caja | Método Tukey |
| Múltiples valores atípicos | MAD es más fiable |
Preguntas Frecuentes
¿Por qué usar 1.5 como multiplicador?
1.5 es el valor elegido por Tukey basado en experiencia y teoría. Para una distribución normal, esto marca aproximadamente el 0.7% de los datos como atípicos. Usar 3.0 detectaría valores atípicos extremos ("far out").
¿Qué hacer tras detectar un valor atípico?
Primero investiga la causa. Si es un error de datos, corrígelo o elimínalo. Si es un valor extremo real, decide si conservarlo o tratarlo por separado según el objetivo de tu análisis.
¿Están seguros mis datos?
Totalmente seguros. Todos los cálculos se realizan en tu navegador y los datos nunca se envían a ningún servidor.