Detector de Valores Atípicos IQR

Usa los métodos Tukey 1.5×IQR y MAD para identificar y visualizar rápidamente valores atípicos

🔍 Métodos de Detección

Método Tukey (1.5×IQR)

  • • Límite Inferior: Q1 - 1.5 × IQR
  • • Límite Superior: Q3 + 1.5 × IQR
  • • Método clásico, uso generalizado
  • • Consistente con diagramas de caja

Método MAD

  • • Basado en Desviación Absoluta Mediana
  • • Más robusto ante valores extremos
  • • Ideal para distribuciones sesgadas
  • • Umbral defecto: 3 × MAD
Esperando entrada de datos...
🔒 Cálculo 100% local, los datos nunca salen del navegador

Formatos de Datos Soportados:

  • Separados por coma: 1.5, 2.8, 9.1, 16.2
  • Separados por espacio: 1.5 2.8 9.1 16.2
  • Separados por línea: un número por línea
  • Notación científica: 1.23e-4, 5.67E+8
  • Modo series: usa "Nombre del Grupo: valor1, valor2, valor3" por línea para comparar múltiples grupos
  • Ignora automáticamente texto y caracteres especiales

Universal Standard (R, Python, Google Sheets)

Linear interpolation method, default standard for modern data science software

R (type=7) Python NumPy Google Sheets QUARTILE.EXC
Interpolated Values
Medium Complexity

Tus resultados de cálculo y diagrama de caja aparecerán aquí al instante

Por favor, ingresa al menos 4 números arriba para comenzar a calcular

¿Qué son los valores atípicos?

Un valor atípico (Outlier) es un punto de datos que difiere significativamente de otras observaciones en un conjunto de datos. Pueden deberse a variabilidad en la medición, errores experimentales o ser una novedad real. Identificarlos correctamente es crucial para la limpieza de datos y análisis estadístico.

Regla de Tukey 1.5×IQR

Este es el método más utilizado para detectar valores atípicos, propuesto por John Tukey:

  1. Calcular el Primer Cuartil (Q1) y el Tercer Cuartil (Q3)
  2. Calcular el Rango Intercuartílico (IQR = Q3 - Q1)
  3. Límite Inferior = Q1 - 1.5 × IQR
  4. Límite Superior = Q3 + 1.5 × IQR
  5. Cualquier valor fuera de estos límites es un posible valor atípico

Método MAD (Desviación Absoluta de la Mediana)

MAD es un método más robusto, especialmente adecuado para distribuciones asimétricas:

  • Calcular la mediana de los datos
  • Calcular la diferencia absoluta de cada punto con la mediana
  • MAD = La mediana de estas diferencias absolutas
  • MAD Modificado = 1.4826 × MAD (para consistencia con distribución normal)
  • Valor Atípico: Desviación de la mediana > 3 × MAD Modificado

¿Cuándo usar qué método?

Escenario Método Recomendado
Datos simétricos Ambos métodos funcionan bien
Datos sesgados MAD es más robusto
Combinar con diagrama de caja Método Tukey
Múltiples valores atípicos MAD es más fiable

Preguntas Frecuentes

¿Por qué usar 1.5 como multiplicador?

1.5 es el valor elegido por Tukey basado en experiencia y teoría. Para una distribución normal, esto marca aproximadamente el 0.7% de los datos como atípicos. Usar 3.0 detectaría valores atípicos extremos ("far out").

¿Qué hacer tras detectar un valor atípico?

Primero investiga la causa. Si es un error de datos, corrígelo o elimínalo. Si es un valor extremo real, decide si conservarlo o tratarlo por separado según el objetivo de tu análisis.

¿Están seguros mis datos?

Totalmente seguros. Todos los cálculos se realizan en tu navegador y los datos nunca se envían a ningún servidor.