TL;DR (Resumen)

Diferentes software estadísticos calculan cuartiles de manera diferente, lo que lleva a discrepancias confusas. Esta guía explica la clasificación Hyndman-Fan, compara métodos lado a lado, y te ayuda a elegir el enfoque correcto.

Por qué importa esto: Procesa los mismos datos a través de R, Excel y Python, y podrías obtener tres valores de Q1 diferentes.

1. El Problema: Por Qué Difieren los Resultados de Cuartiles

Imagina que tienes este conjunto de datos simple:

Datos: [1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25]
N = 13 valores

Calculas Q1 usando diferentes herramientas:

Herramienta	Función	Resultado Q1
R	quantile(data, 0.25)	6.0
Python	np.percentile(data, 25)	6.0
Excel	=QUARTILE.INC(range, 1)	7.0
Libro de texto	Método Tukey	5.0

¡Mismos datos, tres respuestas diferentes!

Respuesta: Todas son "correctas" - solo están usando diferentes métodos de interpolación. Ninguno es fundamentalmente mejor; sirven para diferentes casos de uso.

2. La Clasificación Hyndman-Fan

En su artículo fundamental de 1996, Hyndman y Fan identificaron 9 métodos diferentes para calcular cuantiles muestrales. Estos se designan Tipo 1 hasta Tipo 9.

Los Métodos Más Comunes

Tipo	Nombre	Usado Por	Popularidad
Tipo 6	Bisagras de Tukey	Libros de texto, Minitab	Educativo
Tipo 7	Interpolación Lineal	R, Julia, NumPy	Estándar Ciencia de Datos
Tipo 8	Mediana-insesgada	Excel, Google Sheets	Estándar Negocios
Tipo 5	Lineal por tramos	SPSS, SAS	Software Estadístico

¿Por Qué Tantos Métodos?

Cada método hace suposiciones diferentes sobre:

Cómo manejar posiciones entre puntos de datos (interpolación)
Si incluir o excluir la mediana al dividir los datos
Cómo ponderar los valores vecinos

Información Clave: Para conjuntos de datos grandes (N > 100), todos los métodos convergen a resultados casi idénticos. Las diferencias importan más para conjuntos de datos pequeños a medianos (10 < N < 50).

3. Tipo 6: Bisagras de Tukey (Libros de Texto)

Desarrollado por

John Tukey (1977)

Filosofía

"Mediana inclusiva"

Matemáticas

Mediana de cada mitad

Cómo Funciona

Ejemplo: [1, 3, 5, 7, 9, 11, 13]

Encontrar mediana: 7 (valor medio con N=7)
Mitad inferior incluyendo mediana: [1, 3, 5, 7]
Mitad superior incluyendo mediana: [7, 9, 11, 13]
Q1 = mediana de [1, 3, 5, 7] = 4
Q3 = mediana de [7, 9, 11, 13] = 10

Cuándo Usar

Tareas de estadística y problemas de libros de texto
Explicar cuartiles a principiantes
Cálculos manuales a mano
Seguir cursos de estadística introductoria

Evitar Cuando

Publicar investigación (usar Tipo 7)
Trabajar en R/Python (el predeterminado difiere)
Necesitas consistencia con herramientas modernas

Ejemplo de Código

# R (debe especificar type = 6 explícitamente)

data <- c(1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25)
Q1_tukey <- quantile(data, 0.25, type = 6)
Q3_tukey <- quantile(data, 0.75, type = 6)

print(paste("Q1:", Q1_tukey))  # Salida: Q1: 5
print(paste("Q3:", Q3_tukey))  # Salida: Q3: 21

¿No quieres calcular a mano?

Usar Calculadora Tukey Gratis →

4. Tipo 7: Predeterminado R/Python (Ciencia de Datos)

Estado

Estándar moderno

Filosofía

Interpolación lineal

Matemáticas

q = (1-γ) × x[j] + γ × x[j+1]

Por Qué el Tipo 7 se Convirtió en el Estándar

Suave y continuo - sin saltos a diferencia de métodos discretos
Estimador insesgado - funciona bien en teoría estadística
Adoptado por R (1990s) → se convirtió en estándar académico
NumPy lo siguió → se convirtió en estándar de ciencia de datos

Perfecto Para

Proyectos de ciencia de datos y aprendizaje automático
Investigación científica y publicaciones
Trabajar en R, Python, o Julia
Máxima precisión y suavidad
Regresión por cuantiles

Considerar Alternativas Cuando

Colaborar con usuarios de Excel (usar Tipo 8)
Necesitas coincidencias exactas con libros de texto (usar Tipo 6)

Ejemplos de Código

# R (predeterminado)

data <- c(1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25)
Q1 <- quantile(data, 0.25)  # type = 7 es predeterminado
Q3 <- quantile(data, 0.75)
print(paste("Q1:", Q1))  # Salida: Q1: 6

# Python NumPy (predeterminado)

import numpy as np
data = [1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25]
Q1 = np.percentile(data, 25)  # método predeterminado = 'linear'
print(f"Q1: {'{'}Q1{'}'}")  # Q1: 6.0

5. Tipo 8: Excel QUARTILE.INC (Negocios)

Desarrollado para

Microsoft Excel (1990s)

Filosofía

Mediana-insesgada

Nota

QUARTILE.INC = Tipo 8

Perfecto Para

Análisis de negocios y reporte
Flujos de trabajo centrados en Excel
Compatibilidad con Google Sheets
Colaborar con equipos no técnicos
Entornos corporativos

Considerar Alternativas Cuando

Publicar investigación académica (usar Tipo 7)
Trabajar principalmente en código (los valores predeterminados de R/Python difieren)

Ejemplos de Código

' Excel

=QUARTILE.INC(A1:A13, 1)  ' Q1 (Tipo 8)
=QUARTILE.INC(A1:A13, 2)  ' Q2 (Mediana)
=QUARTILE.INC(A1:A13, 3)  ' Q3

Verifica tus resultados de Excel al instante

Abrir Calculadora de Cuartiles Excel →

6. Comparación Lado a Lado

Comparemos los cuatro métodos con un ejemplo concreto.

Puntuaciones Matemáticas SAT: [480, 510, 530, 560, 600, 620, 650, 680, 710, 750] (N = 10)

Métrica	Tipo 6 (Tukey)	Tipo 7 (R/Python)	Tipo 8 (Excel)
Q1	530	542.5	545
Mediana	610	610	610
Q3	680	677.5	675
IQR (RIC)	150	135	130

Observaciones

La mediana (Q2) suele ser consistente entre métodos
Q1 varía de 530 a 545 (diferencia de 15 puntos)
IQR varía de 130 a 150 (¡afectando detección de valores atípicos!)

7. Matriz de Decisión: ¿Qué Método Usar?

Elegir Tipo 7 (Predeterminado R/Python)

Escribiendo código de ciencia de datos
Publicando investigación científica
Usando R, Python, Julia, o herramientas modernas
Necesitas reproducibilidad entre plataformas
Trabajando con datos continuos

Casos de uso ejemplo: Pipelines de ML, artículos académicos, regresión por cuantiles

Elegir Tipo 8 (Excel)

Análisis de negocios y reporte
Colaborando con usuarios de Excel
Flujos de trabajo en entorno corporativo
Compatibilidad con Google Sheets
Partes interesadas no técnicas

Casos de uso ejemplo: Paneles de ventas, informes financieros, resúmenes ejecutivos

Elegir Tipo 6 (Bisagras de Tukey)

Enseñando estadística introductoria
Resolviendo problemas de libros de texto
Cálculos manuales
Creando diagramas de caja para audiencias generales

Casos de uso ejemplo: Estadística AP, Khan Academy, materiales de educación primaria

8. Ejemplos de Código para Todos los Métodos

Copia y pega estos fragmentos para calcular exactamente lo que necesitas.

Python (NumPy)

numpy >= 1.22

import numpy as np

data = [1, 2, 3, 4, 5, 6, 7, 8, 9]

# Tipo 7 (Predeterminado)
q_type7 = np.percentile(data, [25, 50, 75], method='linear')

# Tipo 6 (Tukey) - requiere lógica personalizada o bibliotecas específicas
# Tipo 8 (Excel)
q_type8 = np.percentile(data, [25, 50, 75], method='median_unbiased')

R Language

data <- c(1, 2, 3, 4, 5, 6, 7, 8, 9)

# Tipo 7 (Predeterminado)
quantile(data, probs = c(0.25, 0.5, 0.75), type = 7)

# Tipo 6 (Tukey)
quantile(data, probs = c(0.25, 0.5, 0.75), type = 6)

# Tipo 8 (Excel)
quantile(data, probs = c(0.25, 0.5, 0.75), type = 8)

9. Guía de Migración

De Excel a Python

Si estás moviendo un informe de Excel a Python y necesitas que los números coincidan exactamente:

# NO uses el predeterminado
np.percentile(data, 25, method="median_unbiased")