Mozilla Bug Reports — Quality Analysis Pipeline de 17 pasos · 5 datasets curados · EDA descriptivo

Resumen del proyecto

Análisis de calidad de bug reports de Mozilla Bugzilla. El objetivo es predecir el puntaje CTQRS (13–17) de un reporte usando features del texto y metadatos del bug.

Cargando…

Pipeline de procesamiento — 17 pasos

Desde los archivos originales CSV/Excel hasta los datasets curados listos para modelado.

Visualizaciones por dataset

25 gráficos descriptivos generados por visualizaciones/visualizaciones.py. Filtrá por dataset y tipo de gráfico, click en cualquier imagen para ampliar.

Análisis de Outliers — IQR Tukey

Fences 1.5x (leves) y 3x (extremos) sobre todas las columnas numéricas de los 4 datasets. Conclusión: todos los outliers son REALES — distribución ley de potencias en actividad y conteos.

Porcentaje de outliers por columna
Barras agrupadas: leves (1.5x IQR) vs. extremos (3x IQR). Generación interactiva equivalente al PNG de resumen.

Imágenes estáticas del análisis


Acciones recomendadas

Framing supervisado

Análisis de las 7 preguntas de modelado con evidencia estadística concreta (Paso 16 del pipeline).

Distribución de Total Score (variable objetivo)
Score 13–17 · Clasificación multiclase ordinal · Dataset desbalanceado. El score en amarillo es la clase dominante.
Correlación de Pearson — variables numéricas
IDs excluidos. Rojo = correlación negativa, azul = positiva. Hallazgo clave: Comment Count correlaciona negativamente con Total Score (r ≈ −0.13).

7 preguntas de framing supervisado

Hipótesis del documento académico

EDA descriptivo de 3 hipótesis formales con cadenas causales (Paso 17). Los veredictos se computan dinámicamente desde los datos curados.

H1 Influencia del Colaborador y Calidad del Reporte
Cadena: Bugs Filed → Total Score → Comment Count

Los colaboradores con mayor experiencia (más bugs reportados) producen reportes de mayor calidad CTQRS, lo que reduce la ambigüedad y el debate posterior (Comment Count bajo).

Score CTQRS medio por cuartil de experiencia (Bugs Filed)
Gradiente positivo Q1→Q4 confirmaría H1.A.
H1 PNG estático
Imagen estática — hipotesis_iniciales.py
H1.B — Total Score → Comment Count medio
Mayor score (mejor reporte) debería corresponder a menos comentarios (H1.B).
H1.C — Top 10% vs Bottom 10% de experiencia
Comparativa de score y Comment Count entre autores extremos.
H2 Paradoja de Severidad y Priorización
Cadena: Severity alta → Score bajo → Priority dispersa → días de resolución altos

Los bugs de alta severidad (blocker/critical) tienen reportes de menor calidad CTQRS, lo que provoca prioridades desalineadas y retrasos en la resolución.

Score CTQRS medio por nivel de severidad
Si blocker/S1 tiene el score más bajo, la paradoja se confirma (H2.A).
H2 PNG estático
Imagen estática — hipotesis_iniciales.py
H2.B — Crosstab Severity × Priority (bugs de alta severidad)
% de bugs de cada severidad que reciben cada nivel de prioridad.
H2.C — Mediana de días de resolución por Severity × Score bin
Bugs con baja calidad (score bajo) y baja severidad deberían tardar más en resolverse.
H3 Complejidad de Interacción y Bloqueos
Cadena: n_dependencias → Comment Count alto → CTQRS predice Priority mejor que Severity

Los bugs con más dependencias (Blocks, Depends On, Duplicates, Regressions) generan más debate técnico. Un CTQRS elevado predice mejor la prioridad final que la severidad sola.

Comment Count medio por cuartil de dependencias totales
Gradiente positivo Q1→Q4 confirmaría H3.B.
H3 PNG estático
Imagen estática — hipotesis_iniciales.py
H3.A — Distribución de dependencias por tipo
% de bugs con al menos una dependencia de cada tipo.
H3.D — Perfiles de bugs con Priority P1
Perfil B (baja severidad + bloqueos) ≥ 5% de P1 indica que bloqueos influyen en priorización.