Estadistica Practica Para Ciencia De Datos Y Python High Quality -
table = [[184, 9816], [512, 9488]]
chi2, p, dof, expected = chi2_contingency(table)
print(f"Chi-square p-value: p:.10f") # 2.1e-14
The result: Conversion on mobile tripled. The overall site conversion rose from 2% to 6.4%.
En ciencia de datos, frecuentemente necesitamos validar suposiciones. Por ejemplo: "¿El nuevo diseño web realmente genera más ventas que el anterior?". Aquí entran las pruebas de hipótesis. table = [[184, 9816], [512, 9488]] chi2, p,
¿Tus datos siguen una distribución normal? La asimetría nos dice si la distribución está inclinada hacia la izquierda o derecha, y la curtosis nos indica qué "picuda" o plana es la distribución compareda con una normal.
Ejemplo en Python:
import pandas as pd
import numpy as np
from scipy.stats import skew, kurtosis
# Generamos datos sintéticos sesgados
data = pd.DataFrame('salario': np.random.exponential(scale=50000, size=1000))
print(f"Media: data['salario'].mean():.2f")
print(f"Mediana: data['salario'].median():.2f")
print(f"Asimetría: skew(data['salario']):.2f") # > 0 indica sesgo positivo (cola a la derecha)
print(f"Curtosis: kurtosis(data['salario']):.2f")
corr_k, p_k = stats.kendalltau(df['total_bill'], df['tip'])
Elara wrote a one-line Python script to fix it:
if user.device == "mobile" and js_error_count > 0:
show_offline_checkout_form() # bypass broken JS
She rolled out an A/B test. Control vs. Treatment. The statistical test was a chi-square on the 2x2 contingency table: The result: Conversion on mobile tripled
from scipy.stats import chi2_contingency
x = np.random.rand(1000) y = np.random.rand(1000) print(f"Correlación espuria: np.corrcoef(x, y)[0,1]:.3f") # Cercano a 0
Técnica avanzada: Usa Correlación Parcial para medir la relación entre dos variables eliminando el efecto de una tercera (ej: pingouin.partial_corr).
# pip install pingouin
import pingouin as pg
Antes de modelar, debemos sentir los datos. La estadística descriptiva resume la historia central de una variable. corr_k, p_k = stats