statistics
— Mathematical statistics functions
Added in version 3.4.
Código fuente: Lib/statistics.py
Este módulo proporciona funciones para calcular estadísticas matemáticas de datos numéricos (de tipo Real
).
Este módulo no pretende ser competidor o sustituto de bibliotecas de terceros como NumPy o SciPy, ni de paquetes completos de software propietario para estadistas profesionales como Minitab, SAS o Matlab. Este módulo se ubica a nivel de calculadoras científicas y gráficas.
A menos que se indique explícitamente lo contrario, las funciones de este módulo manejan objetos int
, float
, Decimal
y Fraction
.
No se garantiza un correcto funcionamiento con otros tipos (numéricos o
no). El comportamiento de estas funciones con colecciones mixtas que
contengan objetos de diferente tipo no está definido y depende de la
implementación. Si tus datos de entrada consisten en una mezcla de
varios tipos, puedes usar map()
para asegurarte de que el resultado sea consistente, por ejemplo: map(float, input_data)
.
Algunos conjuntos de datos utilizan valores NaN
(no es un número) para representar los datos que faltan. Dado que los
valores NaN tienen una semántica de comparación inusual, provocan
comportamientos sorprendentes o indefinidos en las funciones
estadísticas que ordenan los datos o que cuentan las ocurrencias. Las
funciones afectadas son median()
, median_low()
, median_high()
, median_grouped()
, mode()
, multimode()
, y quantiles()
. Los valores NaN
deben eliminarse antes de llamar a estas funciones:
>>from statistics import median
>>from math import isnan
>>from itertools import filterfalse
>>data = [20.7, float('NaN'),19.2, 18.3, float('NaN'), 14.4]
>>sorted(data) # This has surprising behavior
>>>[20.7, nan, 14.4, 18.3, 19.2, nan]
>>median(data) # This result is unexpected >>>16.35
>>sum(map(isnan, data)) # Number of missing values >>>2
>>clean = list(filterfalse(isnan, data)) # Strip NaN values
>>clean >>>[20.7, 19.2, 18.3, 14.4]
>>sorted(clean) # Sorting now works as expected >>>[14.4, 18.3, 19.2, 20.7]
>>median(clean) # This result is now well defined >>>18.75
Lectura del código por PPI:
- En primer lugar del modulo statistics se importa la función especifica para calcular la mediana
- Del modulo matemático se importa la función Isnan
- De un modulo llamado herramientas de iteracion se importa un filtro falso
- Se crea una lista con valores tipo float, la lista se llama "data"
- la mediana de la lista es 16.35
- Cantidad de valores perdidos: 2
- Con el filtro se eliminan de la lista los valores Nan
- Se recalcula la mediana luego de eliminar los valores Nan, la nueva mediana es: 18.75
Promedios y medidas de tendencia central
Estas funciones calculan el promedio o el valor típico de una población o muestra.
Media aritmética («promedio») de los datos. |
|
Fast, floating-point arithmetic mean, with optional weighting. |
|
Media geométrica de los datos. |
|
Media armónica de los datos. |
|
Estimate the probability density distribution of the data. |
|
Random sampling from the PDF generated by kde(). |
|
Mediana (valor central) de los datos. |
|
Mediana baja de los datos. |
|
Mediana alta de los datos. |
|
Median (50th percentile) of grouped data. |
|
Moda única (valor más común) de datos discretos o nominales. |
|
Lista de modas (valores más comunes) de datos discretos o nominales. |
|
Divide los datos en intervalos equiprobables. |
Medidas de dispersión
Estas funciones calculan una medida de cuánto tiende a desviarse la población o muestra de los valores típicos o promedios.
Desviación típica poblacional de los datos. |
|
Varianza poblacional de los datos. |
|
Desviación típica muestral de los datos. |
|
Varianza muestral de los datos. |
Estadísticas para relaciones entre dos entradasEstas funciones calculan estadísticas sobre las relaciones entre dos entradas.
Detalles de las funcionesNota: Las funciones no requieren que se ordenen los datos que se les proporcionan. Sin embargo, para facilitar la lectura, la mayoría de los ejemplos muestran secuencias ordenadas.
|
No hay comentarios.:
Publicar un comentario