domingo, 21 de diciembre de 2025

Módulos, bibliotecas y paquetes en Python para ciencia de datos

 

Comprender las bibliotecas, paquetes y módulos de Python

Fuente: Coursera & Google

Conceptos clave

Módulo: Los módulos son grupos de clases y funciones relacionadas que normalmente son subcomponentes de bibliotecas, lo que permite la importación selectiva.

Biblioteca: una biblioteca es una colección de módulos de código reutilizables y su documentación, a menudo incluidos en paquetes para su instalación y uso.

Alias: El alias le permite asignar un nombre más corto a una biblioteca para facilitar el acceso, utilizando la palabra clave 'as' en la declaración de importación.

Declaración de importación: una declaración de importación se utiliza para incorporar bibliotecas o módulos al entorno de trabajo, lo que requiere una sintaxis específica con la palabra clave "import".

Paquete: un paquete es un conjunto de bibliotecas que se pueden instalar e importar a un entorno de codificación y que a menudo se usa indistintamente con el término "biblioteca".

Módulos integrados: los módulos integrados como 'math', 'datetime' y 'random' se incluyen en la biblioteca estándar de Python y se pueden importar sin instalación adicional.

Recientemente, has aprendido sobre las bibliotecas, paquetes y módulos de Python. COMO has descubierto, importar estas herramientas ahorra tiempo a los profesionales de los datos y mejora su programación. Otro beneficio de las bibliotecas de uso común es que son constantemente examinadas y actualizadas por programadores talentosos y conocedores. Así, puede estar seguro de que el código subyacente es de alta calidad.

En esta lectura, aprenderá más sobre las características básicas de las bibliotecas, paquetes y módulos; cómo están relacionados; y una selección de módulos básicos que podría utilizar como profesional de datos.

Bibliotecas, paquetes y módulos

Una biblioteca es un conjunto de módulos de código reutilizables y la documentación que los acompaña. Las bibliotecas se agrupan en paquetes que se instalan y que pueden importarse al entorno de codificación según sea necesario. Los términos "biblioteca" y "paquete" suelen utilizarse indistintamente. Por lo general, este programa de certificación se referirá a ambos como bibliotecas, pero es importante familiarizarse con ambos términos.

Los módulos son similares a las bibliotecas, en el sentido de que son grupos de clases y funciones relacionadas, pero generalmente son subcomponentes de las bibliotecas. En otras palabras, una biblioteca puede tener muchos módulos diferentes, y puedes elegir importar toda la biblioteca o sólo el módulo que necesites.

Declaraciones de importación

Las bibliotecas y módulos que van más allá de la biblioteca estándar de Python normalmente deben importarse a tu entorno de trabajo en función de las necesidades. Las bibliotecas adicionales se instalan primero y luego se importan a su entorno de trabajo según sea necesario.

Para importar una biblioteca o módulo, utilice una sentencia import. Las sentencias import requieren una sintaxis particular utilizando la palabra clave import. He aquí algunos ejemplos:

Nota: El siguiente bloque de código no es interactivo.

>>import numpy

Esta sentencia import importa la librería NumPy a su entorno de trabajo. Después de ejecutar este comando, tendrás acceso a todas las clases y funciones de NumPy. Por ejemplo, para utilizar la función array() en [2, 4, 6], escribirías:

Nota: El siguiente bloque de código no es interactivo.

>>numpy.array([246])

Observa que para acceder a la función array(), debes precederla con numpy, porque esto indica que la función proviene de la librería NumPy.

Aliasing

Otro ahorro de tiempo con las bibliotecas de Python es el aliasing. El aliasing te ayuda a evitar teclear el nombre completo de una librería cada vez que quieras acceder a una de sus funciones. En su lugar, asignarás a la biblioteca un alias. Un alias es un nombre abreviado, que se designa utilizando la palabra clave as:

Nota: El siguiente bloque de código no es interactivo.

>>import numpy as np

>> # Entonces la instrucción del bloque anterior quedaría así

>> np.array([2,4,6])

En este caso, la biblioteca NumPy se importa con el alias np. Puede asignar cualquier abreviatura que desee como alias, pero las bibliotecas de uso común tienen alias comunes. Por lo tanto, desviarse de ellos podría causar confusión al compartir código con otros. He aquí algunas bibliotecas comunes y sus alias convencionales utilizadas por los profesionales de los datos:

Nota: El siguiente bloque de código no es interactivo.


>>import numpy as np
>>import pandas as pd
>>import seaborn as sns
>>import matplotlib.pyplot as plt

NumPy se utiliza para cálculos vectoriales y matriciales de alto rendimiento.
Pandas es una biblioteca para manipular y analizar datos tabulares.
Seaborn y Matplotlib son bibliotecas utilizadas para crear gráficos, diagramas y otras
visualizaciones de datos.

Después de ejecutar estas importaciones, siempre que desee utilizar una función de una de estas bibliotecas, preceda la función con el alias. Volviendo al ejemplo con la función array() de NumPy, después de poner el alias, escribirías:

Nota: El siguiente bloque de código no es interactivo.

>>np.array([246])

Sintaxis de importación adicional

Importar módulos

Recordemos el ejemplo anterior:

Nota: El siguiente bloque de código no es interactivo.

>>import matplotlib.pyplot as plt

Habrás notado que esta sintaxis difiere ligeramente de la de los otros ejemplos. En este caso, matplotlib es la biblioteca y pyplot es un módulo dentro de ella. El módulo pyplot es aliased como plt, y se accede a él desde la librería matplotlib usando el punto.

Importar funciones

Al igual que puedes importar librerías y módulos, también puedes importar funciones individuales desde librerías o desde módulos dentro de librerías usando una sintaxis específica. A continuación se muestra un ejemplo de una importación común cuando se utiliza la biblioteca Scikit-learn para construir modelos de aprendizaje automático:

Nota: El siguiente bloque de código no es interactivo.

>>from sklearn.metrics import precision_score, recall_score

De nuevo, observe la sintaxis diferente. La declaración de importación comienza con la palabra clave FROM, seguida de sklearn.metrics-la biblioteca scikit-learn + el módulo metrics. A continuación aparece la palabra clave import seguida de las funciones deseadas. En este caso, hay dos: precision_score y recall_score.

La misma sintaxis puede aplicarse al ejemplo utilizando la función array() de NumPy. Sin embargo, tenga en cuenta que normalmente no encontrará funciones individuales importadas de NumPy. Es mucho más fácil y común importar la librería completa.

Nota: El siguiente bloque de código no es interactivo.

>>from numpy import array

Cuando una función es importada por su nombre, como en este ejemplo, puedes usarla sin ninguna sintaxis precedente para indicar la librería o módulo del que proviene:

Nota: El siguiente bloque de código no es interactivo.

>>array([2,4,6])

Sintaxis desaconsejada

Una última variación sintáctica que puedes encontrar es:

Nota: El siguiente bloque de código no es interactivo.

>>from library.module import *

Esto importa todo de una biblioteca o módulo en particular y te permite usar sus funciones sin ninguna sintaxis precedente. Así, por ejemplo, si escribes from numpy import *, serás capaz de usar todas las funciones de NumPy sin precederlas con numpy o np. Esta aproximación no es recomendable porque hace difícil rastrear de dónde vienen las funciones. Sin embargo, es útil ser consciente de esto porque es probable que lo encuentres en tu trabajo como profesional de datos. Y, en casos concretos, puede ser útil.

Módulos incorporados de uso común

La biblioteca estándar de Python incluye una serie de módulos integrados relevantes para el trabajo como profesional de los datos, como math, datetime y random. Se pueden importar sin instalación adicional. En otras palabras, puedes importarlos directamente, siempre y cuando tengas Python instalado. Por ejemplo

datetime

  • Proporciona muchas conversiones y cálculos útiles de fecha y hora

Por ejemplo:

>>import datetime  
>>date = datetime.date(197758)       # assign a date to a variable
>>print(date)                            # print date
>>print(date.year)                       # print the year that the date is in

>>delta = datetime.timedelta(days=30)    # assign a timedelta of 30 days to a 
                                       # variable
>>print(date - delta)                    # print date of 30 days prior 

>>>
1977-05-08 1977 1977-04-08

  • Proporciona acceso a funciones matemáticas

Ejemplo: random

>>import math  
>>print(math.exp(0))          # e**0
>>print(math.log(1))          # ln(1)
>>print(math.factorial(4))    # 4! 
>>print(math.sqrt(100))       # square root of 100
>>>
1.0 0.0 24 10.0


random

  • Útil para generar números pseudoaleatorios (consulte la documentación para obtener una explicación de la generación de números pseudoaleatorios)

Ejemplo: random

>>import random
>>print(random.random())          # 0.0 <= X < 1.0
>>print(random.choice([123])) # choose a random element from a sequence
>>print(random.randint(110))    # a <= X <= b
>>>
0.202198646221747 2 8


Puntos clave

Las bibliotecas, paquetes y módulos son puertas de acceso a las innumerables capacidades de Python. Si sabes cómo aprovecharlas para tus propias necesidades de programación, descubrirás nuevas herramientas y funciones que harán tu trabajo mucho más eficiente. Consulta el índice de paquetes de Python en el repositorio PyPI para buscar bibliotecas útiles. Hay paquetes diseñados para aplicaciones tan diversas como la química, la edición de audio, el procesamiento de lenguaje natural y los videojuegos. Sea lo que sea lo que estés intentando hacer, ¡es muy probable que alguien haya desarrollado un paquete de herramientas para ayudarte!


No hay comentarios.:

Publicar un comentario

Entradas recientes

Nuevas versiones y funciones en Python para ciencia de datos

Nuevas versiones y funciones de Python Fuente: Coursera & Google Gestión de versiones : la práctica de comprobar y gestionar las versio...

Entradas Populares