domingo, 14 de diciembre de 2025

Rebanado de cadenas de texto (strings). Python para ciencia de datos

División: La división permite el acceso a una variedad de elementos de una secuencia, utilizando dos índices separados por dos puntos, siendo el índice inicial inclusivo y el índice final exclusivo.

Indexación de base cero: en Python, el primer elemento de cualquier secuencia tiene un índice de cero, lo cual es una práctica común en muchos lenguajes de programación.

IndexError: se produce un IndexError al intentar acceder a un índice que está fuera del rango de la secuencia.

Indexación negativa: la indexación negativa permite el acceso a elementos desde el final de una secuencia, contando hacia atrás.

Indexación: la indexación se refiere al acceso a un único elemento de una secuencia por su posición, utilizando la indexación de base cero en Python.

Como sabes, las cadenas son una clase importante de datos porque representan texto. Los profesionales de los datos se encuentran con cadenas todo el tiempo, por lo que es importante familiarizarse con las diferentes formas de manipularlas y trabajar con ellas. Esta lectura repasará la mecánica de la indexación y el corte de cadenas, dos formas básicas pero potentes de manipular cadenas.

Indexación de cadenas

La indexación se refiere al acceso a un único elemento de una secuencia por su posición. En Python, el primer elemento de cualquier secuencia tiene un índice de cero. Esto significa que Python utiliza indexación basada en cero. Muchos otros lenguajes de programación también utilizan la indexación basada en cero, pero no todos lo hacen. Algunos lenguajes usan indexación basada en uno, como R, Julia y SAS.

Utilice corchetes para realizar la indexación. He aquí algunos ejemplos:

>>my_string = 'Mississippi half-step'

>>print(my_string[0])

>>my_list = [1'unladen''swallow']
>>print(my_list[1])

>>print(my_list[-1])

Saida obtenida:

M unladen swallow

En estos ejemplos, hay dos variables de secuencia: una cadena y una lista. La indexación se utiliza para acceder al carácter en el índice cero de la cadena, que es su primer carácter-M. La lista se selecciona en el índice uno, que contiene la palabra "unladen" La lista también se selecciona en su posición final utilizando la indexación negativa.

Nota: Si intenta seleccionar un índice que está fuera del rango de lo que contiene el objeto, obtendrá un IndexError.

>>my_list = [1'unladen''swallow']

>>my_list[3]

Error on line 2: my_list[3] IndexError: list index out of range

Rebanado

Se refiere al acceso a un rango de elementos de una secuencia. Utilice corchetes que contengan dos índices separados por dos puntos.

He aquí algunos ejemplos:

new_string = 'pining for the fjords'

print(new_string[0:3])
print(new_string[:3])

Salida obtenida:
pin pin

Estos dos ejemplos, cada uno con una sintaxis ligeramente diferente, se están utilizando para producir el mismo resultado. Observe dos cosas: (1) la rebanada resultante incluye el índice inicial y excluye el índice final; (2) cuando se omite el índice inicial está implícito que es cero, como se muestra en la segunda línea de impresión.

El proceso sigue la misma lógica cuando se omite el índice final:

>>new_string = 'pining for the fjords'
>>print(new_string[6:21])
>>print(new_string[6:])
>>print(len(new_string))

Salida obtenida:
for the fjords for the fjords 21

De nuevo, hay dos sentencias que son sintácticamente diferentes pero que producen la misma subcadena. Cuando se omite el índice final, su valor implícito es la longitud de la secuencia.

Por último, el código arrojará un error IndexError si se intenta indexar una secuencia en un número de índice fuera del ámbito de los elementos; éste no es el caso del troceado.

Por ejemplo:

>>new_string = 'pining for the fjords'

>>print(new_string[6:100])

Salida obtenida: for the fjords

Aunque el índice final era 100-mucho más allá del alcance de los índices en la cadena-la computadora devolvió una subcadena que terminaba con el elemento final de la cadena.

Puntos clave

La indexación y el corte son herramientas poderosas en Python que te permiten acceder a elementos específicos o partes de una secuencia. Tanto la indexación como el corte utilizan corchetes. Recuerda que en un corte el índice inicial es inclusivo y el índice final es exclusivo, y que los índices negativos cuentan desde el final de la secuencia. Con estas herramientas, puede manipular cadenas y otras secuencias iterables para realizar una amplia variedad de operaciones, lo que le convertirá en un profesional de los datos más competente.


No hay comentarios.:

Publicar un comentario

Entradas recientes

Python para ciencia de datos. Pandas y EDA

  Guía de referencia: Métodos Pandas para el descubrimiento de un conjunto de datos. Fuente: Coursera & Google Guía de referencia de Pyt...

Entradas Populares