Saltar al contenido

Principiantes de la ciencia de los datos

Las funciones son poderosas, pero el código complejo puede ser desordenado, requiriendo mucho mantenimiento. En tales casos, podemos obtener ayuda de los paquetes Python.

Un paquete puede ser considerado un directorio de escrituras Python, donde cada escritura está contenida dentro de un módulo. Estos módulos especifican varias funciones y métodos. Python tiene varios paquetes poderosos, y algunos de los más comunes son:

Principiantes de la ciencia de los datos
Principiantes de la ciencia de los datos

1. NumPy – significa Pitón Numérico. Se utiliza para crear y tratar con matrices de n dimensiones y contiene funciones básicas de álgebra lineal, junto con muchas otras capacidades numéricas.

2. Matplotlib – para la visualización.

3. Pandas – para operaciones y manipulaciones de datos estructurados.

4. Scikit Learn – para el aprendizaje automático. Este es el paquete más popular para construir modelos de aprendizaje de máquinas.

5. Statsmodels – para el modelado estadístico.

6. NLTK – para el procesamiento del lenguaje natural.

7. SciPy – significa Pitón Científico, y está construido sobre NumPy.

Hay miles de otros paquetes, pero los enumerados arriba son los más utilizados para la ciencia de los datos. Es fácil importar estos paquetes usando el comando import . Por ejemplo, las líneas de código de abajo importan el paquete $0027numpy$0027 y crean un arreglo.

12345importar numpynumpy.array([20,21,22])

importar numpy como npnp.array([20,21,22])
pitón

Salida:

1 array([20, 21, 22])