Los datos pueden decirte mucho si haces las preguntas correctas.
Para entender los datos, los científicos de datos pasan la mayor parte de su tiempo reuniendo conjuntos de datos y preprocesándolos. Otras tareas son comparativamente fáciles.
En esta guía, utilizaremos la base de datos del MNIST, una colección de 70.000 dígitos escritos a mano divididos en 60.000 imágenes de entrenamiento y 10.000 imágenes de prueba. Utilizaremos Pytorch ya que proporciona los datos limpios y preparados listos para su implementación con un mínimo de líneas de código.
Así que empecemos por hacer las siguientes importaciones.
1234567import numpy as npimport torchimport torchvisionimport matplotlib.pyplot as pltfrom time import timefrom torchvision import datasets, transformsfrom torch import nn, optim
pitón
Tenemos un problema común aquí en que estas muestras no son del mismo tamaño. Las redes neuronales requerirán que las imágenes sean de un tamaño fijo. Por lo tanto, tenemos que definir las transformaciones de nuestros datos antes de alimentarlos en la tubería.
Lo hacemos usando la biblioteca de Torchvision en forma de antorcha. Nos ayudará a transformarnos (usando torchvision.transform) y a cargar nuestro conjunto de datos (usando torchvision.dataset).
123transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,),(0.5,))),])
pitón
Transforma. Compone: Esto golpea todas las transformaciones que se le proporcionan. La composición se aplica a las entradas una por una.
Transforma.ToTensor(): Esto convierte las imágenes en números para que nuestro sistema pueda entender. Luego escala la imagen PIL (RGB) o numpy.ndarray (H x W x C) en el rango de 0,255 usando una antorcha. Las imágenes se convierten ahora a Tensor de la antorcha .
transforma.Normalizar(): Estos valores son la media estimada y la desviación estándar.