Saltar al contenido

Trabajando con los tipos de datos en R

Vectores

Un vector es la estructura de datos más común en R. Es una secuencia de elementos del mismo tipo de datos. La función vector() puede utilizarse para crear un vector. El modo por defecto es lógico, pero podemos utilizar constructores como character(), numeric(), etc., para crear un vector de un tipo específico.

Las líneas de código de abajo construyen un vector numérico y uno lógico, respectivamente. Un vector también puede contener cadenas, como lo indica el vector «s».

Trabajando con los tipos de datos en R
Trabajando con los tipos de datos en R
1234567n <- c(1,2,5.3,6,-2,4) l <- c(VERDADERO,VERDADERO,VERDADERO,FALSO,VERDADERO,FALSO) s = c("USA", "UK", "AFRICA", "INDIA", "CHINA") class(n)class(l)class(s)

{r}

Salida:

12345[1] "numérico"[1] "lista"[1] "carácter"

También es posible realizar varias operaciones sobre los vectores, como la combinación de vectores y la matemática de vectores. Por ejemplo, la primera línea de código que figura a continuación combina los vectores «n» y «l», mientras que la segunda línea imprime los elementos del nuevo vector. Se puede comprobar la longitud del vector resultante utilizando la función length , como se muestra en el tercer comando . La cuarta línea comprueba el tipo de datos, y el vector resultante es de tipo «carácter». Esto se denomina coacción de valor en las combinaciones de vectores.

12345comb = c(n, s)comblength(comb)class(comb

{r}

Salida:

12345678[1] "1" "2" "5.3" "6" "-2" "4" "USA" "UK" [9] "AFRICA" "INDIA" "CHINA"[1] 11[1] "character"

También es posible realizar operaciones matemáticas sobre los vectores, como en las líneas de código que figuran a continuación.

12345678x = c(5, 3, 4) y = c(1, 2, 3)#Operaciones aritméticas5 * xx-yx+yx/y

{r}

Salida:

1234567[1] 25 15 20[1] 4 1 1[1] 6 5 7[1] 5.000000 1.500000 1.333333

Matrices

En R, las matrices son una extensión de los vectores numéricos o de caracteres. Todas las columnas de una matriz deben tener el mismo modo y la misma longitud. Además, al igual que los vectores atómicos, los elementos de una matriz deben ser del mismo tipo de datos. La representación general de una matriz se muestra en la línea de código que figura a continuación.

Los argumentos nrow y ncol denotan el número de filas y columnas, respectivamente. El argumento byrow = TRUE indica que la matriz debe ser llenada por las filas.

12m = matriz(c(20, 45, 33, 19, 52, 37), nrow=2, ncol=3, byrow = VERDADERO) print(m)

{r}

Salida:

123 [,1] [,2] [,3][1,] 20 45 33[2,] 19 52 37

Es posible identificar las filas, columnas o elementos de una matriz utilizando subíndices. Por ejemplo, se puede acceder al elemento de la segunda fila y la segunda columna utilizando el siguiente comando.

1m[2, 2]

{r}

Salida:

1[1] 52

Listas

Una lista es un vector genérico que contiene una colección de objetos (o componentes). La ventaja de una lista es que permite almacenar una variedad de objetos que pueden no estar relacionados bajo un mismo nombre.

Las líneas de código que figuran a continuación crean una lista que contiene tres vectores: nombre, lugar y edad en años.

123456nombre = c("abhi", "ansh", "ajay") lugar = c("delhi", "mumbai", "pune") edad = c(VERDADERO, FALSO, VERDADERO, FALSO, FALSO) l = lista(nombre, lugar, edad) print(l)

{r}

Salida:

12345678[[1]][1] "abhi" "ansh" "ajay"[[2]][1] "delhi" "mumbai" "pune" [[3]][1] VERDADERO FALSO VERDADERO FALSO FALSO

También es posible cortar una lista utilizando el operador de «corchetes».

123l[2] l[c(2, 3)]

{r}

Salida:

12345[[1]][1] "delhi" "mumbai" "pune" [[2]][1] VERDADERO FALSO VERDADERO FALSO FALSO

Marco de datos

El marco de datos es quizás el tipo de datos más importante de R. Es de hecho la estructura de datos de facto para la mayoría de los datos tabulares y se utiliza ampliamente en la ciencia de los datos. En términos simples, es un tipo especial de lista donde todos los elementos son de igual longitud.

Los marcos de datos se importan a menudo en R utilizando las funciones read.csv() y read.table() . También se puede crear un nuevo marco de datos con la función data.frame() , como en la siguiente línea de código.

12df <- data.frame(rollnum = seq(1:10), h1 = 15:24, h2 = 81:90)df

{r}

Salida:

123456789101112| rollnum | h1 | h2 ||--------- | |---- |----- || 1, 15, 81, 2, 16, 82, 3, 17, 83, 4, 18, 84, 5, 19, 85, 6, 20, 86, 7, 21, 87, 8, 22, 88, 9, 23, 89, 10, 24, 90.