Estos días dedique mi tiempo a repasar un poco sobre listas y loops/bucles en Python. La razón es porque estos temas los pase super rápido cuando estaba empezando a aprender data science, y son de gran importancia para crear algunos modelos de ML. Así que hice algunos repasos y unos ejercicios que quiero compartir con ustedes. No son la cosa más avanzada para nos ayuda a recordar conceptos y características de las listas y bucles. Así que cada vez que quieras repasar sobre este tema, puedes entrar a este blog y hacerlo. 

Primero: Te comparto el link donde puedes encontrar toda la info del dataset a trabajar, haciendo clic aquí

Y segundo toda esta info y ejercicios los encontré en el curso de python para datascients en dataquest.io 

Mi consejo: Intenta hacer por tu cuenta el ejercicio antes de ver el código 

Ahora si manos a la obra:

PRIMER EJERCICIO

El cuarto elemento de cada lista describe la cantidad de calificaciones que recibió una aplicación. Recupere este cuarto elemento de cada lista y luego encuentre el valor promedio de los números recuperados.

Te dejo la lista: 

row_1 = ['Facebook', 0.0, 'USD', 2974676, 3.5]
row_2 = ['Instagram', 0.0, 'USD', 2161558, 4.5]
row_3 = ['Clash of Clans', 0.0, 'USD', 2130805, 4.5]

Ahora desarrolla:

  • Asigne el cuarto elemento de la lista fila_1 a una variable llamada ratings_1. No olvide que la indexación comienza en 0.
  • Asigne el cuarto elemento de la lista row_2 a una variable llamada ratings_2 
  • Asigne el cuarto elemento de la lista row_3 a una variable llamada ratings_3.
  • Agregue los tres números recuperados juntos y guarde la suma en una variable llamada total.
  • Divida la suma (ahora guardada en el total variable) por 3 para obtener el número promedio de calificaciones para las primeras tres filas. Asigne el resultado a una variable llamada promedio.

RESULTADO:

ratings_1 = row_1[3]
ratings_2 = row_2[3]
ratings_3 = row_3[3]
total = ratings_1 + ratings_2 + ratings_3
average = total / 3

SEGUNDO EJERCICIO:

El último elemento en cada lista muestra la calificación promedio de cada aplicación. Recupera las calificaciones de las primeras tres filas y luego encuentra el valor promedio de todas las calificaciones recuperadas

La lista:

row_1 = ['Facebook', 0.0, 'USD', 2974676, 3.5]
row_2 = ['Instagram', 0.0, 'USD', 2161558, 4.5]
row_3 = ['Clash of Clans', 0.0, 'USD', 2130805, 4.5]
  • Asigne el último elemento de la lista fila_1 a una variable llamada rating_1. Intenta aprovechar la indexación negativa.
  • Asigne el último elemento de la lista row_2 a una variable llamada rating_2.
  • Asigne el último elemento de la lista row_3 a una variable llamada rating_3.
  • Agregue las tres clasificaciones juntas y guarde la suma en una variable llamada total_rating.
  • Divide el total entre 3 para obtener la calificación promedio. Asigne el resultado a una variable llamada average_rating

RESULTADO:

rating_1 = row_1[-1]
rating_2 = row_2[-1]
rating_3 = row_3[-1]
total_rating = rating_1 + rating_2 + rating_3
average_rating = total_rating / 3

TERCER EJERCICIO

Para Facebook, Instagram y Pandora — Música y radio, aísle los datos de calificación en listas separadas. Cada lista debe contener el nombre de la aplicación, el recuento de calificación y la calificación del usuario. No olvide que la indexación comienza en 0. 

row_1 = ['Facebook', 0.0, 'USD', 2974676, 3.5]
row_2 = ['Instagram', 0.0, 'USD', 2161558, 4.5]
row_3 = ['Clash of Clans', 0.0, 'USD', 2130805, 4.5]
row_4 = ['Temple Run', 0.0, 'USD', 1724546, 4.5]
row_5 = ['Pandora - Music & Radio', 0.0, 'USD', 1126879, 4.0]
  • Para Facebook, asigne la lista a una variable llamada fb_rating_data. 
  • Para Instagram, asigne la lista a una variable llamada insta_rating_data.
  • Para Pandora — Música y radio, asigne la lista a una variable llamada pandora_rating_data. 
  • Calcule la calificación promedio de Facebook, Instagram y Pandora — Música y radio utilizando los datos que almacenó en fb_rating_data, insta_rating_data y pandora_rating_data. 
  • Primero deberá sumar las calificaciones y luego dividir el total por la cantidad de calificaciones. 
  • Asigne el resultado a una variable llamada avg_rating.

RESULTADO

fb_rating_data = [row_1[0], row_1[3], row_1[-1]]
insta_rating_data = [row_2[0], row_2[3], row_2[4]]
pandora_rating_data = [row_5[0], row_5[3], row_5[4]]
avg_rating = (fb_rating_data[2] + insta_rating_data[2] + pandora_rating_data[2]) / 3

CUARTO EJERCICIO

row_1 = ['Facebook', 0.0, 'USD', 2974676, 3.5]
row_2 = ['Instagram', 0.0, 'USD', 2161558, 4.5]
row_3 = ['Clash of Clans', 0.0, 'USD', 2130805, 4.5]
row_4 = ['Temple Run', 0.0, 'USD', 1724546, 4.5]
row_5 = ['Pandora - Music & Radio', 0.0, 'USD', 1126879, 4.0]
  • Seleccione los primeros cuatro elementos de la fila_1 utilizando un atajo de sintaxis de corte de lista. Asigne la salida a una variable llamada first_4_fb.
  • Seleccione los últimos tres elementos de la fila_1 utilizando un acceso directo de sintaxis de corte de lista. Asigne la salida a una variable llamada last_3_fb.
  • Desde row_5, seleccione el segmento de lista [‘USD’, 1126879] utilizando un acceso directo de sintaxis de corte de lista. Asigne la salida a una variable llamada pandora_3_4

RESULTADO:

first_4_fb = row_1[:4]
last_3_fb = row_1[-3:]
pandora_3_4 = row_5[2:4]

QUINTO EJERCICIO

Ya estado almacenado las cinco filas como listas en variables separadas. 

row_1 = ['Facebook', 0.0, 'USD', 2974676, 3.5]
row_2 = ['Instagram', 0.0, 'USD', 2161558, 4.5]
row_3 = ['Clash of Clans', 0.0, 'USD', 2130805, 4.5]
row_4 = ['Temple Run', 0.0, 'USD', 1724546, 4.5]
row_5 = ['Pandora - Music & Radio', 0.0, 'USD', 1126879, 4.0]
app_data_set = [row_1, row_2, row_3, row_4, row_5]
app_data_set
  • Agrupe las cinco listas en una lista de listas. Asigne la lista de listas resultante a una variable llamada app_data_set.
  • Calcule la calificación promedio de las aplicaciones recuperando los puntos de datos correctos de la lista de listas app_data_set.
  • La calificación es el último elemento de cada fila. Deberá resumir las calificaciones y luego dividirlas por el número de calificaciones.
    Asigne el resultado a una variable llamada avg_rating

RESULTADO:

avg_rating = (app_data_set[0][-1] + app_data_set[1][-1] +
app_data_set[2][-1] + app_data_set[3][-1] +
app_data_set[4][-1]) / 5

SEXTO EJERCICIO

Abra el archivo AppleStore.csv y guárdelo como una lista de listas. 

  • Abra el archivo con el comando open (). Guarde el resultado en una variable denominada archivo_apertura 
  • Lea el archivo abierto con el comando reader () (recuerda importarlo:reader () del módulo csv). 
  • Guarde la salida en una variable llamada read_file. 
  • Transforme el archivo de lectura en una lista de listas con el comando list (). 
  • Guarde la lista de listas en una variable llamada apps_data. 
  • Explore el dataset : Imprima su longitud usando el comando len () Imprima la primera fila (la fila que describe los nombres de columna) Imprima la segunda y la tercera fila (intente usar el corte de lista aquí)

RESULTADO: 

from csv import reader
opened_file = open("AppleStore.csv")
read_file = reader(opened_file)
apps_data = list(read_file)
len(apps_data)
print(apps_data[0])
print(apps_data[1:4])

SÉPTIMO EJERCICIO

Calcule la calificación promedio de las aplicaciones almacenadas en la variable app_data_set. 

row_1 = ['Facebook', 0.0, 'USD', 2974676, 3.5]
row_2 = ['Instagram', 0.0, 'USD', 2161558, 4.5]
row_3 = ['Clash of Clans', 0.0, 'USD', 2130805, 4.5]
row_4 = ['Temple Run', 0.0, 'USD', 1724546, 4.5]
row_5 = ['Pandora - Music & Radio', 0.0, 'USD', 1126879, 4.0]
  • Inicialice una variable llamada rating_sum con un valor de cero fuera del cuerpo del bucle. 
  • Recorra (itere) sobre la lista de listas app_data_set. Para cada una de las cinco iteraciones del bucle (para cada fila en app_data_set): 
  • Extraiga la calificación de la aplicación y almacénela en una variable denominada calificación. La calificación es el último elemento de cada fila.
  • Agregue el valor almacenado en la calificación al valor actual de rating_sum. 
  • Fuera del cuerpo del bucle, divida la suma de la calificación (almacenada en rating_sum) por el número de calificaciones para obtener un valor promedio. Almacene el resultado en una variable llamada avg_rating.

RESULTADO

app_data_set = [row_1, row_2, row_3, row_4, row_5]
rating_sum = 0
for row in app_data_set:
rating = row[-1]
rating_sum = rating_sum + rating
print(rating_sum)

avg_rating = rating_sum / len(app_data_set)

OCTAVO EJERCICIO

Calcule la calificación promedio de las aplicaciones para todas las 7,197 aplicaciones almacenadas en el conjunto de datos.

  • Inicialice una variable llamada rating_sum con un valor de cero.
    Recorra la lista de listas apps_data [1:] (asegúrese de no incluir la fila del encabezado). Para cada una d las 7,197 iteraciones del bucle (para cada fila en apps_data [1:]):
  • Extraiga la calificación de la aplicación y almacénela en una variable denominada calificación (la calificación tiene el número de índice 7). Asegúrese de convertir el valor de calificación de una cadena a un flotante utilizando el comando float ().
  • Agregue el valor almacenado en la calificación al valor actual de rating_sum.
  • Divida la suma de calificación (almacenada en rating_sum) por el número de calificaciones para obtener un valor promedio. Almacene el resultado en una variable llamada avg_rating.

RESULTADO

opened_file = open('AppleStore.csv')
from csv import reader
read_file = reader(opened_file)
apps_data = list(read_file)
print(len(apps_data))
print(apps_data[:5])
rating_sum = 0
for row in apps_data[1:]:
rating = float(row[7])
rating_sum = rating_sum + rating

avg_rating = rating_sum / len(apps_data[1:])

NOVENO EJERCICIO

Usando append(), calcule la calificación promedio de la aplicación para todas las 7,197 aplicaciones almacenadas en nuestro conjunto de datos.

  • Inicialice una lista vacía llamada all_ratings.
  • Recorra la lista de listas apps_data [1:] (asegúrese de no incluir la fila del encabezado). Para cada una de las 7,197 iteraciones del bucle: 
  • Extraiga la calificación de la aplicación y almacénela en una variable denominada calificación (la calificación tiene el número de índice 7).
  • Asegúrese de convertir el valor de calificación de una cadena a un flotante.
  • Agregue el valor almacenado en la calificación a la lista all_ratings.
  • Calcule la suma de todas las clasificaciones con el comando sum (). Divida la suma de todas las calificaciones entre el número de calificaciones y asigne el resultado a una variable llamada avg_rating

RESULTADO

opened_file = open('AppleStore.csv')
from csv import reader
read_file = reader(opened_file)
apps_data = list(read_file)
all_ratings = []
for row in apps_data[1:]:
rating = float(row[7])
all_ratings.append(rating)

avg_rating = sum(all_ratings) / len(all_ratings)
avg_rating

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *