Control 2

Web scraping y acceso a datos desde la web

Autor/a

Cristián Ayala

Fecha de publicación

13 de junio de 2024

Ponderación

20% de la nota final del curso

Formato

Desarrollar esta tarea con Quarto o Rmarkdown generando un .pdf, agregando comentarios cuando sea necesario.

Objetivo:

Interesa indagar sobre el cine chileno. Queremos saber la evolución del número de películas chilenas estrenadas por año y su calificación según la nota dada por IMDb.

Para ello usaremos el sitio web IMDb para filtrar películas chilenas realizadas en Chile. En total son 4651 según se muestra en esta búsqueda:

https://www.imdb.com/search/title/?title_type=feature&countries=cl&locations=chile

Tareas:

  1. Desde esa página web capturar los siguientes datos de esas 314 películas:

    • Título
    • Año de estreno
    • Puntaje IMDb
    • Géneros
  2. Guardar esa información en un data.frame

  3. Graficar la evolución del el número de películas (eje y) estrenadas por año (eje x).

  4. Graficar la evolución del el ranking IMDb promedio (eje y) estrenadas desde 1990 a la fecha (eje x).

  5. ¿Cuál es el género que tienen el mejor puntaje promedio considerando películas estrenadas desde 1990 a la fecha?

Notas

  1. Número de películas al momento de diseñar este control.↩︎