-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathlab04.Rmd
106 lines (88 loc) · 3.38 KB
/
lab04.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
---
title: "Manipulação de Banco de dados - Laboratório 03"
author: "Ana Carolina"
date: "28 de agosto de 2019"
output: html_document
---
# Importação de Dados Retangulares - Excel.
O conjunto de dados em questão é o conjunto de índices de desenvolvimento mundial, disponibilizado pelo Banco Mundial através do link http://datatopics.worldbank.org/world-development-indicators/
(http://datatopics.worldbank.org/world-development-indicators/).
# Objetivos
Ao fim deste laboratório, você deverá ser capaz de:
- Importar dados de planilhas específicas de arquivos em formato Excel;
- Trabalhar com variáveis cujos nomes fogem do padrão usual de programação (por exemplo, variáveis
com espaços brancos em seus nomes);
- Selecionar variáveis do interesse;
- Verificar se os dados estão no formato tidy e transformá-los para tal formato;
- Optar apropriadamente entre filtering joins e mutating joins;
- Produzir visualizações de dados de séries temporais;
```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE)
```
```{r}
library(dplyr)
```
## Q1: Carregue os pacotes readxl e tidyverse.
```{r}
library(tidyverse)
library(readxl)
```
## Q2: Crie uma variável chamada fname que contenha o caminho para o arquivo WDIEXCEL.xlsx, disponível no seu diretório de dados. Confirme que o R identifica a existência do arquivo utilizando o comando file.exists
```{r}
fname = file.path("C:/Users/ra212644/Downloads")
file.exists(fname)
```
## Q3: Leia a planilha “Country” e armazene no objeto countries.
```{r}
countries = read_excel("WDIEXCEL.xlsx", sheet="Country")
```
## Q4: Mantenha apenas os registros de 5 países (Brasil e outros 4 de sua escolha)
```{r}
countries = countries %>%
filter(`Country Code` %in% c("USA", "ARG", "AUS", "JPN", "BRA"))
```
## Q5: Leia a planilha “Data” e armazene no objeto WDI.
```{r}
WDI = read_excel("WDIEXCEL.xlsx", sheet="Data")
WDI %>% head
```
## Q6: Selecione apenas as colunas:
- Country Code
- Indicator Code
- E todos os anos de 1960-2018
```{r}
WDI = WDI %>% select(`Country Code`, `Indicator Code`, `1960`:`2018`)
```
## Q7: Confirme se os dados wm WDI estão em formato tidy. Se não estiverem, transforme-os para tal formato. Faça de forma que exista uma coluna referente ao ano chamada YEAR.
```{r}
# colunas sendo variáveis
WDI = WDI %>%
gather("YEAR", "VALUE",`1960`:`2018`) %>%
spread(`Indicator Code`, VALUE)
WDI$YEAR = as.integer(WDI$YEAR)
```
## Q8: Confirme se a coluna referente ao ano está em formato inteiro.
```{r}
WDI$YEAR = as.integer(WDI$YEAR)
```
## Q9: Para o objeto WDI, mantenha apenas os registros dos países listados em countries. Selecione as colunas:
- Country Code
- Short Name
- YEAR
- SP.DYN.CBRT.IN
```{r}
WDI = WDI %>%
semi_join(countries, by = "Country Code") %>%
select(c(`Country Code`, `Short Name`, `YEAR`, `SP.DYN.CBRT.IN`))
```
## Q10: Ordene o objeto de forma que, para cada país, as informações estejam ordenadas por ano.
```{r}
# WDI = WDI %>% group_by(`Country Code`) %>% arrange(YEAR)
WDI = WDI %>%
arrange(`Country Code`, YEAR)
```
## Q11: Q11. Construa um gráfico de linhas, usando o pacote ggplot2 , que tenha no eixo X a variável YEAR, no eixo Y a variável SP.DYN.CBRT.IN e que cada linha corresponda a um país diferente.
```{r}
ggplot(WDI, AES(YEAR, SP.DYN.CBRT.IN, colour = `Country Code`)) +
geom_line()
```