[R] 7. dplyr패키지로 mpg 데이터 분석 (1)
2021.05.27 - [R] - [R] 4. ggplot2 패키지, mpg 데이터로 그래프 그리기 [R] 4. ggplot2 패키지, mpg 데이터로 그래프 그리기 # ggplot2 : 통계 프로그래밍 언어 R을 위한 오픈 소스 데이터 시각화 패키지..
nanee-it.tistory.com
** 위의 글과 이어지는 글이니 참고 부탁드립니다.
# 분석
4. 자동차 종류에 따라 도시연비가 다른지 알아보려고 한다.
5. 'audi'에서 생산한 자동차 중 hwy top5를 알아보려고 한다.
○● 분석4 ●○
자동차 종류에 따라 도시연비가 다른지 알아보기
class (자동차 종류)가 'suv' 인 자동차와 'compact' 인 자동차 중 어떤 자동차의 cty(도시연비) 평균이 더 높은 지 분석
- class, cty 변수 추출해서 변수에 할당하기
df <- mpg %>% select(class, cty)
head(df)
- class가 'suv' 인 행을 추출한 뒤 cty 평균 구하기
df_suv <- mpg %>% filter(class == "suv")
mean(df_suv$cty)
[1] 13.5
- class가 'compact' 인 행을 추출한 뒤 cty 평균 구하기
df_compact <- mpg %>% filter(class == "compact")
mean(df_compact$cty)
[1] 20.12766
▼ 분석 결과 ▼
'compact'의 도시연비가 'suv'보다 평균적으로 더 높은 것을 알 수 있다.
○● 분석5 ●○
'audi'에서 생산한 자동차 중 hwy top5를 알아보려고 한다.
'audi'에서 생산한 자동차 중에 어떤 자동차의 모델의 hwy가 높은지 분석
- mpg 데이터에서 'audi'만 추출한 뒤 내림차순으로 정렬하고 상위 5개 행만 추출하기
mpg %>%
filter(manufacturer == "audi") %>%
arrange(desc(hwy)) %>%
head(5)
▼ 분석 결과 ▼
'audi'의 모델 중 고속도로 연비가 높은 모델은 a4와 a4 quattro 이다.
'Big Data > R' 카테고리의 다른 글
[R] 10. 데이터 정제 (2) - 결측치 제거하기 (0) | 2021.06.17 |
---|---|
[R] 9. 데이터 정제 (1) - 결측치 찾기 (0) | 2021.06.17 |
[R] 7. dplyr패키지로 mpg 데이터 분석 (1) (0) | 2021.06.15 |
[R] 6. 데이터 전처리 - dplyr패키지(2) (0) | 2021.06.15 |
[R] 5. 데이터 전처리 - dplyr 패키지(1) (0) | 2021.06.15 |