[R] 7. dplyr패키지로 mpg 데이터 분석 (1)
[R] 4. ggplot2 패키지, mpg 데이터로 그래프 그리기
# ggplot2 : 통계 프로그래밍 언어 R을 위한 오픈 소스 데이터 시각화 패키지 입니다 . 2005 년 에 Hadley Wickham이 만든 ggplot2는 Leland Wilkinson 의 Grammar of Graphics ( 그래프를 스케..
nanee-it.tistory.com
**mpg 데이터에 관한 설명은 위의 포스팅에서 확인할 수 있습니다.
# 분석
1. 자동차 배기량에 따라 고속도로 연비가 다른지 알아보려고 한다.
2. 자동차 특정별로 도시 연비가 다른지 알아보려고 한다.
3. chevrolet, ford, honda 자동차의 고속도로 연비 평균을 알아 보려고 한다.
- mpg 변수에 ggplot2의 mpg 데이터 할당하기
mpg <- as.data.frame(ggplot2::mpg)
- head()
head(mpg)
○● 분석1 ●○
자동차 배기량에 따라 고속도로 연비가 다른지 알아보려고 한다.
displ(배기량)이 4 이하인 자동차와 5 이상인 자동차 중 어떤 자동차의 hwy(고속도로 연비)가 평균적으로 더 높은지 분석
- displ(배기량)이 4 이하인 데이터, 5이상인 데이터 추출
mpg1 <- mpg %>% filter(displ <= 4)
mpg2 <- mpg %>% filter(displ <= 5)
- displ 이 4 이하인 hwy 평균 구하기
mean(mpg1$hwy)
[1] 25.96319
- displ 이 5 이상인 hwy 평균 구하기
mean(mpg2$hwy)
[1] 18.07895
▼ 분석 결과 ▼
배기량이 4 이하인 자동차들의 배기량이 평균적으로 더 높은 것을 알 수 있다.
○● 분석2 ●○
자동차 특정별로 도시 연비가 다른지 알아보려고 한다.
audi 와 toyota 중 어느 제조업체(자동차)의 cty(도시 연비)가 평균적으로 더 높은지 분석
- 제조사가 audi 인 데이터, toyota인 데이터 추출
mpg3 <- mpg %>% filter(manufacturer == "audi")
mpg4 <- mpg %>% filter(manufacturer == "toyota")
- audi 의 cty 평균
mean(mpg3$cty)
[1] 17.61111
- toyota 의 cty 평균
mean(mpg4$cty)
[1] 18.52941
▼ 분석 결과 ▼
toyota의 도시연비가 평균적으로 더 높은 것을 알 수 있다.
○● 분석3 ●○
chevrolet, ford, honda 자동차의 고속도로 연비 평균을 알아 보려고 한다.
이 회사들의 데이터를 추출한 후 hwy 전체 평균을 분석
- 제조사가 chevrolet, ford, honda 인 데이터 추출
mpg5 <- mpg %>% filter(manufacturer %in% c("chevrolet", "ford", "honda"))
- 세 회사들의 hwy 전체 평균구하기
mean(mpg5$hwy)
[1] 22.50943
▼ 분석 결과 ▼
chevrolet, ford, honda 자동차의 고속도로 연비 평균은 22.50943 이다.