본문 바로가기
Big Data/R

[R] 7. dplyr패키지로 mpg 데이터 분석 (1)

by nanee_ 2021. 6. 15.
728x90
반응형
SMALL
 

[R] 4. ggplot2 패키지, mpg 데이터로 그래프 그리기

# ggplot2 : 통계 프로그래밍 언어 R을 위한 오픈 소스 데이터 시각화 패키지 입니다 . 2005 년 에 Hadley Wickham이 만든 ggplot2는 Leland Wilkinson 의 Grammar of Graphics ( 그래프를 스케..

nanee-it.tistory.com

**mpg 데이터에 관한 설명은 위의 포스팅에서 확인할 수 있습니다.

 

 

 

# 분석

1. 자동차 배기량에 따라 고속도로 연비가 다른지 알아보려고 한다.

2. 자동차 특정별로 도시 연비가 다른지 알아보려고 한다. 

3. chevrolet, ford, honda 자동차의 고속도로 연비 평균을 알아 보려고 한다.

 

 

- mpg 변수에 ggplot2의 mpg 데이터 할당하기

mpg <- as.data.frame(ggplot2::mpg)

 

- head()

head(mpg)

 


 

○● 분석1 ●○

자동차 배기량에 따라 고속도로 연비가 다른지 알아보려고 한다.

displ(배기량)이 4 이하인 자동차와 5 이상인 자동차 중 어떤 자동차의 hwy(고속도로 연비)가 평균적으로 더 높은지 분석

 

 

- displ(배기량)이 4 이하인 데이터, 5이상인 데이터 추출

mpg1 <- mpg %>% filter(displ <= 4)
mpg2 <- mpg %>% filter(displ <= 5)

 

- displ 이 4 이하인 hwy 평균 구하기

mean(mpg1$hwy)

[1] 25.96319

 

- displ 이 5 이상인 hwy 평균 구하기

mean(mpg2$hwy)

[1] 18.07895

 

 

▼ 분석 결과 ▼

배기량이 4 이하인 자동차들의 배기량이 평균적으로 더 높은 것을 알 수 있다.

 


 

○● 분석2 ●○

자동차 특정별로 도시 연비가 다른지 알아보려고 한다.

audi 와 toyota 중 어느 제조업체(자동차)의 cty(도시 연비)가 평균적으로 더 높은지 분석

 

 

- 제조사가 audi 인 데이터, toyota인 데이터 추출

mpg3 <- mpg %>% filter(manufacturer == "audi")
mpg4 <- mpg %>% filter(manufacturer == "toyota")

 

- audi 의 cty 평균

mean(mpg3$cty)

[1] 17.61111

 

- toyota 의 cty 평균

mean(mpg4$cty)

[1] 18.52941

 

 

▼ 분석 결과 ▼

toyota의 도시연비가 평균적으로 더 높은 것을 알 수 있다.

 


 

○● 분석3 ●○

chevrolet, ford, honda 자동차의 고속도로 연비 평균을 알아 보려고 한다.

이 회사들의 데이터를 추출한 후 hwy 전체 평균을 분석

 

 

- 제조사가 chevrolet, ford, honda 인 데이터 추출

mpg5 <- mpg %>% filter(manufacturer %in% c("chevrolet", "ford", "honda"))

 

- 세 회사들의 hwy 전체 평균구하기

mean(mpg5$hwy)

[1] 22.50943

 

 

▼ 분석 결과 ▼

chevrolet, ford, honda 자동차의 고속도로 연비 평균은 22.50943 이다.

 

 

 

728x90
반응형
LIST