R, 강력한 데이터 처리 도구 dplyr

R에 입문한지 2주 정도가 지났습니다. 통계를 하는 사람들 대부분이 R을 사용한다고 들었는데, R을 사용해 보니 그 이유를 알겠더라고요. R의 기본 바탕에 수 많은 패키지들을 불어들여와 다양한 편의 기능들을 사용할 수 있게 해줍니다. 단, 무료이다 보니까 어떠한 문제가 발생했을 때 해결은 본인 스스로 해야 한다는 점. 패키지의 정확성에 대한 담보가 없다는 단점이 있기는 합니다. 원인을 알 수 없는 불규칙한 오류들이 종종 발생하기 때문에, Google 검색이나 강의를 통해 경험 많은 사람들의 조언을 얻는 것 또한 R 활용 능력을 높일 수 있는 좋은 방법일 것입니다.

dplyr 패키지는 R을 활용하는 사람들은 반드시 필요한 도구인 것 같습니다.

메뉴얼도 있지만 아래 두 블로그에 예제 중심으로 자세한 설명이 되어 있어서 소개해 드리려고 합니다. 20분만 투자하시면, 왠만한 데이터 처리 방법들을 익힐 수 있습니다.

  1. [R] 데이터 처리의 새로운 강자, dplyr 패키지
  2. dplyr로 데이터 집계와 분석
library(ggplot2)
ggplot(data=pbesol,
       mapping = aes(x=Latt_vol, y=band_gap, col=Crystal.System)) +
       geom_point()