본문 바로가기

r7

Coursera - Reproducible Research 강좌수료 Reproducible Research는 이전 강좌에 비해 상당히 난이도가 높아졌다. 각 주차별 Quiz는 이전과 큰 차이가 없었지만, course project의 경우 간단한 형태로 답이 있는 문제도 아닐 뿐더러 영어로 보고서를 작성해야 하기 때문에 상당한 노력이 필요하였다. 매일 1~2시간 정도 투자한 결과, 무사히 강좌를 수료할 수 있었다. 이번 강좌는 재현 가능한 연구(reproducible research)에 대한 강좌로 통계뿐만 아니라 실험을 수행하는 모든 이들이 고민해야할 부분으로 reproducible research를 위해 어떠한 과정들이 필요한지를 대략적으로 소개해 주었다. 특히 R을 사용한 실험에 있어 'R Markdown' 및 'knitr' 그리고 'RPubs' 등의 다양한 도구들을.. 2015. 1. 31.
Coursera - Exploratory Data Analysis 강좌수료 이제 벌써 12월이다. 지난 9월부터 시작된 Data Science Specialization 과정이 중반부에 다다랐다. 강의 난이도는 처음에 비해서는 높아졌지만, 바로 이전 강좌에 비해서는 조금 쉬웠다. Exploratory Data Analysis 강좌에서는 주어진 데이터를 그래프나 산점도를 이용해 출력하고, 기본적인 군집화(클러스터링) 기법을 적용한 후 그 결과를 관찰하는 과정으로 강좌가 진행되었다. 실제 데이터의 출력에 있어서는 MATLAB보다 R이 보다 편하고 예쁘게 출력할 수 있었다. 특히 ggplot2를 활용한 출력의 경우, 다양한 범주의 데이터를 출력하는데 있어 factor 변수를 이용하여 쉽게 출력할 수 있어 상당히 유용하다고 생각되었다. 동일한 데이터를 MATLAB에서 출력한다면 'ho.. 2014. 12. 9.
Coursera - Getting and Cleaning Data 강좌수료 9월에 이어 지난 10월에는 Coursera의 Getting and Cleaning Data 강좌를 수강하였다. 확실히 지난번 강의에 비해 난이도가 증가됨을 느낄 수 있었다. 사실 내용만 봐서는 본격적으로 데이터 분석이 시작된 것도 아닌데 quiz나 course project의 난이도가 어려워졌다. 특히 course project의 경우, 이전과는 달리 최종 결과물에 대한 정보가 자세히 주어지지 않고 최종 결과물을 획득하기 위해 수행해야할 과정만을 언급해 두었는데 여러 의미로 해석될 수 있어 course project 포럼에서도 많은 수강자들이 멘붕에 빠져 뭘 해야하는지 모르겠다며 글들이 올라왔다. 사실 나도 처음에는 별거 아니겠거니 하다 마지막까지 꽤 고생을 했다. 어떻게 진행해야 할 지 갈피를 잡지 .. 2014. 11. 7.
Coursera - The Data Scientist's Toolbox, R Programming 강좌 수료 지난 9월 Coursera에서 2개의 강좌를 동시에 수강하고 이를 잘 마무리하였다는 수료증을 받게 되었다. 지난번에는 Python에 대한 강좌를 수강하였는데 이번에는 조금 더 체계적으로 한 분야를 파고 들고자 Johns Hopkins University에서 제공하는 Specialization 과정인 Data Science의 처음 두 과목을 수강하게 되었다. 원래는 첫 번째 과목만 신청하였으나 내용이 짧고 쉬워서 일주일만에 모든 강의 영상과 과제를 마무리하게 되어, 두 번째 과목까지 추가로 신청하여 마무리 하게 되었다. 이로써 총 3개의 과목을 수강하고 완료하게 되었다. < R Programming 수료.. 2014. 10. 15.
swirl - R 프로그래밍 학습을 위한 라이브러리 swirl은 Coursera에서 진행 중인 "R Programming" 코스에서 사용하였던 R 라이브러리로 직접 코드를 입력하며, 상호작용을 통해 쉽게 R을 배울 수 있는 아주 유용한 라이브러리이다. 또한 "R Programming" 코스에서는 해당 라이브러리를 통해 과제를 수행하고 이를 바로 Coursera 사이트에 업로드 할 수 있게 해 두는 등 사용자에게 매우 편리하도록 설계되어 있다. swirl 홈페이지 링크 사이트에서 두 번째 메뉴인 "Learn"을 클릭하면, 라이브러리 설치 및 사용 방법에 대해 간단히 소개되어 있다. 설치 과정은 그다지 복잡하기 않다.라이브러리를 다운받고 R의 콘솔 명령창에서 install.packages("swirl") 라고 입력한 후 엔터를 하게 되면 설치가 된다. 학습하.. 2014. 10. 6.
[R] 데이터 이해에 유용한 함수들 데이터 분석에 가장 먼저 수행되어야 할 작업은 현재 다루어야 할 데이터가 무엇인지를 이해하는 것이다. R을 이용한 데이터 분석에 있어 출발점이 될 수 있는 데이터 이해에 활용되는 함수들을 정리함. 각 함수의 자세한 사용법은 명령창에 ?read.table 과 같은 형태로 각 함수에 대해 입력한 후 Help 문서 참조. ■ 데이터 파일 불러오기 일반적인 표 형태의 자료를 불러오는 함수들 - read.table, read.csv, read.csv2, read.delim, read.delim2 (예) example.csv 파일 불러오기 한 후 data 변수에 저장 data 2014. 9. 23.