R - 데이터 고급 분석과 통계 프로그래밍을 위한
1. 'R' ?
오픈소스 '통계분석' 언어. 정확한 프로젝트 명칭은 'GNU S'
산더미 같은 데이터 중에서 추정계수(?), 표준오차(?), 잔차(?) 등과 같은 통계적 분석을 거쳐서 좀 더 의미있는 데이터에 접근하기 위해 사용한대..
AT&T 에서 개발한 통계언어 S 에서 영향을 받았음.
'S' 는 아마 Statistics 에서 따왔을 것이고 R 은 알파벳 순으로 S 보다 앞에 있어서..(?)
'S-plus' 라고 있는데, 이건 'S' 에 GUI가 추가된 상용판 언어로 전문 통계학자들 사이에서는 사실상 표준
많은 '통계적 지식'을 필요로 함 (허들이 제법 높다.)
빅데이터 시대에 데이터 접근에 대한 표준역할은 나(R)에게 맡기고, 이후의 데이터 처리는 당신들이 지금껏 써왔던 언어를 쓰시라....는게 컨셉인 언어
2. 'R' 특징
상용 분석 도구인 SAS 나 SPSS 보다 패키지 업데이트가 빠르고, 다양한 데이터 소스와의 연결이 장점.
각 세션사이마다 시스템에 데이터 세트를 저장하므로 데이터를 매번 다시 로딩할 필요가 없다.
'병렬 컴퓨팅'과 궁합이 잘 맞는듯.
3. 'R' 맛만 한번 보기
설치
CRAN(the Comprehensive R Archive Network) 에 접속. OS에 맞는 링크 클릭해서 안내를 따를것.
나는 'Download R for Window' -> base (기본 배포 바이너리) -> R-3.2.2 for Windows (32/64 bit) -> R-3.2.2-win.exe 를 다운로드
R-3.2.2-win.exe 실행. x64 모드로 설치
실행
바탕화면 숏컷 "R x64 3.2.2" 실행
R Console 이 표시되면 프롬프트에서 명령어를 입력
demo()
'데이터 사이언트' 카테고리의 다른 글
데이터중심적(data-driven) 의사결정의 12가지 특징 (0) | 2016.07.04 |
---|