R - 데이터 고급 분석과 통계 프로그래밍을 위한

1. 'R' ?

오픈소스 '통계분석' 언어. 정확한 프로젝트 명칭은 'GNU S' 

산더미 같은 데이터 중에서 추정계수(?), 표준오차(?), 잔차(?) 등과 같은 통계적 분석을 거쳐서 좀 더 의미있는 데이터에 접근하기 위해 사용한대..

AT&T 에서 개발한 통계언어 S 에서 영향을 받았음. 

'S' 는 아마 Statistics 에서 따왔을 것이고 R 은 알파벳 순으로 S 보다 앞에 있어서..(?)

'S-plus' 라고 있는데, 이건 'S' 에 GUI가 추가된 상용판 언어로 전문 통계학자들 사이에서는 사실상 표준

많은 '통계적 지식'을 필요로 함 (허들이 제법 높다.)

프로젝트 홈페이지

빅데이터 시대에 데이터 접근에 대한 표준역할은 나(R)에게 맡기고, 이후의 데이터 처리는 당신들이 지금껏 써왔던 언어를 쓰시라....는게 컨셉인 언어

 

2. 'R' 특징

상용 분석 도구인 SAS 나 SPSS 보다 패키지 업데이트가 빠르고, 다양한 데이터 소스와의 연결이 장점.

각 세션사이마다 시스템에 데이터 세트를 저장하므로 데이터를 매번 다시 로딩할 필요가 없다.

'병렬 컴퓨팅'과 궁합이 잘 맞는듯.

 

3. 'R' 맛만 한번 보기

설치

CRAN(the Comprehensive R Archive Network) 에 접속. OS에 맞는 링크 클릭해서 안내를 따를것.  

나는 'Download R for Window' -> base (기본 배포 바이너리) -> R-3.2.2 for Windows (32/64 bit) -> R-3.2.2-win.exe 를 다운로드

 R-3.2.2-win.exe 실행. x64 모드로 설치

실행

바탕화면 숏컷 "R x64 3.2.2" 실행

R Console 이 표시되면 프롬프트에서 명령어를 입력

demo()

DeepMind moves to TensorFlow

오늘 구글은 블로그를 통해 딥마인드(Deepmind.com)가 토치(Torch)에서 텐서플로우(TensorFlow)로 연구, 개발 프레임워크를 교체한다고 발표하였습니니다.

토치는 그동안 딥마인드와 페이스북이 사용하면서 코드 기여도 상당했었지만 딥마인드가 토치를 더이상 사용하지 않게 됨으로써 토치 진영에는 페이스북과 트위터가 남게 되었습니다. 어찌보면 예상된 수순이었을지 모르겠습니다. 이세돌과 알파고가 바둑대전을 할 때 제프딘이 언급한 것 처럼 이미 알파고에 텐서플로우가 일정 부분 사용되고 있었기 때문입니다.

며칠 전 선다 피차이(Sundar Pichai) 구글 CEO가 보낸 창업자의 편지(Founder’s letter)에서 앞으로 세상은 모바일 퍼스트(mobile first)에서 AI 퍼스트(AI first)로 변할 것이라고 말하고 있습니다.

“We will move from mobile first to an AI first world.”

이런 비전의 첫 교두보인 텐서플로우가 무엇보다도 널리 쓰이길 바라는 것이 구글에서는 당연할 것입니다. 딥마인드는 지난 몇 달간 기존의 연구를 텐서플로우로 변경하면서 테스트를 해왔고 이제 앞으로 딥마인드에서 수행하는 모든 연구는 텐서플로우를 이용할 것이라고 합니다.

물론 텐서플로우를 PR 하는 것이라고 비아냥 거리는 냉소도 인터넷에 돌아다니긴 합니다.

First Contact with TensorFlow

tensorflowbookcover-1024x7122x

‘First Contact with TensorFlow’ Book Cover. 출처: http://www.jorditorres.org

스페인 카탈루냐 공과대학의 Jordi Torres 교수가 텐서플로우를 소개하는 책 ‘First Contack with TensorFlow‘을 공개했습니다. 책의 서두에서도 밝혔지만 이 책은 ‘Fundamental of Deep Learning‘ 같은 책 처럼 머신러닝의 이론적 배경에 무게를 두기 보다는 텐서플로우를 처음 접하는 사람들을 위한 입문서 용도로 쓰여 졌습니다.

이 책은 대략 140여 페이지 정도로 pdf 나 인쇄본으로 구매할 수도 있지만 온라인에서 무료로 읽을 수 있도록 책 전체를 공개하고 있습니다. 부가적으로 Jordi Torres 교수가 강의에 활용했던 슬라이드는 여기에서 다운받으실 수 있습니다.

원 도서의 라이센스(CC BY-NC-SA 3.0)에 따라 전체 내용을 번역하여 공유하겠습니다.

추천사, 서문, 실용적접근

1. 텐서플로우 기본다지기

2. 텐서플로우 선형회귀분석(Linear Regression)

3. 텐서플로우 클러스터링(Clustering)

4. 단일 레이어(layer) 뉴럴 네트워크(Neural Network)

5. 멀티 레이어(multi-layer) 뉴럴 네트워크

6. 병렬화

마치며

 

+ Recent posts