처음 시작하는 R 데이터 분석
최근 4차 산업혁명이 대두되면서 주변에 많은 변화가 일어나고있다.
컴퓨터는 그저 '사무용' 혹은 '게임용'이라고 여겨지던 이전과는 달리 가상에서 머무르지않고 현실과 밀접한 관계가 생기고 있다.
얼마전 한창 시끄러웠던 '코인' 대란과 알파고 vs 이세돌9단의 바둑대결이 대표적인 사례이다.
사람들은 이 사건들로인해 컴퓨터 기술이 현실에 엄청난 영향을 줄 수 있음을 깨닳았을 것이다.
이런 기술력들이 현실에 나타나면서 ''4차 산업혁명'이라는 잘 와닿지 않던 말도 사람들에게 가깝게 다가왔을 것이다.
이러한 분위기에 편승하여 이제는 컴퓨터를 전공하지 않은 사람들도 관련 기술들을 연구하기 시작했는데,
머신러닝, 블록체인, 인공지능 이 대표적인 예이다.
하지만 이 모든것들은 수많은 양의 데이터, 그리고 그 데이터들의 분석으로 시작한다.
이 책은 그런 데이터 분석에 사용되는 기술을 설명하고 사용 방법을 알려준다.
책에도 써있는 'R'이라는 문자는 언어이다.
언어라는것은 컴퓨터 기술을 구현할때 사용되는 문자로써, 사람들이 컴퓨터가 알아듣도록 만든 문자체계이다.
C언어, JAVA, PYTHON등이 그 대표적인 예이고, R은 4차산업혁명의 물살을 타고 인기 상승중인 언어중에 하나이다.
잘 모르겠다면 간단히 '일본어는 일본사람이 알아듣게 만든말이고, 중국어는 중국사람이 알아듣게 만든말이고,
R은 컴퓨터가 알아듣게 만든말 중에 하나이다' 라고 이해하면 될것이다.
위에서 언급한것처럼 컴퓨터에서는 다양한 언어들이 사용되는데 일반 사람들이 컴퓨터에 그 언어를 전달하기는 쉽지 않다.
그래서 언어를 만드는 사람들은 컴퓨터가 언어를 알아듣기 쉽게하기위해 그 언어를 쉽게 사용할 수 있는 툴을 만들어준다.
여러가지 툴들이 있지만 이 책에서는 R스튜디오라는 유명한 툴을 사용한다.
이 툴의 설치방법과 사용방법을 자세하게 설명하고, 우리가 사용할 데이터 활용을 위해 데이터를 어떻게 가공할 것이며,
어떻게 사용할 것인지등이 설명되어있다.
통계를 공부하고 있거나 언어 한두가지는 사용할 줄 아는 컴퓨터 전공자들이라면 약간의 공부를 통해 쉽게 사용할 수 있겠지만,
기초가 부족하거나 잘 모르겠다 싶은 독자들을위해 목차에서는 선행학습을 위해 다른 챕터를 먼저 읽어도 상관없다고 친절하게 설명하고 있다.
이렇게 3장 전까진 R과, 데이터 분석에 활용되는 기술에 대한 설명, 툴 활용 설명등의 이론학습이 끝나고 본격적으로 실습이 시작된다.
상당히 지루한 작업 일 수도 있지만, 독자들이 흥미를 잃지 않게끔 워드클라우드와 같은 재미있는 예제를 실습해보거나,
데이터에 따른 다양한 그래프 결과물을 통해 시각적으로 즐거움을 선사한다.
이렇게 이론을 실체화 시키는 실습을 통해 연습을 마치고 나면, 현실세계에서 사용되고 있는 데이터들을 활용해
프로젝트의 느낌으로 실습을 한다. 흥미로운 데이터들이 많은 것 같다.
저는 컴퓨터전공 대학생으로써, 전공책을 볼 때 가장 중요한것은 프로젝트라고 생각합니다.
처음부터 어떤걸 해야 할지 막막할때 혹은 뭔가 만들어보고 싶은데 지식이 별로 없을때,
가이드가 되어주는 그런 책이 정말 소중하고 감사하게 생각됩니다.
때문에 '흰것은 종이요, 검은것은 글씨니'와 같은 이론책은 별로 좋아하지도 않고 읽히지도 않습니다.
첫째도 실습, 둘째도 실습, 실습이 구현되고 나서 이론을 해도 늦지 않다고 생각합니다.
'처음 시작하는 R 데이터 분석'은 저의 요구사항처럼 '실습'위주로 구성되어 있기 때문에 마음에 듭니다.
독자가 한단계씩 밟아 나아갈수 있도록 도와주며, '몇 일차'의 구성으로 사용자의 의욕을 끌어내고 있습니다.
(책에서는 7일 안에 끝낼수 있다고 하지만, 시간이 어마어마하게 넉넉한 사람이 아니면... 불가능한 일이라고 생각합니다.)
최근에 나오는 컴퓨터공학 서적들은 일반인들도 배울수 있도록 배려를 하며 만드는것이 예전 컴퓨터공학 서적들보다 쉬워진 이유라고 생각하며,
좋은 현상이라고 생각합니다.
책은 별로 두껍지 않으며, 알차게 구성되어있어 데이터 분석에 관심이 많은 사람이라면 한번쯤은 읽어보는것을 추천합니다!
- 요약
1. 4차 산업혁명이 도래하며 일반인들도 컴퓨터공학에 관심이 생겼다.
2. 4차 산업혁명을 이끄는 기술 중 근본이 되는것이 '데이터', 이 데이터를 활용하는 언어중에 하나가 'R'이다.
3. 이 책은 'R'을 활용할 수 있는 툴의 설명과, 데이터 분석에 관련된 정보를 그림을 통해 독자들에게 쉽게 다가가려고 한다.
4. 데이터 분석에 대한 이론을 어느정도 익혔다면, 실습을 해보자 하면서 책이 독자들을 이끈다.
5. 어느정도의 실습이 끝나면 프로젝트 형식으로 실생활에 사용되는 데이터를 활용한 실습을 하는데 이게 정말 마음에 든다.
- 장점
1. 차근차근 밟아나가는 느낌의 구성
2. R스튜디오 설치과정과 활용방법이 들어가며 처음 접하는 독자들을 배려
3. 다양한 그림을 통해 독자들을 지루하지 않게 배려
4. 연습문제의 배치로 독자들이 익힌 내용을 다시한번 상기시킴
5. 실습 난이도가 쉬운것부터 점점 난이도가 올라가며 흥미로운 데이터를 활용하는것
6. 싸고 페이지가 많지않음(약 300 페이지)
7. 디자인이 예쁨
- 단점
1. '몇 일 완성'은 독자를 너무 몰아붙이는 느낌이 있지않나 싶어서 개인적으로는 별로
2. 딱히 없음