메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

파이썬 라이브러리를 활용한 데이터 분석(2판)

영화 평점, 이름 통계, 선거 데이터 등 실사례 사용

한빛미디어

번역서

절판

1 2 3 4 5
4.6점 (26명)
좋아요 : 18

책소개

빅데이터 분석에 관한 가장 완벽한 교재! 

 

이 책은 NumPy, pandas, matplotlib, IPython, Jupyter 등 다양한 파이썬 라이브러리를 사용해서 효과적으로 데이터를 분석하는 방법을 알려준다. pandas의 새로운 기능뿐만 아니라 메모리 사용량을 줄이고 성능을 개선하는 고급 사용법까지 다룬다. 또한 모델링 도구인 statsmodels와 scikit-learn 라이브러리도 소개한다. 연대별 이름 통계 자료, 미 대선 데이터베이스 자료 등 실사례로 따라 하다 보면 어느덧 여러분도 데이터에 알맞게 접근하고 효과적으로 분석하는 전문가가 될 것이다. 

 

 

『파이썬 라이브러리를 활용한 데이터 분석』 드디어 개정!

 

이 책의 초판이 출간된 2012년은 pandas 개발 초기로, 파이썬용 오픈소스 데이터 분석 라이브러리가 흔하지 않았습니다. 이번에 pandas의 새로운 기능과 5년여간의 세월이 흐르는 동안 낡았거나 사용법이 바뀐 내용을 모두 반영하여 책 전반을 다시 다듬었습니다. 또한 당시에는 존재하지 않았거나 책에 싣기에는 불안했던 갓 나온 도구들을 새로 소개하는 내용을 추가했습니다. 2판의 주요 변경 사항은 다음과 같습니다.

  • 모든 코드를 파이썬 3.6 기반으로 수정
  • 아나콘다 파이썬 배포판과 몇몇 필수 파이썬 패키지로 설치
  • 최신 pandas 라이브러리 사용
  • pandas 고급 사용법과 사용팁 추가
  • statsmodels와 scikit-learn 라이브러리 소개

 

이 책에서 다루는 내용

 

이 책은 파이썬으로 데이터를 다루는 다양하고 기본적인 방법을 소개합니다. 그러기 위해 파이썬 프로그래밍 언어의 일부와 데이터 분석 문제를 효율적으로 해결하는 데 도움이 되는 몇 가지 라이브러리를 다룹니다. ‘데이터 분석’이 이 책의 제목이긴 하지만 데이터 분석 방법론이 아니라 파이썬 프로그래밍, 라이브러리, 도구에 집중합니다. 주요 내용은 다음과 같습니다.

  • IPython 셸, 주피터 노트북 사용하기
  • NumPy 기본 및 고급 기능 알아보기
  • pandas로 데이터 분석 입문하기
  • 유연한 도구를 사용해 데이터 로딩, 정제, 조인, 병합, 변형하기
  • matplotlib으로 유용한 시각화 만들기
  • pandas groupby 기능을 적용해 데이터를 나누고 요약하기
  • 시계열 데이터 분석 및 조작하기

저자소개

웨스 맥키니 저자

웨스 맥키니

미국 내슈빌에서 활동하고 있는 소프트웨어 개발자이자 기업가. 2007년 MIT 수학과 학부 과정을 마치고 코네티컷주 그리니치에 있는 AQR 캐피털 매니지먼트에서 금융 분석가로 근무했다. 복잡하고 느린 데이터 분석 도구에 실망해 2008년 파이썬을 배우면서 판다스 프로젝트를 시작했다. 파이썬 데이터 커뮤니티의 활발한 일원이며 데이터 분석, 금융, 통계 계산 애플리케이션에서 파이썬 사용을 독려하고 있다.

공동 창업한 DataPad가 2014년 클라우데라(Cloudera)에 인수된 이후 빅데이터 기술에 집중하기 시작했고, 아파치 소프트웨어 재단의 프로젝트인 아파치 애로(Apache Arrow)와 아파치 파케이(Apache Parquet)의 PMC(프로젝트 관리 위원)로 합류했다. 2018년 R스튜디오(RStudio), Two Sigma Investments와 협력해 아파치 애로 개발에 중점을 둔 비영리단체 Ursa Labs를 설립했다. 2021년에는 기술 스타트업인 Voltron Data를 공동 설립해 현재 최고 기술 책임자로 일하고 있다.

 

 

김영근 역자

김영근

애플 II에서 BASIC으로 처음 프로그래밍을 시작했고, 장래 희망은 항상 프로그래머라고 말하고 다니다 정신 차리고 보니 어느덧 20년 경력을 훌쩍 넘긴 개발자가 되었다. 리눅스 커뮤니티에서 오랫동안 활동했으며 임베디드 환경에서부터 미들웨어, 웹, 스마트폰 애플리케이션에 이르기까지 다양한 분야에서 개발했다. 아시아 최초의 파이썬 소프트웨어 재단의 이사로 활동했으며 2014년 ‘파이콘 한국(PyCon Korea)’을 처음 시작했다. 스타트업 CTO로 재직 중이며 소프트웨어 마에스트로의 기술 멘토이기도 하다. 현재의 장래 희망은 장학 재단 설립이다. 한빛미디어에서 『리눅스 시스템 프로그래밍(개정2판)』(2014), 『고성능 파이썬』(2016)을 번역했다.

 

목차

CHAPTER 1 시작하기 전에

1.1 이 책에서 다루는 내용

1.2 왜 데이터 분석에 파이썬을 사용하나

1.3 필수 파이썬 라이브러리

1.4 설치 및 설정 

1.5 커뮤니티와 컨퍼런스

1.6 이 책을 살펴보는 방법

 

CHAPTER 2 파이썬 언어의 기본, IPython, 주피터 노트북

2.1 파이썬 인터프리터 

2.2 IPython 기초

2.3 파이썬 기초 

 

CHAPTER 3 내장 자료구조, 함수, 파일

3.1 자료구조와 순차 자료형 

3.2 함수

3.3 파일과 운영체제  

3.4 마치며

 

CHAPTER 4 NumPy 기본: 배열과 벡터 연산

4.1 NumPy ndarray: 다차원 배열 객체 

4.2 유니버설 함수: 배열의 각 원소를 빠르게 처리하는 함수 

4.3 배열을 이용한 배열지향 프로그래밍

4.4 배열 데이터의 파일 입출력

4.5 선형대수

4.6 난수 생성  

4.7 계단 오르내리기 예제

4.8 마치며 

 

CHAPTER 5 pandas 시작하기

5.1 pandas 자료구조 소개

5.2 핵심 기능

5.3 기술 통계 계산과 요약

5.4 마치며 

 

CHAPTER 6 데이터 로딩과 저장, 파일 형식

6.1 텍스트 파일에서 데이터를 읽고 쓰는 법

6.2 이진 데이터 형식

6.3 웹 API와 함께 사용하기 

6.4 데이터베이스와 함께 사용하기

6.5 마치며 

 

CHAPTER 7 데이터 정제 및 준비

7.1 누락된 데이터 처리하기 

7.2 데이터 변형 

7.3 문자열 다루기 

7.4 마치며 

 

CHAPTER 8 데이터 준비하기: 조인, 병합, 변형

8.1 계층적 색인

8.2 데이터 합치기 

8.3 재형성과 피벗 

8.4 마치며 

 

CHAPTER 9 그래프와 시각화

9.1 matplotlib API 간략하게 살펴보기

9.2 pandas에서 seaborn으로 그래프 그리기

9.3 다른 파이썬 시각화 도구 

9.4 마치며 

 

CHAPTER 10 데이터 집계와 그룹 연산

10.1 GroupBy 메카닉

10.2 데이터 집계  

10.3 Apply: 일반적인 분리-적용-병합

10.4 피벗테이블과 교차일람표 

10.5 마치며 

 

CHAPTER 11 시계열

11.1 날짜, 시간 자료형, 도구  

11.2 시계열 기초  

11.3 날짜 범위, 빈도, 이동  

11.4 시간대 다루기  

11.5 기간과 기간 연산

11.6 리샘플링과 빈도 변환  

11.7 이동창 함수  

11.8 마치며 

 

CHAPTER 12 고급 pandas

12.1 Categorical 데이터

12.2 고급 GroupBy 사용

12.3 메서드 연결 기법

12.4 마치며 

 

CHAPTER 13 파이썬 모델링 라이브러리

13.1 pandas와 모델 코드의 인터페이스  

13.2 Patsy를 이용해서 모델 생성하기  

13.3 statsmodels 소개  

13.4 scikit-learn 소개 

13.5 더 공부하기  

 

CHAPTER 14 데이터 분석 예제

14.1 Bit.ly의 1.USA.gov 데이터  

14.2 MovieLens의 영화 평점 데이터  

14.3 신생아 이름  

14.4 미국농무부 영양소 정보  

14.5 2012년 연방선거관리위원회 데이터베이스  

14.6 마치며 

 

APPENDIX A 고급 NumPy

A.1 ndarray 객체 구조  

A.2 고급 배열 조작 기법

A.3 브로드캐스팅 

A.4 고급 ufunc 사용법  .

A.5 구조화된 배열과 레코드 배열  

A.6 정렬에 관하여 

A.7 umba를 이용하여 빠른 NumPy 함수 작성하기  

A.8 고급 배열 입출력  

A.9 성능 팁  

 

APPENDIX B IPython 시스템 더 알아보기

B.1 명령어 히스토리 사용하기  

B.2 운영체제와 함께 사용하기  

B.3 소프트웨어 개발 도구  

B.4 IPython을 이용한 생산적인 코드 개발에 관한 팁  

B.5 IPython 고급 기능  

B.6 마치며  

출판사리뷰

“이미 필독서가 된 이 책이 업그레이드되었다. 2판에는 파이썬 3.6부터 pandas 최신 기능에 이르기까지 이 책의 가치를 더 향상시킬 내용이 담겼다. 왜 파이썬 라이브러리인지, 이 도구들을 어떻게 다뤄야 하는지 설명해 독자가 새롭고 창의적인 방식으로 효율적인 사용법을 익히도록 도와준다.”

- 페르난도 페레즈(Fernando Pérez)_ IPython 창시자, UC 버클리 통계학과 조교수

독자리뷰

오탈자 보기

부록/예제소스

결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원 무료배송
닫기

리뷰쓰기

닫기
* 상품명 :
파이썬 라이브러리를 활용한 데이터 분석(2판)
* 제목 :
* 별점평가
1 2 3 4 5
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
파이썬 라이브러리를 활용한 데이터 분석(2판)
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
파이썬 라이브러리를 활용한 데이터 분석(2판)
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?