데이터 분석가:Applied Data Analytics/관련 도서

데이터 분석가 관련 추천도서

데이터분석 2025. 1. 19. 15:29

데이터 분석가는 보고서작성, 시각화, 통찰력, 비즈니스/도메인 지식의 능력이 필요하다.
여기서 비즈니스/도메인 지식은 특정 산업이나 회사의 주요 활동 영역에 대한 이해를 말하며, 쉽게 말해, “이 회사가 어떻게 돈을 벌고, 고객에게 어떤 가치를 제공하며, 어떤 방식으로 운영되는지”를 아는 것입니다.
예를 들어, 편의점에서 수입 맥주 판매 데이터를 분석한다고 할 때, 수입 맥주가 4캔 묶음으로만 기록된다는 점을 모른다면 잘못된 결론을 내릴 수 있습니다. 따라서 이런 산업 특성을 알고 있어야 분석 결과가 실제로 유용해집니다. 이렇게 비즈니스/도메인 지식은 데이터 분석 결과를 실질적으로 활용 가능하게 만드는 핵심 요소입니다.


파이썬 머신러닝 판다스 데이터 분석 (개정판)
오승환 (지은이)   정보문화사   2024-06-25

출처 : 알라딘서점

알라딘 의 책소개
어려운 이론은 최소화하고, 예제 코드를 따라 하며 자연스럽게 사용법에 익숙해지도록 안내하는 데이터 분석 입문서다. 데이터 분석을 처음 배우는 입문자의 입장에서 고급 이론과 데이터 분석 도구를 함께 배우는 것의 어려움을 아는 저자가, 데이터 분석에 필요한 필수 라이브러리를 소개하고 설치부터 예제 코드까지 따라 할 수 있게 구성했다. 개념 이해를 돕기 위해 다이어그램 등 풍부한 도식화도 적극 활용했다.

1판에서 큰 인기를 얻어 준비된 이번 개정판에서는 저자가 실무에서 쌓은 경험을 자연스럽게 녹이기 위해 노력했다. 여러 기업과 대학에서 계속 강의를 해오고 있는 만큼 더욱 자세한 설명과 다양한 데이터 시각화, 데이터 전처리 기법을 담았으며, Pandas 2.0 버전에서 추가되거나 변경된 내용을 풍부하게 담아 데이터 분석에 필요한 최신 기술과 기능을 습득할 수 있다. 또한 저자 블로그나 깃헙, 그리고 유튜브에서 질의응답 게시판을 운영하고 있어, 궁금한 점이나 책과 관련된 요청 사항을 전달할 수 있다.

복잡한 이론이 아닌, 풍부한 예제로 비전공자와 입문자의 마음을 사로잡은 강의가 개정판으로 돌아왔다. 최신 버전인 Pandas 2.0 버전에서 추가되거나 변경된 내용을 포함하여 시계열 데이터 처리 등의 기법과 사례 등을 더해 150쪽 이상의 분량이 더해졌다. 특히 시계열 데이터의 효율적인 처리와 분석을 위한 다양한 기법을 추가했다. 시계열 데이터는 시간의 흐름에 따른 연속적인 값으로, 미래를 예측하고 그에 맞는 전략을 세우는 데 큰 도움이 되기 때문에 주식, 환율 등 금융 데이터에 특히 많이 쓰인다. 데이터 분석에서 중요한 부분이기 때문에 다른 자료형을 시계열 객체로 변환하는 것부터 시계열 데이터 처리 기법까지 사례를 대폭 추가해 시간에 따른 데이터 변화를 효과적으로 분석할 수 있도록 했다. 또한 시계열 데이터 처리 강화와 더불어, 데이터 전처리 기법을 더욱 다양화했다. 데이터 정제, 변환, 통합 등 다양한 데이터 전처리 기법을 추가하여 데이터 분석의 기초를 더욱 탄탄히 다질 수 있도록 했다. 데이터의 시각적 표현을 위한 다양한 기법과 도구 역시 새롭게 포함했으며, 데이터 시각화 개선으로 복잡한 데이터를 직관적으로 이해하고 전달하는 기법을 더욱 쉽게 배울 수 있다. 그리고 이 모든 과정을 실습 중심으로 진행한다. 지루하고 복잡한 이론은 최소화하고, 실무에 바로 적용할 수 있는 실습 예제를 풍부하게 담았다. 파이썬 소개와 기초 문법에 대한 설명을 생략하고 예제의 수를 늘렸기 때문에 파이썬 리스트, 딕셔너리 등의 자료구조와 반복문, 조건문 등의 기본 문법을 알고 있는 독자라면 이 책 한 권으로 정확하고 빠르게 실력을 향상시킬 수 있다. 책 속 예제 코드를 하나씩 실행하다 보면 파이썬 데이터 분석과 자연스럽게 가까워질 수 있을 것이다. 이 책을 통해, 데이터를 수집하고 분석하는 일을 즐기게 될 여러분을 환영한다.

SMALL


파이썬을 이용한 데이터 분석의 정석
넘파이, 판다스, 맷플롯립과 실전 예제로 배우는
채진석 (지은이)   루비페이퍼   2021-06-25

출처: 소장본

알라딘 책소개
데이터 분석을 다룬 많은 책 중 나에게 맞는 책을 찾는 건 매우 어렵다. 이론 위주의 책을 선택하면 이해하기 어렵고, 응용 위주의 책을 선택하면 기본 개념이 부족하다. 이 책은 이론을 쉽게 설명하고 예제로 응용해 보도록 구성하여 자연스럽게 데이터 분석 과정을 익힐 수 있다.

파이썬 데이터 분석에 필수로 사용되는 라이브러리를 단계적으로 다루어 데이터를 전처리하고 분석하는 능력을 갖춘다. 이 과정에서 넘파이, 판다스, 맷플롯립은 물론 연관 라이브러리까지 상세히 소개한다. 그리고 소개한 라이브러리를 종합하여 활용할 수 있는 세 가지 실전 예제를 담았다.

출판사책소개
탄탄한 개념과 실전 예제를 한 권에 담았다!
-데이터 분석의 이론과 응용을 모두 다룹니다.
데이터 분석을 다룬 많은 책 중 나에게 맞는 책을 찾는 건 매우 어렵습니다. 이론 위주의 책을 선택하면 이해하기 어렵고, 응용 위주의 책을 선택하면 기본 개념이 부족합니다. 이 책은 이론을 쉽게 설명하고 예제로 응용해 보도록 구성하여 자연스럽게 데이터 분석 과정을 익힐 수 있습니다.
-필수 라이브러리를 상세히 소개합니다.
바쁜 독자들을 위해 여러 책을 뒤적이지 않아도 되도록 기술하였습니다. 라이브러리별로 나누어 장을 구성하였고, 속성과 함수, 기능을 상세히 수록하여 필요한 내용을 사전처럼 찾아 쓸 수 있습니다. 데이터 분석의 입문자에게는 다양한 사용법을 습득할 수 있는 지침서가, 실무자에게는 새로운 응용을 위한 참고서가 될 것입니다.
-2,000여 개의 기초 예제와 3가지 실전 예제를 실습합니다.
학습자가 데이터 분석을 숙달할 수 있도록 다양한 예제를 담았습니다. 예제 코드와 결과를 바로바로 확인하여 쉽고 빠르게 이해할 수 있습니다. 또한 범죄율, 주식, 축구 경기 결과 데이터를 담은 실습 파일을 불러와 분석해 봄으로써 고도의 응용력을 키우게 됩니다.

이 책은 다음과 같이 구성되었습니다.
1장. 개발 환경 구축
앞으로 실습에 이용할 도구를 준비하는 과정을 소개합니다. 아나콘다(Anaconda)와 주피터 노트북(Jupyter Notebook)을 설치하고 주요 기능을 살펴봅니다.

2장. 파이썬 빅데이터 프로그래밍
파이썬이라는 언어의 특징을 소개하고 객체 지향 언어의 원리를 알아봅니다. 또한 주피터 노트북과 IPython 프롬프트에서 IPython의 기능과 주요 명령어를 살펴봅니다.

3장. 넘파이
데이터 배열 수식을 빠르고 수월하게 처리할 수 있는 넘파이에 대해 알아봅니다. 넘파이 배열의 기본 구조를 설명하고 넘파이 배열과 기능을 다루는 방법을 학습합니다.

4장. 판다스
빅데이터 분석과 데이터 전처리에 가장 많이 사용하는 판다스를 학습합니다. 판다스의 데이터 구조인 시리즈와 데이터프레임 가공을 연습하고 다양한 형태의 데이터를 입출력하는 방법을 알아봅니다.

5장. 판다스 고급
판다스로 불러온 데이터를 가공하고 재형성하는 기법을 다룹니다. 또한 경제적 코딩을 위한 정규 표현식과 데이터의 그룹 연산을 설명하여 데이터 활용이라는 궁극적 목적에 도달하도록 합니다.

6장. 맷플롯립
pyplot, seaborn을 이용하여 다양한 그래프를 그리고 설정해보며 데이터의 의미를 손쉽게 파악할 수 있도록 시각화하는 방법을 학습합니다.

7장. 시계열
날짜 및 시간 관련 객체와 시계열 데이터를 인덱싱하고 가공하는 방법을 알아봅니다.
판다스를 이용해 시계열 데이터를 분석하는 방법도 설명합니다.
더불어 다양한 산업 분야에서 계획을 세우고 통찰하는 방법을 학습합니다.

8장. 빅데이터 분석
1장부터 7장까지 학습한 내용을 종합해 데이터 분석을 실습합니다.
실제 데이터를 불러와서 분석하고 결과를 그래프로 표현합니다.
이를 바탕으로 산업 데이터를 분석할 능력을 갖추고, 데이터 분석에 대한 고도의 응용력을 키웁니다.

이런 분에게 이 책을 추천합니다.
-실습 위주의 책을 원하는 데이터 분석의 입문자
-참고 자료가 필요한 데이터 분석 실무자
-파이썬으로 빅데이터나 인공지능을 다루고 싶은 학습자


로지컬 씽킹(저자:데루야 하나코, 오카다 게이코)

출처 : 알라딘

데이터 분석가의 기술적인 부분 외에 기본 논리력을 기를 수 있는 방법은 없을까? 데이터 분석가에겐 파이썬, SQL 같은 하드 스킬도 중요하지만, 데이터를 논리적으로 스토리텔링 할 수 있는 소프트 스킬도 필요하다. 특히 데이터 분석 업무와 컨설팅 펌의 업무를 논리적인 구조와 흐름이 굉장히 유사한데 데이터 분석가는 데이터를 바탕으로 상대방을 논리적으로 설득해야 하는 일이 많다. 처음 논리적 사고를 어떻게 키워야 할지, 어떤 자료를 참고할지 막연하게 느껴지는데, 이 책을 읽어 보길 추천하는 현업 데이터 분석가의 추천글로 읽게 되었다.
 
‘세계 최강의 지식 상인’
맥킨지식 로지컬 씽킹의 기술을 배운다!

기획부터 지시와 회의, 보고서, 프레젠테이션, 고객 상담까지
이 책 한 권이면 복잡한 문제를 손쉽게 해결할 수 있다!

30만 부 돌파 베스트셀러!
‘논리적 커뮤니케이션’의 신화적 바이블!
로지컬 씽킹 집중 트레이닝 문제 수록!

출간 즉시 학계와 대중의 돌풍을 일으킨 책!
최고의 커뮤니케이션 전문가가 알려주는 논리적 생각의 기술!

‘현대 경영학의 창시자’로 불리는 톰 피터스(Tom Peters)는 경영컨설팅사 맥킨지앤드컴퍼니를 ‘세계 최강의 지식 상인(Knowledge Merchant)’이라고 했다. 맥킨지는 뛰어난 업무 지식을 보유한 동시에, 그 지식을 적절하게 전달하고 원하는 결과를 이끌어내는 최고의 인재 집합소로 통한다. 《로지컬 씽킹》을 집필한 데루야 하나코와 오카다 게이코는 바로 맥킨지 출신의 커뮤니케이션 전문가다. 논리적이고 알기 쉬운 메시지에는 분야와 주제를 불문하고 일정한 법칙과 포인트가 있다. 이 책에서 소개하는 ‘로지컬 씽킹(Logical Thingking)’은 메시지의 논리적 법칙성과 맥킨지가 축적해온 직원 훈련 기법을 체계화한 것이다.
특히 《로지컬 씽킹》은 우리가 작성하는 문서나 말하는 내용의 표현 방법과 논리성을 스스로 확인하고 개선하도록 기획됐다. 이런 능력은 시시각각 변화하는 환경 속에서 비즈니스맨뿐만 아니라 학생, 일반인도 사회생활과 인간관계에서 성공하기 위해 필수적으로 갖춰야 한다. 로지컬 씽킹은 ‘기술’이기 때문에 누구나 훈련을 거듭하면 충분히 습득할 수 있다.
《로지컬 씽킹》은 출간 즉시 학계와 대중 사이에서 돌풍을 일으키며 일본 아마존 경제경영서 분야 1위에 올랐고 30만 부가 판매됐다. 우리나라에서도 2002년 베스트셀러가 되었는데, 이번에 기존의 미흡했던 점을 보완하고 전문가의 감수를 거쳐 재출간됐다. (알라딘 책소개 추천글)
 
그로스 해킹(저자 양승화)

출처 ; 알라딘

 
현직 그로스 마케터가 집필하여, 대표적인 서비스 분석, 그로스 해킹, 지표 (A/B테스트, AARRR, Retention, Revenue) 외 데이터와 실험을 통해 성장하는 서비스를 만드는 방법이 소개 되어 있다.
 
서비스를 성장시키기 위해 데이터로 어떤 방법론을 활용할 수 있을까? 그로스 해킹을 입문하는 분들에게 읽기 좋다. 본인은 저자의 직강을 청취했는데 금액으로 비교하면 직강보다 도서가 1/3보다 더 저렴하니 고민해 보기 바란다.

 
데이터 문해력 (저자 : 카시와기 요시키)

출처 : 알라딘

오늘 처음 만난 상대에게 광범위하고 객관적인 주장을 합리적으로 전달할 수 있는 효과적인 도구가 바로 데이터다. 절대적인 정답이 존재하지 않을 때, 당신은 어떻게 자신이 생각하는 바를 상대에게 전달하고 이해시킬 수 있을까? 데이터에서 찾아낸 인사이트를 자신의 결론으로 이끄는 이야기로 만드는 능력이 바로 데이터 문해력이다. 목적과 문제를 올바른 데이터와 연결해서 가치 있는 결론을 낼 수 있도록 하는 사고방식과 기술을 안내한다.
"앞으로의 시대에 꼭 필요한 당신의 데이터 문해력"
왜 분석 방법이 아니라 활용 능력이 필요한가?

나완 상관없을 것 같았던 인공지능부터 시작해 데이터와 관련된 수많은 이야기가 주변에서 쏟아져 나옵니다. 모르면 뒤처지지 않을까? 하는 걱정부터 앞섭니다. 데이터 활용 능력은 지금보다 앞으로가 더 중요해질 것입니다.
통계나 분석학과 같은 학문부터 파이썬, R과 같은 프로그래밍까지, 이러한 지식이나 기술을 모른다면 정말 아무것도 할 수 없을까요? 이미 기계가 압도적으로 잘하는 일이 많은 세상입니다. 하지만, 기계가 할 수 있는 것과 할 수 없는 것이 있습니다.


오늘 처음 만난 상대에게 광범위하고 객관적인 주장을 합리적으로 전달할 수 있는 효과적인 도구가 바로 데이터입니다. 절대적인 정답이 존재하지 않을 때, 당신은 어떻게 자신이 생각하는 바를 상대에게 전달하고 이해시킬 수 있을까요? 데이터에서 찾아낸 인사이트를 자신의 결론으로 이끄는 이야기로 만드는 능력이 바로 데이터 문해력입니다.
목적과 문제를 올바른 데이터와 연결해서 가치 있는 결론을 낼 수 있도록 하는 사고방식과 기술을 안내합니다 (알라딘 책소개)
 
데이터를 잘 읽고 활용할 수 있는 방법은? 데이터 분석가에게는 기본적으로 데이터를 잘 읽을 수 있는 데이터 문해력이 중요하다. 이 책 에서는 데이터 분석을 목적 없이 단순히 데이터만 정리하고 읽을것이 아니라 목적/문제 정의 부터 올바르게 시작해야 올바른 데이터 분석 과정을 소개한다. 그래프를 읽고 활용하는 법, 목적 중심 데이터 기반 사고 방식을 미리 연습해 볼 수 있다는 현직 데이터 분석가의 추천으로 알게 된 책이다.  
 
실제 제가 읽고 정리한 내용은 아래를 참고해 주세요.
https://nesaram-health-1story.tistory.com/142

 

프로그래머를 위한 확률과 통계 (저자 : 히라오카 카즈유키, 호리 겐)

출처 : 알라딘

 
확률과 통계의 기초를 탄탄히 다질 수 있는 입문서다. 지금까지 보지 못했던 방법으로 확률과 통계에 입문해 기초 개념을 이해하고, 다룰 수 있도록 도와준다.
확률과 통계, 어렵나요? 곰곰이 생각하면 이해할 수 있습니다!
확률과 통계를 공부한다고 하면 보통 산술적으로 어떻게 계산하는지, 활용 분야에 어떻게 사용하는지를 배웁니다. 이러한 학습 방법이 오히려 더 어렵지 않았나요? 기초 없이 응용에 도전하는 것은 겉모습만 이해하려는 것과 같습니다. 들어가는 노력 대비 효과가 적지요.
이 책은 확률과 통계를 정면으로 마주하고, 현재 확률론의 토대가 되는 본격적인 견해를 제시합니다. 이 견해에 의해 확률과 통계의 여러 가지 이야기가 매우 일목요연해집니다. 잘 따라올 수 있도록 다양한 방법으로 끈질기게 설명하므로 해당 값이 무엇을 의미하는지, 이 수식은 왜 이렇게 되는지 차근차근 이해할 수 있습니다. (알라딘 책소개)
 
 
린 분석(LEAN Analytics) (저자 : 앨리스테어 크롤,벤저민 요스코비츠)

출처 : 알라딘

 
에릭 리스가 추천하는 린 스타트업 시리즈 제3탄.『린 스타트업: 실리콘밸리를 뒤흔든 IT 창업 가이드』(한빛미디어, 2012)로 사업 진행 체계를 세우고 사업에서 위험도가 가장 높은 것이 무엇인지 파악한 다음 사업을 수정하는 빠른 학습을 익혔다면, 이번에는 이 책으로 사업의 진행도를 측정하고 현재 시점에서 가장 중요한 질문을 던져 명확한 대답을 얻을 수 있다.

『린 분석』을 통해 사업 모델과 성장 단계를 결정하는 방법을 배우고 현 시점 당신의 사업에 가장 중요한 지표를 찾아 시시때때로 상황에 맞게 응용하자. 31가지의 <사례 연구>와 13가지의 <패턴>, 14가지의 <과제>를 읽고 학습하면 당신의 사업은 성공에 한 걸음 더 가까워질 것이다. (알라딘 책소개)
 
이 책은 이런 사명을 완전히 새로운 수준으로 끌어올렸다. 표면적으로 이 새로운 세계는 흥미진진하고 과감해 보인다. 혁신, 신성장동력, 제품/시장 적합성의 영광, 실패와 방향전환의 고뇌, 이 모든 것이 시선을 뗄 수 없는 한 편의 드라마다. 그러나 이 모든 일은 훨씬 더 지루한 것들, 즉 회계, 수식, 지표로 구성된 토대를 필요로 한다. 그리고 전통적인 회계 지표는 - 혁신의 불확실성에 적용하는 경우 - 놀라울 정도로 위험하다. 우리는 이런 지표를 허상 지표(vanity metrics)라고 부르는데, 이런 지표는 여러분을 잠시 비행기에 태워줄지는 모르지만 실제로는 상황을 심각하게 오도한다. 이런 지표를 피하려면 완전히 새로운 회계 방식이 필요한데, 나는 이를 '혁신 회계'라고 부른다.(알라딘 추천글)
 
진화된 마케팅 그로스 해킹(저자 : 션 엘리스,모건 브라운)

출처 : 알라딘

★ 리뷰를 남긴 미국 아마존 독자 2294명 중 2060명이 만족
(별5개 1555명, 별4개 505명, 별1개 26명 / 2023년 04월 기준, 오디오북 포함)

★ 언론에서 최고의 마케팅/비즈니스 도서 · 반드시 읽어야 할 도서로 선정
- 역대 최고의 마케팅 책 10권 – Economictimes(2023.02.21)
- 당신이 알아야 할 2021년 최고의 마케팅 도서 20선 – builtin.com(2021.05.25)
- 스타트업 필독서 10선 – Futurestartup(2021.05.23) (알라딘 책소개)
 
“하룻밤 사이에 새로운 경쟁자가 나타나고 충성스럽던 고객이 예기치 않게 변심하며, 시장이 와해를 거듭하는 점점 더 변덕이 심해지는 이런 비즈니스 환경에서 살아남기 위해서는 빠르게 성장 해법을 찾는 일이 몹시 중요하다. 『진화된 마케팅 그로스 해킹』은 기업이 시장 점유율을 빠르게 높일 수 있는 새로운 전략과 최적화 방법을 제공함으로써 속도에 대한 이런 급박한 니즈에 강력한 해법을 제시한다.”(알라딘 추천글)

데이터로 가치를 만드는 Steven, Follow on LinkedIn