북스토어 > 국내분야별도서 > 통계학

생성형 Ai 활용 데이터 분석을 위한 파이썬 기초와 응용
Detail View

X



관련상품
1 개요 Introduction 1
2 파이썬의 소개 Introduction to Python 9
2.1 파이썬의 설치 Installing Python . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.1.1 파이썬 공식 배포판 Official Python Distribution . . . . . . . . . . . . . . . . 11
2.1.2 Anaconda 통합 플랫폼 . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.1.3 추가 패키지의 설치 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.1.4 파이썬 개발 환경 Python Development Environment . . . . . . . . . . . . . . . . 17
3 파이썬 프로그래밍 기초 Python Programming Basics 21
3.1 데이터 유형 Data Type - Primitive and Container Types . . . . . . . . . . . . . . . . . . 27
3.1.1 기본 데이터 유형 Primitive Type . . . . . . . . . . . . . . . . . . . . . . . . 28
3.1.2 컨테이터 유형 Containers . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.2 제어 흐름 Control Flows . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.2.1 조건문 Conditional Statements . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.2.2 반복문 Loop Statements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.2.3 예외 처리 Exception Handling . . . . . . . . . . . . . . . . . . . . . . . . . . 80
3.3 출력 설계 Output Formatting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
3.4 함수 Functions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
3.4.1 사용자 정의 함수 User-Defined Functions . . . . . . . . . . . . . . . . . . . . 88
3.4.2 인자 전달 Passing Arguments . . . . . . . . . . . . . . . . . . . . . . . . . . 89
3.4.3 람다 표현식 Lambda Expressions . . . . . . . . . . . . . . . . . . . . . . . . . 96
3.4.4 재귀 함수 Recursive Functions . . . . . . . . . . . . . . . . . . . . . . . . . 98
3.5 표준 라이브러리 Standard Libraries . . . . . . . . . . . . . . . . . . . . . . . . . . 101
3.6 서드 파티 라이브러리 3rd Party Libraries . . . . . . . . . . . . . . . . . . . . . . . 116
4 넘파이 NumPy 121
v
차례
4.1 배열의 생성 Array Creation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
4.2 배열 선택과 변환 Array Indexing and Transformation . . . . . . . . . . . . . . . . . . . 129
4.3 유니버설 함수 Universal Functions . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
4.4 배열 집계와 고급 연산 Array Aggregation and Advanced Operations . . . . . . . . . . . . 146
4.5 난수 생성과 재배열 Random Number Generation and Shuffling . . . . . . . . . . . . . . . 153
4.5.1 확률 난수 생성 Random Variate Generation . . . . . . . . . . . . . . . . . . . . 153
4.5.2 난수 기반 재배열 Random Shuffling . . . . . . . . . . . . . . . . . . . . . . . 156
4.5.3 랜덤 샘플링 Random Sampling . . . . . . . . . . . . . . . . . . . . . . . . . . 160
5 판다스 pandas 165
5.1 데이터 구조 Data Structure: Series and DataFrame . . . . . . . . . . . . . . . . . . . . 167
5.2 인덱싱과 정렬 Indexing and Sorting . . . . . . . . . . . . . . . . . . . . . . . . . . 176
5.3 데이터 연산과 기술 통계 Data Operations and Descriptive Statistics . . . . . . . . . . . 189
5.3.1 산술 연산과 데이터 관리 Arithmetic Operations and Data Management . . . . . . . 189
5.3.2 기술 통계 메서드 Descriptive Statistics Methods . . . . . . . . . . . . . . . . 195
5.3.3 응용 사례 Application Examples . . . . . . . . . . . . . . . . . . . . . . . . . 199
5.4 데이터 불러오기 Loading Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
5.4.1 CSV 포맷 Comma Separated Values . . . . . . . . . . . . . . . . . . . . . . . . . 213
5.4.2 Excel 파일 포맷 Excel Formats . . . . . . . . . . . . . . . . . . . . . . . . . 219
5.4.3 JSON 포맷 JavaScript Object Notation . . . . . . . . . . . . . . . . . . . . . . 224
5.5 데이터 랭글링 Data Wrangling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235
5.5.1 데이터 클리닝 Data Cleaning . . . . . . . . . . . . . . . . . . . . . . . . . . 236
5.6 데이터 결합과 재구조화 Data Combination and Reshaping . . . . . . . . . . . . . . . . . 243
5.6.1 병합 Merge Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244
5.6.2 조합 대체 Combination and Replacement . . . . . . . . . . . . . . . . . . . . . . 255
5.6.3 결합 Concatenation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257
5.6.4 변형 Reshaping Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
5.6.5 열의 분해와 결합 Splitting and Combining Columns . . . . . . . . . . . . . . . . 268
5.7 그룹 연산과 집계 Group Operations and Aggregation . . . . . . . . . . . . . . . . . . . 270
5.7.1 그룹 분리와 선택 Group Splitting and Selection . . . . . . . . . . . . . . . . . 271
5.7.2 함수 적용과 결합 Apply and Combine . . . . . . . . . . . . . . . . . . . . . . 278
5.7.3 이산화와 가변수 생성 Discretization and Dummy Coding . . . . . . . . . . . . . 292
5.8 그래프 생성 Graphing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306
6 맷플롯립 Matplotlib 313
vi
차례 vii
6.1 플롯 생성과 배치 Plot Creation and Layout . . . . . . . . . . . . . . . . . . . . . . . 316
6.2 플로팅 메서드 Plot Functions and Axes Methods . . . . . . . . . . . . . . . . . . . . . 329
6.3 플롯의 저장 Saving Figures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335
7 시본 Seaborn 337
7.1 기본 구조와 스타일 Basics of Seaborn: Structure, Plots, and Styles . . . . . . . . . . . 338
7.2 데이터 분석 시각화 도구 Visualization Tools in Data Analysis . . . . . . . . . . . . . 344
7.2.1 선 그림과 요약점 그림 lineplot and pointplot . . . . . . . . . . . . . . . . . 348
7.2.2 빈도 막대 그림 countplot과 막대 그림 barplot . . . . . . . . . . . . . . . . . 353
7.2.3 원 그림 pie chart . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 360
7.2.4 히스토그램 histogram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 361
7.2.5 산점도 scatterplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 368
7.2.6 쌍별 산점도와 결합 분포도 pairplot and jointplot . . . . . . . . . . . . . . . 371
7.2.7 히트맵 heatmap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 378
7.3 [참고] 시각화를 위한 고급 설정 . . . . . . . . . . . . . . . . . . . . . . . . . . . 385
불과 몇년 전에 디지털 전환(Digital Transformation, DX)이라는 새로운 패러다임이 산
업과 사회 전반에서 획기적인 변화를 촉발하였습니다. 최근에는 여기에 생성형 AI(Generative
AI)의 급격한 발전이 더해지면서, 우리는 그 속도와 영향력에서 전례 없는 패러다임 전환을 경험
하고 있습니다.
생성형 AI는 방대한 데이터 처리 능력에 기반하고 있습니다. 이는 기존의 데이터 분석 범위
를 넘어 text, image, speech, code 등 다양한 형태의 데이터를 이해하고 처리하여, 지금까지
경험하지 못했던 결과물을 만들어내고 있습니다. 쉽게 말해, 데이터 활용의 폭과 깊이가 상상할
수 없는 영역으로 확장되고 있는 것입니다. 이러한 시대에 요구되는 핵심 역량은 데이터 리터러
시와 통계학에 기초한 데이터 과학을 이해하고, 이를 프로그래밍과 알고리즘적 사고로 연결하는
능력입니다.
이 책은 데이터 과학과 실무 프로젝트 실행에 꼭 필요한 Python의 기초와 응용 방법을 가능한
한 간결하게 정리한 것입니다. 이러한 내용이 중요한 이유는, 생성형 AI가 코드를 대신 작성해
주더라도, 그 결과를 올바르게 해석하고 목적에 맞게 수정하여 응용하기 위해서는 기초와 응용에
대한 이해가 전제되어야 하기 때문입니다. 각 단원은 데이터 분석을 위한 프로그래밍의 관점에서
꼭 필요한 개념과 예제를 담고 있으며, 일부 단원에서는 생성형 AI 플랫폼인 ChatGPT 를 효과적으
로 활용할 수 있도록 프롬프트(prompt) 템플릿을 예시로 포함하였습니다. 이를 참고하여 추가
적인 프로그래밍 방법이나 예제를 생성형 AI에게 질문하고, 그 답변을 체계적으로 정리함으로써
새로운 학습 방법을 경험할 수 있기를 기대합니다.
수업 활용 측면에서는 통계학과 2학년 또는 3학년 수준의 한 학기 강의 교재로 사용하거나
데이터 분석 과목의 보조 교재로 적합하다고 생각합니다. 또한 현업 데이터 분석가의 역량 강
화를 위한 세미나 교재로 사용한다면, 각 단원을 별도로 진행하되 실무적으로 유용한 pandas와
seaborn 장을 사례와 함께 다룬다면 약 8–10회 정도의 세미나가 적절하지 않을까 생각합니다.
끝으로, 이 책에서 제공하는 예제 코드는 반드시 직접 입력해 보기를 권합니다. 스스로 타이핑
해 보지 않은 코드는 학습 효과가 떨어지고, 실제 활용 능력으로 연결되기 어렵기 때문입니다.
몇가지 기호를 구분하였습니다.
- 는 개념과 구조의 이해를 위한 중요 내용입니다.
- 는 활용 상의 참고 내용입니다.
- 는 프로그래밍 핵심 도구입니다.
- k 는 핵심 도구 중에서 중요한 것을 선별한 것입니다.
- 는 초보자가 자주 만나는 문제 또는 응용할 때 유용한 내용을 구분한 것입니다.
- 예제입니다. 간단한 예제의 경우, 결과를 함께 제시하여 학습의 속도를 높이
고자 하였습니다.
- 주의해야 할 사항이나 혼동이 자주 발생하는 경우를 제시한 것입니다.
매번 느끼는 것이지만, 책을 적는다는 것은 긴 시간 동안의 극심한 노동을 요구하는 작업입니
다. 예전의 경험에 비추어 보았을 때, 이러한 노력 끝에 출간된 책이라 하더라도 여전히 부족한
점과 뜻하지 않은 실수가 존재할 수 있습니다. 이는 앞으로 꾸준히 보완해 갈 것임을 약속드립니
다. 아울러 최종본 검토를 위해 바쁜 시간을 내어 주신 LG 전자(주) 박현진 책임, 흔쾌히 출판을
허락해 주신 교우사 오판근 사장님 그리고 출판 과정에 함께해 주신 모든 관계자분들께 깊이 감
사드립니다.
2025년 6월
저자 고승곤
고승곤
현) 가천대학교 응용통계학과 교수
미) lowa State University,통계학 박사
반품/교환 안내
상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다.(업체 사정에 따라 달라질 수 있습니다.
반품/교환 방법 |
홈 > 고객센터 > FAQ "반품/교환/환불" 안내 참고 또는 전화문의 |
반품/교환 가능기간 |
반품가능기간은 배송을 받으시고 7일안에 해주셔야 가능하며, 반품 도서 상태 확인 후 주문건에 대한 취소 및 환불처리가 진행됩니다. |
반품/교환 비용 | 변심 혹은 구매착오의 경우에만 반송료 고객 부담 (별도 지정 택배사 없음) |
반품/교환 불가사유 |
▪ 소비자의 책임 사유로 상품 등이 손실 또는 훼손된 경우 ▪ 소비자의 사용, 도서의 랩핑(포장) 개봉에 의해 상품 등의 가치가 현저히 감소한 경우 (상품 포장을 개봉했을 경우 반품/교환이 되지 않습니다.)
|
A/S 안내 | ▪ 상품의 불량에 의한 반품, 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자 분쟁해결기준 (공정거래위원회고시)에 준하여 처리됨 ▪ 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함 |
구매 후기more +

수화통역의 기초
이벤트more +

CUSTOMER SERVICE CENTER
고객센터
02-925-2861
상담시간 : Am 10 : 00 ~ Pm 16 : 00
(토, 일, 공휴일 휴무)
점심시간 : Pm 12 : 00 ~ Pm 13 : 00



