검색결과 : 국립세종도서관
상세검색 닫기
자료유형
본문언어
출판년도 ~
정렬
상세검색 +

자료검색

검색결과

  • 홈으로
  • 검색결과
글씨 글씨 확대 글씨 축소
9가지 사례로 익히는 고급 스파크 분석 : 현실 세계 빅데이터로 배우는 데이터 과학과 머신러닝 / 지은이 : 샌디 라이자,유리 레이저슨,션 오언,조시 윌스 ;옮긴이 : 박상은,권한철,서양주
9가지 사례로 익히는 고급 스파크 분석 : 현실 세계 빅데이터로 배우는 데이터 과학과 머신러닝 책표지
  • ·표제/책임표시사항 9가지 사례로 익히는 고급 스파크 분석 : 현실 세계 빅데이터로 배우는 데이터 과학과 머신러닝 / 지은이 : 샌디 라이자,유리 레이저슨,션 오언,조시 윌스 ;옮긴이 : 박상은,권한철,서양주
  • ·판사항 2판
  • ·발행사항 서울 : 한빛미디어, 2018
  • ·형태사항 332 p. :삽화, 도표 ;24 cm
  • ·주기사항 원표제:Advanced analytics with Spark :patterns for learning from data at scale(2nd ed.)
    원저자명: Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills
    색인수록
  • ·표준번호/부호 ISBN: 9791162240526  93000: \26000 
  • ·분류기호 한국십진분류법-> 005.76  듀이십진분류법-> 006.312  
  • ·주제명 빅 데이터[big data]
권별정보 자료위치출력 관심도서 보기 관심도서 담기

※ 좌우로 스크롤하시면 내용이 보입니다.

권별정보 안내
신청 편/권차 편제 저작자 발행년도 등록번호 청구기호 자료있는 곳 자료상태 예약자 반납예정일 매체구분
지은이: 샌디 라이자,유리 레이저슨,션 오언,조시 윌스 ;옮긴이: 박상은,권한철,서양주 2018 SE0000478422 005.76-19-14 일반자료실(서고) 서고 비치(온라인 신청 후 이용) 0 - 인쇄자료(책자형) 
※ 신청 종류
- 대출예약신청:
자료상태가 ‘대출중’인 경우 해당 도서를 예약하여 도서 반납 시 우선적으로 대출받을 수 있는 서비스
- 청사대출신청:
정부세종청사(6-3동, 2-1동)에 위치한 무인예약도서대출반납기에서 도서 수령‧반납이 가능한 서비스
- 무인대출신청:
도서관 1문(정문)에 위치한 무인예약도서대출기에서 도서 수령이 가능한 서비스
- 서고자료신청:
서고에 보관된 자료에 대한 열람신청 서비스 이용방법: 로그인 → 자료검색 → [상세정보] 클릭 → 권별정보에서 자료 선택 →[서고자료신청] → 자료비치완료 문자 수신 → 해당 자료실에서 자료 수령
서가 둘러보기
서가둘러보기 로딩중

목차


목차

지은이 소개-4
옮긴이 소개-5
추천의 글-6
옮긴이의 말-8
지은이의 말-10
이 책의 구성-11
감사의 말-12

CHAPTER 1 빅데이터 분석하기
1.1 데이터 과학의 어려움-21
1.2 아파치 스파크란-23
1.3 이 책에 관하여-26
1.4 2판에 관하여-26

CHAPTER 2 스칼라와 스파크를 활용한 데이터 분석
2.1 데이터 과학자를 위한 스칼라-30
2.2 스파크 프로그래밍 모델-32
2.3 레코드 링크-32
2.4 스파크 셸과 SparkContext 시작하기-34
2.5 클러스터에서 클라이언트로 데이터 가져오기-41
2.6 클라이언트에서 클러스터로 코드 보내기-46
2.7 RDD에서 Data Frame으로-47
2.8 DataFrame API로 데이터 분석하기-51
2.9 데이터프레임에 대한 빠른 요약 통계-57
2.10 데이터프레임의 축 회전과 형태변환-59
2.11 데이터프레임을 결합하고 특징 선택하기-63
2.12 실제 환경을 위한 모델 준비하기-65
2.13 모델 평가-67
2.14 한 걸음 더 나아가기-69

CHAPTER 3 음악 추천과 Audioscrobbler 데이터셋
3.1 데이터셋-72
3.2 교차 최소 제곱 추천 알고리즘-73
3.3 데이터 준비하기-77
3.4 첫 번째 모델 만들기-82
3.5 추천 결과 추출 검사하기-86
3.6 추천 품질 평가하기-89
3.7 AUC 계산하기-91
3.8 하이퍼파라미터 선택하기-93
3.9 추천 결과 만들기-96
3.10 한 걸음 더 나아가기-98

CHAPTER 4 의사 결정 나무로 산림 식생 분포 예측하기
4.1 회귀로 돌아와서-102
4.2 벡터와 특징-102
4.3 학습 예제-104
4.4 의사 결정 나무와 랜덤 포레스트-104
4.5 Covtype 데이터셋-108
4.6 데이터 준비하기-109
4.7 첫 번째 의사 결정 나무-111
4.8 의사 결정 나무 하이퍼파라미터-119
4.9 의사 결정 나무 튜닝하기-121
4.10 범주형 특징 다시 살펴보기-126
4.11 랜덤 포레스트-129
4.12 예측하기-132
4.13 한 걸음 더 나아가기-133

CHAPTER 5 K-평균 군집화로 네트워크 이상 탐지하기
5.1 이상 탐지-136
5.2 K-평균 군집화-137
5.3 네트워크 침입-138
5.4 KDD 컵 1999 데이터셋-139
5.5 첫 번째 군집화하기-140
5.6 k 선정하기-143
5.7 R에서 시각화하기-146
5.8 특징 정규화-152
5.9 범주형 변수-154
5.10 엔트로피와 함께 레이블 활용하기-156
5.11 군집화하기-157
5.12 한 걸음 더 나아가기-160

CHAPTER 6 숨은 의미 분석으로 위키백과 이해하기
6.1 문서-단어 행렬-163
6.2 데이터 구하기-165
6.3 파싱하여 데이터 준비하기-166
6.4 표제어 추출-168
6.5 단어빈도-역문서빈도(TF-IDF) 계산하기-170
6.6 특잇값 분해-172
6.7 중요한 의미 찾기-174
6.8 낮은 차원 표현에 대한 의문과 고찰-179
6.9 단어와 단어 사이의 연관도-180
6.10 문서와 문서 사이의 연관도-183
6.11 문서와 단어 사이의 연관도-185
6.12 여러 개의 단어로 질의하기-186
6.13 한 걸음 더 나아가기-188

CHAPTER 7 그래프엑스로 동시발생 네트워크 분석하기
7.1 네트워크 분석 사례: MEDLINE의 인용 색인-191
7.2 데이터 구하기-192
7.3 스칼라 XML 라이브러리로 XML 문서 파싱하기-195
7.4 MeSH 주요 주제와 주제들의 동시발생 분석하기-198
7.5 그래프엑스로 동시발생 네트워크 구성하기-201
7.6 네트워크의 구조 이해하기-206
7.7 관련성 낮은 관계 필터링하기-212
7.8 작은 세상 네트워크-217
7.9 한 걸음 더 나아가기-226

CHAPTER 8 뉴욕 택시 운행 데이터로 위치 및 시간 데이터 분석하기
8.1 데이터 얻기-228
8.2 스파크에서 서드파티 라이브러리로 작업하기-229
8.3 지리 데이터와 Esri Geometry API, 그리고 Spray-230
8.4 뉴욕 택시 운행 데이터 준비하기-236
8.5 스파크에서 세션화 작업 수행하기-247
8.6 한 걸음 더 나아가기-252

CHAPTER 9 몬테카를로 시뮬레이션으로 금융 리스크 추정하기
9.1 전문 용어-254
9.2 VaR 계산 방법-255
9.3 우리의 모델-257
9.4 데이터 구하기-258
9.5 전처리하기-259
9.6 요인 가중치 결정하기-263
9.7 표본추출-265
9.8 실험 실행하기-270
9.9 수익 분포 시각화하기-274
9.10 결과 평가하기-275
9.11 한 걸음 더 나아가기-278

CHAPTER 10 BDG 프로젝트와 유전체학 데이터 분석하기
10.1 모델링과 저장소를 분리하기-283
10.2 ADAM CLI를 이용한 유전체학 데이터 처리-287
10.3 ENCODE 데이터로부터 전사인자 결합 부위 예측하기-296
10.4 1000 지놈 프로젝트에서 유전자형 질의하기-305
10.5 한 걸음 더 나아가기-308

CHAPTER 11 파이스파크와 썬더로 신경 영상 데이터 분석하기
11.1 파이스파크 소개-312
11.2 썬더 라이브러리 개요와 설치-316
11.3 썬더로 데이터 읽어 들이기-317
11.4 썬더로 신경 세포 유형 분류하기-324
11.5 한 걸음 더 나아가기-329

찾아보기-330