국립세종도서관
상세검색 닫기
자료유형
본문언어
출판년도 ~
정렬
상세검색 +

기타

  • 홈으로
글씨 글씨 확대 글씨 축소
(파이썬으로 배우는) 응용 텍스트 분석 : 언어 인식 데이터 제품 개발을 위한 머신러닝 / 벤자민 벵포트,레베카 빌브로,토니 오제다 지음 ;박진수 옮김
(파이썬으로 배우는) 응용 텍스트 분석 : 언어 인식 데이터 제품 개발을 위한 머신러닝 책표지
  • ·표제/책임표시사항 (파이썬으로 배우는) 응용 텍스트 분석 : 언어 인식 데이터 제품 개발을 위한 머신러닝 / 벤자민 벵포트,레베카 빌브로,토니 오제다 지음 ;박진수 옮김
  • ·발행사항 파주 : Jpub(제이펍), 2019
  • ·형태사항 xxx, 362 p. :삽화, 도표 ;25 cm
  • ·총서사항 (제이펍의 인공지능 시리즈 ;20)
  • ·주기사항 원표제:Applied text analysis with Python :enabling language-aware data products with machine learning
    원저자명: Benjamin Bengfort, Tony Ojeda, Rebecca Bilbro
    색인수록
    영어 원작을 한국어로 번역
  • ·표준번호/부호 ISBN: 9791188621774  93000: \27000 
  • ·분류기호 한국십진분류법-> 004.735  듀이십진분류법-> 006.35  
  • ·주제명 텍스트 마이닝[text mining]자연 언어[自然言語]파이썬[Python]
권별정보 자료위치출력 관심도서 보기 관심도서 담기

※ 좌우로 스크롤하시면 내용이 보입니다.

권별정보 안내
신청 편/권차 편제 저작자 발행년도 등록번호 청구기호 자료있는 곳 자료상태 예약자 반납예정일 매체구분
벤자민 벵포트,레베카 빌브로,토니 오제다 지음 ;박진수 옮김 2019 SE0000477341 004.735-19-2 일반자료실(서고) 서고 비치(온라인 신청 후 이용) 0 - 인쇄자료(책자형) 
※ 신청 종류
- 대출예약신청:
자료상태가 ‘대출중’인 경우 해당 도서를 예약하여 도서 반납 시 우선적으로 대출받을 수 있는 서비스
- 청사대출신청:
정부세종청사(6-3동, 2-1동)에 위치한 무인예약도서대출반납기에서 도서 수령‧반납이 가능한 서비스
- 무인대출신청:
도서관 1문(정문)에 위치한 무인예약도서대출기에서 도서 수령이 가능한 서비스
- 서고자료신청:
서고에 보관된 자료에 대한 열람신청 서비스 이용방법: 로그인 → 자료검색 → [상세정보] 클릭 → 권별정보에서 자료 선택 →[서고자료신청] → 자료비치완료 문자 수신 → 해당 자료실에서 자료 수령
서가 둘러보기
서가둘러보기 로딩중

목차


목차

CHAPTER 01 언어와 계산-1
데이터 과학 패러다임-2
언어 인식 데이터 제품-4
  데이터 제품 파이프라인-6
데이터로서의 언어-9
  언어의 계산 모델-10
  언어 자질-11
  맥락 자질-15
  구조적 자질-17
결론-20

CHAPTER 02 사용자 정의 말뭉치 구축-21
말뭉치란 무엇인가?-22
  영역 특정 말뭉치-22
  Baleen 수집 엔진-23
말뭉치 데이터 관리-25
  말뭉치 디스크 구조-27
말뭉치 리더-30
  NLTK를 사용한 스트리밍 데이터 액세스-32
  HTML 말뭉치 읽기-34
  데이터베이스에서 말뭉치 읽기-38
결론-40

CHAPTER 03 말뭉치의 전처리와 가공-41
문서 쪼개 보기-42
  핵심 내용 식별 및 추출-42
  문서를 단락별로 나누기-44
  분할: 문장별로 나누기-46
  토큰화: 개별 토큰 식별-48
  품사 태깅-49
  중간 말뭉치 분석론-50
말뭉치 변환-52
  중간 전처리 및 저장-52
  처리된 말뭉치 읽기-56
결론-58

CHAPTER 04 텍스트 벡터화와 변환 파이프라인-59
공간 내 단어-61
  빈도 벡터-62
  원핫 인코딩-64
  용어빈도-역문서빈도-67
  분산 표현-71
사이킷런 API-74
  BaseEstimator 인터페이스-74
  TransformerMixin 확장-76
파이프라인-81
  파이프라인의 기초-81
  하이퍼파라미터 최적화를 위한 격자 검색-83
  특징결합을 사용한 특징추출 강화-84
결론-86

CHAPTER 05 텍스트 분석을 위한 분류-89
텍스트 분류-90
  분류 문제 식별-91
  분류기 모델-92
텍스트 분류 애플리케이션 만들기-94
  교차검증-94
  모델 구성-98
  모델 평가-100
결론-105

CHAPTER 06 텍스트 유사성을 위한 군집화-107
텍스트에 대한 비지도학습-108
문서 유사성에 의한 군집화-109
  거리 계량-110
  부분 군집화-112
  위계적 군집화-118
문서 토픽 모델링-122
  잠재 디리클레 할당-122
  잠재 의미 분석-130
  음이 아닌 행렬 인수분해-133
결론-134

CHAPTER 07 문맥 인식 텍스트 분석-137
문법 기반 특징추출-138
  문맥 자유 문법-139
  구문론적 구문분석기-139
  키프레이즈 추출-141
  엔터티 추출-144
엔그램 특징추출-145
  엔그램 인식 CorpusReader-147
  올바른 엔그램 창 선택하기-149
  유의한 병치-150
엔그램 언어 모델-153
  빈도 및 조건부 빈도-154
  최대 가능도 추정-157
  알 수 없는 단어: 백오프 및 평활화-160
  언어 생성-163
결론-164

CHAPTER 08 텍스트 시각화-167
특징공간 시각화-168
  시각적 특징분석-168
  유도된 특징공학-179
모델 진단-187
  군집 시각화-188
  계급 시각화-190
  분류 오차 진단-191
시각적 조향-195
  실루엣 점수 및 엘보 곡선-195
결론-198

CHAPTER 09 텍스트의 그래프 분석-201
그래프 계산 및 분석-203
  그래프 기반 시소러스 만들기-203
  그래프 구조 분석-205
  그래프의 시각적 분석-206
텍스트에서 그래프 추출하기-207
  소셜 그래프 만들기-208
  소셜 그래프에서 통찰력 얻기-211
엔터티 분해-219
  그래프상의 엔터티 분해-220
  구조로 차단하기-221
  퍼지 차단-221
결론-224

CHAPTER 10 챗봇-227
대화의 기초-228
  대화: 간략한 의견 교환-230
  대화 유지-233
예의바른 대화 규칙-236
  인사와 경례-236
  의사불통 다루기-241
재미있는 질문-244
  의존 구문분석-245
  구 구조 분석-246
  질문 검출-249
  스푼에서 그램으로-251
도움을 위한 학습-256
  이웃이 되기-257
  추천 정보 제공-260
결론-263

CHAPTER 11 멀티프로세싱과 스파크를 사용한 텍스트 분석론 확장-265
파이썬 멀티프로세싱-266
  병렬로 작업 실행-269
  프로세스 풀 및 큐-274
  병렬 말뭉치 전처리-276
스파크를 사용한 클러스터 컴퓨팅-278
  스파크 작업의 해부학-278
  말뭉치 배포-280
  RDD 운영-282
  스파크를 이용한 자연어 처리-284
결론-296

CHAPTER-12 딥러닝과 그 이후-299
응용 신경망-300
신경 언어 모델-300
  인공 신경망-301
  딥러닝 아키텍처-306
정서 분석-311
  심층 구조 분석-313
미래가 바로 눈앞에-318

용어 해설-321
찾아보기-338