국립세종도서관

기타

상세정보
목차정보

(R로 배우는) 텍스트 마이닝 : tidytext 라이브러리를 활용하는 방법 / 줄리아 실기,데이비드 로빈슨 지음 ;박진수 옮김

(R로 배우는) 텍스트 마이닝 : tidytext 라이브러리를 활용하는 방법 책표지

·표제/책임표시사항 (R로 배우는) 텍스트 마이닝 : tidytext 라이브러리를 활용하는 방법 / 줄리아 실기,데이비드 로빈슨 지음 ;박진수 옮김
·발행사항 파주 : Jpub(제이펍), 2019
·형태사항 xix, 211 p. :삽화, 도표 ;25 cm
·주기사항 원표제:Text mining with R :a tidy approach
원저자명: Julia Silge, David Robinson
참고문헌(p. 201-202)과 색인수록
영어 원작을 한국어로 번역
·표준번호/부호 ISBN: 9791188621552 93000: \20000
·분류기호 한국십진분류법-> 004.735 듀이십진분류법-> 006.35
·주제명 텍스트 마이닝[text mining]자연 언어 처리[自然言語處理]

권별정보 자료위치출력 관심도서 보기 관심도서 담기

※ 좌우로 스크롤하시면 내용이 보입니다.

권별정보 안내
신청	편/권차	편제	저작자	발행년도	등록번호	청구기호	자료있는 곳	자료상태	예약자	반납예정일	매체구분
			줄리아 실기,데이비드 로빈슨 지음 ;박진수 옮김	2019	SE0000496873	004.735-19-3	일반자료실(서고)	서고 비치(온라인 신청 후 이용)	0	-	인쇄자료(책자형)
			줄리아 실기,데이비드 로빈슨 지음 ;박진수 옮김	2019	SE0000496874	004.735-19-3=2	일반자료실(서고)	서고 비치(온라인 신청 후 이용)	0	-	인쇄자료(책자형)

※ 신청 종류

- 대출예약신청:

자료상태가 ‘대출중’인 경우 해당 도서를 예약하여 도서 반납 시 우선적으로 대출받을 수 있는 서비스

- 청사대출신청:

정부세종청사(6-3동, 2-1동)에 위치한 무인예약도서대출반납기에서 도서 수령‧반납이 가능한 서비스

- 무인대출신청:

도서관 1문(정문)에 위치한 무인예약도서대출기에서 도서 수령이 가능한 서비스

- 서고자료신청:

서고에 보관된 자료에 대한 열람신청 서비스 이용방법: 로그인 → 자료검색 → [상세정보] 클릭 → 권별정보에서 자료 선택 →[서고자료신청] → 자료비치완료 문자 수신 → 해당 자료실에서 자료 수령

서가 둘러보기

목록보기

옮긴이 머리말-vii
이 책에 대하여-x
베타리더 후기-xviii

CHAPTER 1 정돈 텍스트(깔끔한 텍스트) 형식 1
정돈 텍스트와 다른 데이터 구조 비교하기-2
unnest_tokens 함수-3
제인 오스틴의 작품 정돈하기-6
gutenbergr 패키지-10
단어 빈도-10
요약-16

CHAPTER 2 정돈 데이터를 사용한 정서분석-17
정서 데이터셋-18
내부 조인을 사용한 정서분석-21
세 가지 정서 사전 비교-25
가장 흔한 긍정 단어와 부정 단어-28
워드 클라우드-30
단순한 단어 이상인 단위 보기-32
요약-35

CHAPTER 3 단어와 문서의 빈도 분석: tf-idf-37
제인 오스틴의 소설 속 용어빈도-38
지프의 법칙-40
bind_tf_idf 함수-44
물리학 텍스트의 말뭉치-47
요약-53

CHAPTER 4 단어 간 관계: 엔그램과 상관-55
엔그램에 의한 토큰화-56
엔그램 개수 세기와 선별하기-57
바이그램 분석-59
정서분석 시 바이그램을 사용해 문맥 제공하기-62
ggraph를 사용해 바이그램 연결망 시각화화기-65
그 밖의 텍스트에 들어 있는 바이그램 시각화하기-71
widyr 패키지와 단어 쌍 세기 및 상관-73
각 단원 간의 개수 세기 및 상관-74
쌍 단위 상관 검사-76
요약-81

CHAPTER 5 비정돈 형식 간에 변환하기-83
문서-용어 행렬 정돈하기-84
DocumentTermMatrix 객체 정돈하기-85
dfm 객체 정돈하기-89
정돈 텍스트 데이터를 행렬에 캐스팅하기-92
Corpus 객체를 메타데이터로 정돈하기-94
사례 연구: 금융 관련 기사 마이닝-97
요약-104

CHAPTER 6 토픽 모델링-105
잠재 디리클레 할당-106
단어-토픽 확률-108
문서-토픽 확률-111
예제: 대도서관 강도-113
각 장의 LDA-115
문서당 분류-118
단어별 할당: augment-121
대체 LDA 구현-125
요약-127

CHAPTER 7 사례 연구: 트위터 아카이브 비교-129
데이터 및 트위터 분포 얻기-129
단어 빈도-131
단어 용도 비교-135
단어 사용 변화-137
즐겨찾기 및 리트윗-143
요약-148

CHAPTER 8 사례 연구: NASA 메타데이터 마이닝-149
NASA가 데이터를 조직하는 방식-150
데이터 랭글링과 정돈-151
일부 초기 단순 탐사-154
단어 동시 발생과 상관-156
설명 및 제목 단어 연결망-156
중요어 연결망-159
설명 필드에 대한 tf-idf 계산-163
설명 필드 단어의 tf-idf는 무엇인가?-163
설명 필드를 중요어에 연결하기-164
토픽 모델링-166
문서-용어 행렬에 캐스팅하기-166
토픽 모델링 준비-167
토픽 모델 해석-168
토픽 모델링을 중요어와 연결하기-175
요약-178

CHAPTER 9 사례 연구: 유즈넷 텍스트 분석-179
전처리-179
텍스트 전처리-181
뉴스그룹의 단어들-183
뉴스그룹 내에서 tf-idf 찾기-184
토픽 모델링-187
정서분석-190
단어별 정서분석-191
메시지별 정서분석-194
엔그램 분석-197
요약-199

참고문헌 201
찾아보기 203

스킵네비게이션

국립세종도서관 메인화면

기타

목차

관련 사이트

소장자료 상세검색을 위한 표





본문언어
출판년도	~
정렬