국립세종도서관
상세검색 닫기
자료유형
본문언어
출판년도 ~
정렬
상세검색 +

기타

  • 홈으로
글씨 글씨 확대 글씨 축소
(R로 배우는) 텍스트 마이닝 : tidytext 라이브러리를 활용하는 방법 / 줄리아 실기,데이비드 로빈슨 지음 ;박진수 옮김
(R로 배우는) 텍스트 마이닝 : tidytext 라이브러리를 활용하는 방법 책표지
  • ·표제/책임표시사항 (R로 배우는) 텍스트 마이닝 : tidytext 라이브러리를 활용하는 방법 / 줄리아 실기,데이비드 로빈슨 지음 ;박진수 옮김
  • ·발행사항 파주 : Jpub(제이펍), 2019
  • ·형태사항 xix, 211 p. :삽화, 도표 ;25 cm
  • ·주기사항 원표제:Text mining with R :a tidy approach
    원저자명: Julia Silge, David Robinson
    참고문헌(p. 201-202)과 색인수록
    영어 원작을 한국어로 번역
  • ·표준번호/부호 ISBN: 9791188621552  93000: \20000 
  • ·분류기호 한국십진분류법-> 004.735  듀이십진분류법-> 006.35  
  • ·주제명 텍스트 마이닝[text mining]자연 언어 처리[自然言語處理]
권별정보 자료위치출력 관심도서 보기 관심도서 담기

※ 좌우로 스크롤하시면 내용이 보입니다.

권별정보 안내
신청 편/권차 편제 저작자 발행년도 등록번호 청구기호 자료있는 곳 자료상태 예약자 반납예정일 매체구분
줄리아 실기,데이비드 로빈슨 지음 ;박진수 옮김 2019 SE0000496873 004.735-19-3 일반자료실(서고) 서고 비치(온라인 신청 후 이용) 0 - 인쇄자료(책자형) 
줄리아 실기,데이비드 로빈슨 지음 ;박진수 옮김 2019 SE0000496874 004.735-19-3=2 일반자료실(서고) 서고 비치(온라인 신청 후 이용) 0 - 인쇄자료(책자형) 
※ 신청 종류
- 대출예약신청:
자료상태가 ‘대출중’인 경우 해당 도서를 예약하여 도서 반납 시 우선적으로 대출받을 수 있는 서비스
- 청사대출신청:
정부세종청사(6-3동, 2-1동)에 위치한 무인예약도서대출반납기에서 도서 수령‧반납이 가능한 서비스
- 무인대출신청:
도서관 1문(정문)에 위치한 무인예약도서대출기에서 도서 수령이 가능한 서비스
- 서고자료신청:
서고에 보관된 자료에 대한 열람신청 서비스 이용방법: 로그인 → 자료검색 → [상세정보] 클릭 → 권별정보에서 자료 선택 →[서고자료신청] → 자료비치완료 문자 수신 → 해당 자료실에서 자료 수령
서가 둘러보기
서가둘러보기 로딩중

목차


옮긴이 머리말-vii
이 책에 대하여-x
베타리더 후기-xviii

CHAPTER 1 정돈 텍스트(깔끔한 텍스트) 형식 1 
정돈 텍스트와 다른 데이터 구조 비교하기-2 
unnest_tokens 함수-3 
제인 오스틴의 작품 정돈하기-6 
gutenbergr 패키지-10 
단어 빈도-10 
요약-16 

CHAPTER 2 정돈 데이터를 사용한 정서분석-17 
정서 데이터셋-18 
내부 조인을 사용한 정서분석-21 
세 가지 정서 사전 비교-25 
가장 흔한 긍정 단어와 부정 단어-28 
워드 클라우드-30 
단순한 단어 이상인 단위 보기-32 
요약-35 

CHAPTER 3 단어와 문서의 빈도 분석: tf-idf-37 
제인 오스틴의 소설 속 용어빈도-38 
지프의 법칙-40 
bind_tf_idf 함수-44 
물리학 텍스트의 말뭉치-47 
요약-53 

CHAPTER 4 단어 간 관계: 엔그램과 상관-55 
엔그램에 의한 토큰화-56 
엔그램 개수 세기와 선별하기-57 
바이그램 분석-59 
정서분석 시 바이그램을 사용해 문맥 제공하기-62 
ggraph를 사용해 바이그램 연결망 시각화화기-65 
그 밖의 텍스트에 들어 있는 바이그램 시각화하기-71 
widyr 패키지와 단어 쌍 세기 및 상관-73 
각 단원 간의 개수 세기 및 상관-74 
쌍 단위 상관 검사-76 
요약-81 

CHAPTER 5 비정돈 형식 간에 변환하기-83 
문서-용어 행렬 정돈하기-84 
DocumentTermMatrix 객체 정돈하기-85 
dfm 객체 정돈하기-89 
정돈 텍스트 데이터를 행렬에 캐스팅하기-92 
Corpus 객체를 메타데이터로 정돈하기-94 
사례 연구: 금융 관련 기사 마이닝-97 
요약-104 

CHAPTER 6 토픽 모델링-105 
잠재 디리클레 할당-106 
단어-토픽 확률-108 
문서-토픽 확률-111 
예제: 대도서관 강도-113 
각 장의 LDA-115 
문서당 분류-118 
단어별 할당: augment-121 
대체 LDA 구현-125 
요약-127 

CHAPTER 7 사례 연구: 트위터 아카이브 비교-129 
데이터 및 트위터 분포 얻기-129 
단어 빈도-131 
단어 용도 비교-135 
단어 사용 변화-137 
즐겨찾기 및 리트윗-143 
요약-148 

CHAPTER 8 사례 연구: NASA 메타데이터 마이닝-149 
NASA가 데이터를 조직하는 방식-150 
데이터 랭글링과 정돈-151 
일부 초기 단순 탐사-154 
단어 동시 발생과 상관-156 
설명 및 제목 단어 연결망-156 
중요어 연결망-159 
설명 필드에 대한 tf-idf 계산-163 
설명 필드 단어의 tf-idf는 무엇인가?-163 
설명 필드를 중요어에 연결하기-164 
토픽 모델링-166 
문서-용어 행렬에 캐스팅하기-166 
토픽 모델링 준비-167 
토픽 모델 해석-168 
토픽 모델링을 중요어와 연결하기-175 
요약-178 

CHAPTER 9 사례 연구: 유즈넷 텍스트 분석-179 
전처리-179 
텍스트 전처리-181 
뉴스그룹의 단어들-183 
뉴스그룹 내에서 tf-idf 찾기-184 
토픽 모델링-187 
정서분석-190 
단어별 정서분석-191 
메시지별 정서분석-194 
엔그램 분석-197 
요약-199 

참고문헌 201 
찾아보기 203