1899-8139 오전 10:00~ 오후 06:00 점심시간 : 오후1시~오후2시 토/일요일, 공휴일 휴무 469901-04-360773 예금주 : 하이퍼융합인재교육원

전체강좌

 > 전체강좌 > 강의실

강좌명 [HD]쉽게 배우는 텍스트 마이닝(Text Mining) Part.2 영어를 위한 NLTK 1
담당강사 김동준 수강기간 30일
강의구성 총 20강좌 수강료 50,000원(VAT포함)
강의형식 동영상 즐겨찾기
증명서 미수강
참고사항 등록후 확인 가능합니다.
※ wmv플레이어는 호환성 관련하여 더이상 플레이어 업데이트지원을 하지 않습니다.
※ mp4방식의 Player2를 권장합니다.
1 강의개요 및 권장 학습순서와 NLTK 설치하기..
2 corpus(말뭉치)란 무엇인가..
3 nltk gutenberg corpus 다운로드 및 텍스트 내용 출력하기..
4 nltk gutenberg corpus 여러가지 값 출력..
5 nltk tokenization - sent_tokenize..
6 word_tokeniz() 함수를 사용한 토큰화 vs gutenberg.words() 함수를 사용한 토큰화 비교..
7 각 토큰당 평균 문자 수..
8 브라운 코퍼스를 활용한 여러가지 메서드(1)..
9 브라운 코퍼스를 활용한 여러가지 메서드(2) 및 FreqDist 함수 사용법..
10 FreqDist() 함수로 단어 빈도 수 체크시 대소문자 문제..
11 특정 단어의 빈도 수 체크..
12 특정 단어의 빈도 수 체크 - list comprehension 사용..
13 세익스피어는 비극 햄릿을 쓸 때 한 문장당 평균 몇개의 단어를 사용해서 썼을까 - 기초학습..
14 전부 소문자로 바꾼 후 중복되는 것 없이 단어 수 체크..
15 세익스피어는 비극 햄릿을 쓸 때 한 문장당 평균 몇개의 단어를 사용해서 썼을까 - 최종 통계 구하기..
16 브라운 코퍼스 장르별 원하는 단어 수 세기 - ConditionalFreqDist() 사용법..
17 cfd 출력시 pair로 구성해서 출력하기..
18 브라운 코퍼스 카테고리별 단어 수 체크시 배열 변수 만들어서 이중 for문으로 구성하기..
19 n-gram이란 무엇이고 bigram, trigram 등이 검색 예측에 어떻게 활용되어지는가..
20 nltk 패키지내 ngrams를 활용하여 bigram, trigram 구하기 실습..