참여기관 목록
강좌소개
본 강의는 Python을 활용한 비정형 데이터 분석 과정으로 WebCrawling기술과 머신러닝을 활용한 Text분석의 다양한 기법을 익힘과 활용을 목표로 한다.
실무에 적용할 수 있는 예제 포함한 학습을 통하여 빅데이터 비정형 분야의 실력을 향상할 수 있도록 한다.
[학습목표]
1. 비정형 분석에 대하여 이해하고 다양한 문제 해결에 활용할 수 있다.
2. 비정형 분석에 사용되는 지도학습 및 비지도 학습 알고리즘을 설명할 수 있다.
3. 다양한 알고리즘을 잘알고 활용하여 문제 해결을 위한에 최적의 방법을 적용할 수 있다.
[연계과목]
머신러닝 빅데이터 분석
홍보/예시 영상
[강의계획서]
1주차 텍스트 분석과 웹 스크레핑
비정형 데이터에 대하여 이해하고, WEB 서비스의 HTML 구조를 해석 및 Python을 활용하여WEB 스크래핑을 할 수 있다.
l 1차시: 텍스트 분석과 Python 활용
l 2차시: HTML 구조와 웹 스크래핑
l 3차시: 정규화 및 웹 스크래핑 실습
l 학습활동: 퀴즈
2주차 형태소 분석 및 TDM
문서 또는 기사의 토큰화를 위한 형태소 분석과, TDM을 생성 하여 활용할 수 있다.
l 1차시: 형태소 분석
l 2차시: TDM(문서 행렬)
l 3차시: 형태소 분석 및 TDM실습(실습시뮬레이션형)
l 학습활동 : 퀴즈
3주차 주제어분석
문서간의 유사도 및 군집 분석을 통한 분류를 진행 하고,주제어(Topic) 분석하여 주요 내용을 파악 할 수있다.
l 1차시: 문서 유사도 분석
l 2차시: Topic(주제) 분석
l 3차시: 문서 유사도 및 주제 분석 실습
l 학습활동: 퀴즈
4주차 머신러닝활용 감성분석
머신 러닝에 대한 이해와 감성 사전 구축 및 인공신경망 활용 감성 분석을 진행 할 수 있다.
l 1차시: 감성 사전 활용 감성 분석
l 2차시: 머신러닝 활용 감성 분석
l 3차시: 감성분석 실습(keras활용)(실습시뮬레이션형)
l 학습활동: 퀴즈
5주차 머신러닝 활용 이미지 분석
이미지 데이터에 대한 전처리 방법과 인공신경망을 활용한 이미지 분류 분석을 할 수 있다.
l 1차시: 이미지 지도 학습
l 2차시: 머신 러닝 활용 이미지 분류 실습
l 3차시: CNN 활용 실습
l 학습활동: 퀴즈
6주차 RMM (LSTM) 활용 분석
순환신경망 모형에 대하여 알고, RNN 활용 감성 분석과LSTM 활용한 언어 모형을 만들 수 있다.
l 1차시: RNN 분석
l 2차시: RNN 활용 감성 분석 실습
l 3차시: RNN 활용 언어 모형 실습
l 학습활동: 퀴즈 / 토론
7주차 워드 임베딩(Word2Vec)
워드 임베딩의 목적과 활용을 알고, Word2Vec과 Keras 활용하여 실습 할 수 있다.
l 1차시: 단어 임베딩과 Word2Vec
l 2차시: Word2Vec 실습
l 3차시: 비정형 분석 발전 동향
l 학습활동: 퀴즈 / 과제
8주차 총괄평가(시험)
[이수/평가정보]
l 퀴즈: 20%
l 과제 :30%
l 총괄평가(시험) : 50%
※ 60점 충족 시 이수증 발부
강좌 수준 및 선수요건
- 특별한 선수 요건 없음
교재 및 참고문헌
[교재]
강의자료를 PDF파일로 제공합니다.
강좌운영진
-
김민철 교수
■ 소속 : 데이터스트림즈 AI데이터센터/AI 분석그룹/그룹장/이사
■ 학력 : 국민대학교 경영대학원/빅데이터경영MBA
■ 현) NIA 플래그쉽 사업 1위(신용보증기금 컨소) 선정 기획 및 수행
■ 전) 신용보증기금 빅데이터 분석 사업 수행
■ 전) 한국체육진흥공단 인공지능을 활용한 K-Brain 사업 수행
■ E-mail : mckim@datastreams.co.kr
-
박나린 튜터
■ 소속 : 고려사이버대학교 매치업 과정 튜터
■ 학력 : 성균관대학교 통계학 석사과정
■ E-mail : annie9166@naver.com