2023년도 1학기 산업경영공학특강:데이터 분석을 위한 R프로그래밍(온라인) (IMEN491R-01) 강의계획서

1. 수업정보

학수번호 IMEN491R 분반 01 학점 2.00
이수구분 전공선택 강좌유형 온라인 병행강좌 선수과목
포스테키안 핵심역량
강의시간 성적취득 구분 G

2. 강의교수 정보

이혜선 이름 이혜선 학과(전공) 산업경영공학과
이메일 주소 hyelee@postech.ac.kr Homepage http://www.postech.ac.kr/~hyelee
연구실 054-279-8222 전화 279-8222
Office Hours

3. 강의목표

R 프로그램은 통계 및 데이터분석 프로그래밍으로 전세계으로 범용적으로 사용되는 오픈소스입니다. 데이터사이언스(Data Science) 및 데이터분석(Data Analytics)에서 필수적인 프로그래밍입니다. R 프로그램은 빅데이터분석, 데이터 시각화, 공간지도분석, 인공지능, 텍스트마이닝의 툴을 갖고 있습니다. 본 강좌는 R 프로그램의 기초 스크립트부터 그래픽, 기초통계분석, 데이터마이닝, 기계학습기법을 학습하고, 실제 데이터를 이용하여 프로그램밍을 직접 수행하여 데이터 분석능력을 키우는 것을 목적으로 합니다. 실험데이터, 현업데이터 분석실습을 통해 데이터분석 역량을 키울수 있는 AI 프로그래밍 강의입니다.

전공 영역에 관계없이 수강할 수 있는 강좌로서 데이터 분석에 대한 지식과 통계 프로그램밍 기술을 익힐 수 있는 과목입니다.
(강의소개 동영상참조 https://www.youtube.com/watch?v=H9B5HZo8QNA)

4. 강의선수/수강필수사항

선수과목 없음 (전공 영역 관계없이 수강 가능)
기초통계관련과목 (공학기초통계, 실험통계학(Math231), 확률통계(Math230), 환경통계(EVSE579)) 이수후 수강하면 데이터분석결과 이해에 도움.

온라인 강의. 과제는 온라인 퀴즈형식.

5. 성적평가

★온라인퀴즈 및 과제 (매주 단원별) 30%
★중간고사(오프라인) 30%
★기말고사(오프라인) 30%
★프로젝트(온라인제출) 10%
* 시험은 데이터와 예제프로그램을 제공되며, R 프로그래밍으로 분석하여 온라인으로 입력하는 방식으로 시행
* 프로젝트는 데이터를 선택하여 2-3가지 분석기법을 적용분석한 리포트형식

6. 강의교재

도서명 저자명 출판사 출판년도 ISBN
[강의교재] 온라인강좌로서 강의자료와 프로그램코드 제공 0000

7. 참고문헌 및 자료

[참고도서]
● Roger D. Peng, Sean Kross, and Brooke Anderson, Mastering software development in R, 2017 (free web: https://bookdown.org/rdpeng/RProgDA/)
● Mastering machine learning with R, Cory Lesmeister, 3rd Edition, Packt Publishing. 2019
● 유충현, 홍성학, R을 활용한 데이터시각화, 인사이트, 2015
● 전치혁, 데이터마이닝기법과 응용, 한나래아카데미, 2012

8. 강의진도계획

(각 단원별 동영상 60분+실습100분)
1. R의 기초와 기본스크립트
-R의 소개와 설치
-RStudio레이아웃, 추가패키지
2. 벡터, 행렬의 연산
-벡터 및 행렬생성 및 연산
-객체이름정의와 데이터프레임
3. R 데이터구조(생성 및 추출)
-R 데이터불러오기 (내보내기)
-R 데이터활용, dplyr를 이용한 데이터핸들링
4. R 그래픽 기초
-히스토그램, 상자그림
-산점도, R그래픽 레이아웃
5. R 그래픽 응용
-그래픽 패키지(ggplot2)
-ggplot의 활용 및 공간지도분석
6. 데이터 탐색
-기술통계치 요약
-그래프를 이용한 데이터탐색
-정규성검정과 신뢰구간
7. R을 이용한 통계분석
-그룹간 평균비교분석
-분산분석
8. 상관분석과 회귀모형
-데이터핸들링(dplyr활용)
-상관분석, 선형회귀모형
=======중간고사=======
9. 데이터마이닝
-다중회귀분석
-데이터마이닝기초
10. k-인접기법와 판별분석
-k-인접기법
-판별분석
11. 서포트벡터머신
- 커널과 비선형커널
12. 의사결정나무
-의사결정나무
-앙상블기법(랜덤포레스트)
13. 군집분석
-군집분석과 유사성척도
-계층적 군집분석
14. 연관규칙과 로지스틱모형
-연관규칙
-로지스틱모형
15. 텍스트마이닝
16. 기말고사

9. 수업운영

온라인 강좌 : PLMS에서 수강. 각 주차별 해당강의주간에 수강학습하면 되고, 해당주간에 학습하지 않은 경우 지각 처리됩니다.

* 시험은 R 프로그래밍으로 분석하는 방법으로 시행 (기존 프로그램코드 활용)
* 프로젝트는 데이터를 선택하여 2-3가지 분석기법을 적용분석한 리포트형식

10. 학습법 소개 및 기타사항

* 온라인 [토론]방에서 언제든지 질문과 피이드백을 받을수 있습니다 (조교 혹은 강의교수)
* 챗GPT를 활용하여 코드 오류 문제해결 할 수 있습니다.
* 전체 강의는 학기말까지 언제든지 복습하면서 학습할수 있습니다.

11. 장애학생에 대한 학습지원 사항

- 수강 관련: 문자 통역(청각), 교과목 보조(발달), 노트필기(전 유형) 등

- 시험 관련: 시험시간 연장(필요시 전 유형), 시험지 확대 복사(시각) 등

- 기타 추가 요청사항 발생 시 장애학생지원센터(279-2434)로 요청