2025년도 1학기 특강: 데이터 분석을 위한 R프로그래밍(온라인) (IMEN491R-01) 강의계획서

1. 수업정보

학수번호 IMEN491R 분반 01 학점 2.00
이수구분 전공선택 강좌유형 선수과목
포스테키안 핵심역량
강의시간 금 / 14:00 ~ 15:40 / 성적취득 구분 G

2. 강의교수 정보

이혜선 이름 이혜선 학과(전공) 산업경영공학과
이메일 주소 hyelee@postech.ac.kr Homepage
연구실 전화 054-279-8222
Office Hours

3. 강의목표

R 프로그램은 통계 및 데이터분석 프로그래밍으로 범용적으로 사용되는 오픈소스입니다. 데이터사이언스, 데이터애널리틱스를 위한 필수적인 프로그래밍입니다. R 프로그램은 빅데이터분석, 데이터 시각화, 공간지도분석, 인공지능, 텍스트마이닝의 툴을 갖고 있습니다. 본 강좌는 R 프로그램의 기초 스크립트부터 그래픽, 기초통계분석, 데이터마이닝, 기계학습기법을 학습하고, 실제 데이터를 이용하여 프로그램밍을 직접 수행하여 데이터 분석능력을 키우는 것을 목적으로 합니다. 실험데이터, 현업데이터 분석을 통해 데이터분석 역량을 키울수 있는 AI 프로그래밍 강의입니다. .

전공 영역에 관계없이 수강할 수 있는 강좌로서 데이터 분석에 대한 지식과 통계 프로그램밍 기술을 익힐 수 있는 과목입니다.
(강의소개 동영상 : https://www.youtube.com/watch?v=lLAWOhTF_Gw)

4. 강의선수/수강필수사항

데이터분석 프로그래밍에 관심있는 학생은 전공 영역 관계없이 수강 가능, 선수과목 없음.
기초통계관련과목: 공학기초통계(IMEN272), 실험통계학(Math231), 확률통계(Math230)), 환경통계(EVSE579) 이수후 수강하면 이해가 쉬움. 통계적데이터마이닝(IMEN472)외 관련강의 동시 수강 추천.

5. 성적평가

온라인퀴즈 및 과제 (매주 단원별) 30%
중간고사(오프라인) 30%
기말고사(오프라인) 30%
프로젝트(온라인제출) 10%
* 시험은 데이터와 예제프로그램을 제공되며, R 프로그래밍으로 분석하는 방법으로 시행
* 프로젝트는 데이터를 선택하여 2-3가지 분석기법을 적용 분석한 리포트형식

6. 강의교재

도서명 저자명 출판사 출판년도 ISBN
[강의교재] 온라인강좌로서 강의자료와 프로그램코드 제공 0000

7. 참고문헌 및 자료

[강의교재] 온라인강좌로서 강의자료와 프로그램코드 제공
[참고도서]
● Roger D. Peng, Sean Kross, and Brooke Anderson, Mastering software development in R, 2017 (free web: https://bookdown.org/rdpeng/RProgDA/)
● Mastering machine learning with R, Cory Lesmeister, 3rd Edition, Packt Publishing. 2019
● 전치혁,이혜선,이영록,이종석, 데이터마이닝의 원리와 구현, 자유아카데미, 2024
● 유충현, 홍성학, R을 활용한 데이터시각화, 인사이트, 2015

8. 강의진도계획

강의진도계획 (각 단원별 동영상 60분+실습100분 )

1주차
R의 기초와 기본스크립트
R의 소개와 설치
RStudio레이아웃, 추가패키지

2주차
벡터, 행렬의 연산
벡터 및 행렬생성 및 연산
객체이름정의와 데이터프레임

3주차
데이터구조(생성 및 추출)
R 데이터불러오기 (내보내기)
데이터 subset 만들기
데이터 핸들링

4주차
데이터시각화
히스토그램, 상자그림
산점도, 공간지도분석

5주차
데이터 탐색
기술통계치 요약
그래프를 이용한 데이터탐색
정규성검정과 신뢰구간

6주차
R을 이용한 통계분석
그룹간 평균비교분석
분산분석(ANOVA)

7주차
상관분석과 회귀모형
상관분석, 단순회귀모형
회귀분석의 진단과 평가

8주차
중간고사
offline

9주차
데이터마이닝 기초
다중회귀분석
데이터마이닝(훈련/학습데이터, 과적합)

10주차
k-인접기법와 판별분석
k-인접기법
판별분석

11주차
서포트벡터머신
서포트벡터머신
선형/비선형 커널함수

12주차
의사결정나무
의사결정나무
앙상블기법(랜덤포레스트)

13주차
군집분석
군집분석의 개념
유사성척도
계층적 군집분석

14주차
연관규칙과 로지스틱모형
연관규칙
로지스틱모형

15주차
텍스트마이닝
텍스트마이닝, 크롤링, 워드클라우드

16주차
기말고사
offline

9. 수업운영

온라인 강좌 : PLMS에서 수강. 각 주차별 해당 강의주간에 수강 학습하면 되고, 해당 주간에 학습하지 않은 경우 지각 처리됩니다.

* 시험은 R 프로그래밍으로 분석하는 방법으로 시행 (기존 프로그램코드 활용)
* 프로젝트는 데이터를 선택하여 2-3가지 분석기법을 적용분석한 리포트형식

10. 학습법 소개 및 기타사항

* 온라인강의는 주차별로 오픈되며, 온라인강의의 유연성있는 학습시간을 위하여 학습과 과제문제(퀴즈형식)풀이는 2주간의 학습시간을 허용합니다. (예) 1주차 과제풀이는 2주차 금요일까지가 due date, 2주차 과제풀이는 3주차 금요일까지가 due date.

* 중간고사 실시전까지 이전 주차 학습을 완료해야 하며, 기말고사 이전까지 그 이전 학습을 완료해야합니다.

* [Q & A] 온라인 질문은 (24시간 이내) 피이드백을 받을수 있습니다 (조교 혹은 강의교수)

* 전체 강의는 학기말까지 언제든지 복습하면서 학습할 수 있습니다.

* 챗GPT를 활용하여 코드 오류 문제해결 할 수 있습니다.

11. 장애학생에 대한 학습지원 사항

- 수강 관련: 문자 통역(청각), 교과목 보조(발달), 노트필기(전 유형) 등

- 시험 관련: 시험시간 연장(필요시 전 유형), 시험지 확대 복사(시각) 등

- 기타 추가 요청사항 발생 시 장애학생지원센터(279-2434)로 요청