데이터사이언스를 위한 통계학입문 2: Ⅷ. 회귀분석을 이용한 예측모형
POSTECH에서 제공하는 MOOC 중, 데이터사이언스를 위한 통계학입문 Ⅱ 과정입니다. Ⅷ. 회귀분석을 이용한 예측모형1. 선형모형의 특성과 상관분석데이터의 상관관계 데이터 탐색: 변수 간 관계 변수 간 상관관계 여부 상관관계 형태 상관계수(Pearson’s) 상관계수(correlation coefficient) 두 변수 간 선형관계의 강도를 나
POSTECH에서 제공하는 MOOC 중, 데이터사이언스를 위한 통계학입문 Ⅱ 과정입니다. Ⅷ. 회귀분석을 이용한 예측모형1. 선형모형의 특성과 상관분석데이터의 상관관계 데이터 탐색: 변수 간 관계 변수 간 상관관계 여부 상관관계 형태 상관계수(Pearson’s) 상관계수(correlation coefficient) 두 변수 간 선형관계의 강도를 나
POSTECH에서 제공하는 MOOC 중, 데이터사이언스를 위한 통계학입문 Ⅱ 과정입니다. Ⅶ. 빅데이터 차원축소와 예측모형1. 데이터 탐색과 정제데이터 탐색 Basic Information: 분포, 평균, 최솟값, 최댓값, 분산 등 Variation: 변동성, 시계열 Outlier: 모든 데이터가 상식적인 범위 안에 존재하는가? Correlation:
POSTECH에서 제공하는 MOOC 중, 데이터사이언스를 위한 통계학입문 Ⅱ 과정입니다. Ⅵ. 현업 데이터 특성과 예측모형1. 데이터 수집- random의 의미데이터 수집 데이터 수집에서는 양질의 데이터를 확보하는 것이 중요 나쁜 데이터로는 나쁜 모델밖에 만들 수 없음 ‘대표성’, ‘랜덤’ 데이터 데이터 수집_표본 추출 좋은 표본: 모집단의 특성을
POSTECH에서 제공하는 MOOC 중, 데이터사이언스를 위한 통계학입문 Ⅱ 과정입니다. Ⅴ. 통계검정방법1. 신뢰구간의 의미신뢰구간 신뢰구간: 구간추정 실제 모수가 존재할 가능성이 높은 구간으로 추정 모평균, 모비율 등 모수를 포함할 확률 신뢰수준(Confidence level): 구간에 모수 μ가 포함될 확률 일반적으로 100(1-α)%로 나타냄
POSTECH에서 제공하는 MOOC 중, 데이터사이언스를 위한 통계학입문 Ⅰ 과정입니다. Ⅳ. 빅데이터 분석에서 확률과 분포1. 확률의 기초개념통계에 확률 개념이 필요한 이유 통계(Statistics) 데이터를 수집, 처리, 분석, 활용하는 지식 실제 얻어진 데이터를 바탕으로 정보 도출 확률(Probabilities) 특정 사건이 일어날 가능성을
setup, include1knitr::opts_chunk$set(echo = TRUE) POSTECH에서 제공하는 MOOC 중, 데이터사이언스를 위한 통계학입문 Ⅰ 과정입니다. Ⅲ. 데이터 시각화와 통계적 해석1. 데이터 시각화데이터 분석단계 수집 → 정제 → 시각화 → 예측모형/분석 2. 그래프의 유용성과 오류그래프의 유용성 그래프는 데이
POSTECH에서 제공하는 MOOC 중, 데이터사이언스를 위한 통계학입문 Ⅰ 과정입니다. Ⅱ. 빅데이터 탐색의 첫걸음1. 데이터의 평균(중심위치)평균 평균은 데이터를 하나의 값으로 표현한 요약된 정보: 추정치 평균 = 데이터 값의 총합 / 데이터 개수 평균 다룰 때 주의할 점 평균은 혼자 존재하는 개념이 아님 평균과 표본선정 표본선정에 따라 평균
POSTECH에서 제공하는 MOOC 중, 데이터사이언스를 위한 통계학입문 Ⅰ 과정입니다. Ⅰ 데이터과학과 통계1. 데이터과학이란 무엇인가데이터과학이란? 빅데이터: 통계학, 데이터마이닝, 인공지능, 딥러닝 Data → Data Analytics → Insight 필요한 기술 통계적 개념과 지식: 샘플링, 확률분포, 가설검정, p-value 데