Tag: Postech

데이터사이언스를 위한 통계학입문 2: Ⅷ. 회귀분석을 이용한 예측모형

POSTECH에서 제공하는 MOOC 중, 데이터사이언스를 위한 통계학입문 Ⅱ 과정입니다. Ⅷ. 회귀분석을 이용한 예측모형1. 선형모형의 특성과 상관분석데이터의 상관관계 데이터 탐색: 변수 간 관계 변수 간 상관관계 여부 상관관계 형태 상관계수(Pearson’s) 상관계수(correlation coefficient) 두 변수 간 선형관계의 강도를 나

데이터사이언스를 위한 통계학입문 2: Ⅶ. 빅데이터 차원축소와 예측모형

POSTECH에서 제공하는 MOOC 중, 데이터사이언스를 위한 통계학입문 Ⅱ 과정입니다. Ⅶ. 빅데이터 차원축소와 예측모형1. 데이터 탐색과 정제데이터 탐색 Basic Information: 분포, 평균, 최솟값, 최댓값, 분산 등 Variation: 변동성, 시계열 Outlier: 모든 데이터가 상식적인 범위 안에 존재하는가? Correlation:

데이터사이언스를 위한 통계학입문 2: Ⅵ. 현업 데이터 특성과 예측모형

POSTECH에서 제공하는 MOOC 중, 데이터사이언스를 위한 통계학입문 Ⅱ 과정입니다. Ⅵ. 현업 데이터 특성과 예측모형1. 데이터 수집- random의 의미데이터 수집 데이터 수집에서는 양질의 데이터를 확보하는 것이 중요 나쁜 데이터로는 나쁜 모델밖에 만들 수 없음 ‘대표성’, ‘랜덤’ 데이터 데이터 수집_표본 추출 좋은 표본: 모집단의 특성을

데이터사이언스를 위한 통계학입문 2: Ⅴ. 통계검정방법

POSTECH에서 제공하는 MOOC 중, 데이터사이언스를 위한 통계학입문 Ⅱ 과정입니다. Ⅴ. 통계검정방법1. 신뢰구간의 의미신뢰구간 신뢰구간: 구간추정 실제 모수가 존재할 가능성이 높은 구간으로 추정 모평균, 모비율 등 모수를 포함할 확률 신뢰수준(Confidence level): 구간에 모수 μ가 포함될 확률 일반적으로 100(1-α)%로 나타냄

데이터사이언스를 위한 통계학입문 1: Ⅳ. 빅데이터 분석에서 확률과 분포

POSTECH에서 제공하는 MOOC 중, 데이터사이언스를 위한 통계학입문 Ⅰ 과정입니다. Ⅳ. 빅데이터 분석에서 확률과 분포1. 확률의 기초개념통계에 확률 개념이 필요한 이유 통계(Statistics) 데이터를 수집, 처리, 분석, 활용하는 지식 실제 얻어진 데이터를 바탕으로 정보 도출 확률(Probabilities) 특정 사건이 일어날 가능성을

데이터사이언스를 위한 통계학입문 1: Ⅱ. 빅데이터 탐색의 첫걸음

POSTECH에서 제공하는 MOOC 중, 데이터사이언스를 위한 통계학입문 Ⅰ 과정입니다. Ⅱ. 빅데이터 탐색의 첫걸음1. 데이터의 평균(중심위치)평균 평균은 데이터를 하나의 값으로 표현한 요약된 정보: 추정치 평균 = 데이터 값의 총합 / 데이터 개수 평균 다룰 때 주의할 점 평균은 혼자 존재하는 개념이 아님 평균과 표본선정 표본선정에 따라 평균

데이터사이언스를 위한 통계학입문 1: Ⅰ. 데이터과학과 통계

POSTECH에서 제공하는 MOOC 중, 데이터사이언스를 위한 통계학입문 Ⅰ 과정입니다. Ⅰ 데이터과학과 통계1. 데이터과학이란 무엇인가데이터과학이란? 빅데이터: 통계학, 데이터마이닝, 인공지능, 딥러닝 Data → Data Analytics → Insight 필요한 기술 통계적 개념과 지식: 샘플링, 확률분포, 가설검정, p-value 데