Archive: 2020/12

빅데이터 분석과 R 프로그래밍 2: Ⅶ. R을 이용한 통계분석

POSTECH에서 제공하는 MOOC 중, 빅데이터분석과 R프로그래밍 Ⅱ 과정입니다. Ⅶ. R을 이용한 통계분석1. 두 그룹간 평균비교(t-test)단일표본의 평균검정 t.test(변수, mu=검정하고자 하는 평균값) 가설 1: G3(최종성적)의 평균은 10인가? H0(null Hypothesis: 귀무가설): μ = 10123stud<-rea

빅데이터 분석과 R 프로그래밍 2: Ⅴ. R 그래픽 Ⅱ

POSTECH에서 제공하는 MOOC 중, 빅데이터분석과 R프로그래밍 Ⅱ 과정입니다. Ⅴ. R 그래픽 Ⅰ1. R 그래픽: ggplot2데이터 시각화 R 기본 그래픽스(Base program) Lattice 그래픽스: 직교형태의 멀티패널 툴 ggplot2 그래픽 시스템: Hadley Wickham이 구현 Grammar of Graphic 개념은 그래픽

ch06. 차원 축소

해당 자료는 파이썬 머신러닝 완벽가이드 공부를 위한 필사본입니다. Chapter 06. 차원 축소01. 차원 축소(Dimension Reduction) 개요 차원 축소는 매우 많은 피처로 구성된 다차원 데이터 세트의 차원을 축소해 새로운 차원의 데이터 세트를 생성하는 것이다. 피처가 많을 경우 개별 피처간에 상관관계가 높을 가능성이 크다. 선형모델

ch05. 회귀

해당 자료는 파이썬 머신러닝 완벽가이드 공부를 위한 필사본입니다. Chapter 05. 회귀01. 회귀 소개 회귀는 현대 통계학을 이루는 큰 축 회귀 분석은 유전적 특성을 연구하던 영국의 통계학자 갈톤이 수행한 연구에서 유래했다는 것이 일반론 < 회귀에 대한 예시> “부모의 키가 크더라도 자식의 키가 대를 이어 무한정 커지지 않으며, 부모

ch04. 분류

해당 자료는 파이썬 머신러닝 완벽가이드 공부를 위한 필사본입니다. Chapter 04. 분류00. 정리결정 트리 대부분의 앙상블 기법은 결정 트리 기반의 다수의 약한 학습기를 결합해 변동성을 줄여 예측 오류를 줄이고 성능을 개선하고 있습니다. 결정 트리 알고리즘은 정보의 균일도에 기반한 규칙 트리를 만들어서 예측을 수행합니다. 결정 트리는 어떻게 예측