1) 1교시
- 엑셀, 프로그래밍, 통계 중요!
레퍼런스 자료
통계 pdf - 10장,개요만
유튜브 - 진카통계 - 개념+공식 한번에 싹 정리
https://www.youtube.com/results?search_query=%EC%A7%84%EC%B9%B4%ED%86%B5%EA%B3%84
엑셀 책 - 엑셀 이렇게 하지마라!
-> 전처리할 떄 도움됨
-> 유튜브
2) 2교시
결측치 - 중앙값으로
수집 -> 전처리 -> 정제 -> 통계분석 -> 데이터 시각화
데이터 프레임 = 2차원으로 되어있는 데이터 구조
- 행 = 관측항목 = row = 레코드
- 열 = colume = 필드
- raw 데이터 = row를 뺀 순수 데이터 영역
- 신뢰도 수준은 연구자가 정함
-> 보통 95로 놓고 씀
3) 3교시
jupyter notebook - working directory 만들기
4) 4교시
- 가설 = 잠정적인 결론/수정
1) 귀무 = 차이 x, 영향 x= p>0.05 = 채택
2) 대립 = 차이 o, 영향 o= p<0.05=채택
변수(y==내가 알고싶은 변수)
y = 종속변수 = 설명변수 = 원인변수 = 퓨처
y = 종속변수= 반응변수 = 결과변수 = 타깃 = 라벨 = 라벨링
회귀분석
X | Y | ||
단순 회귀분석 | 1 | 1 | 수치형 |
다중 회귀분석 | N | 1 | 수치형 |
로지스틱 회귀분석 | N | 2 | 범주형 |
ex)
대지매매 - 로지스틱 회귀분석
HEALTHE - 다중 회귀분석
가설 = Y 가격은 매매면적 영향 X
- p값이 0.05 보다 작음
-> 대립가설 인정
-> 매매가격은 대지가격에 영향을 줬다,
orange data mining을 이용한 회귀분석
chat gpt를 이용해 단순 회귀 분석
'기타 > 글로컬청년취업사관학교' 카테고리의 다른 글
[TlL] 240618 (0) | 2024.06.18 |
---|---|
[TlL] 240617 (0) | 2024.06.17 |
[TIL] 240614 (0) | 2024.06.14 |
[TlL] 240613 (0) | 2024.06.13 |
[TIL] 240611 (0) | 2024.06.11 |