기타/글로컬청년취업사관학교 (19) 썸네일형 리스트형 [TIL] 240625 Form - 사용자에게 입력받은 정보를 제출하기 위한 대화형 컨트롤을 포함하는 문서 구획- 입력한 데이터를 제출, 전송하기 위해 사용하는 태그 ex) 단순히 입력받은 값을 화면에 뿌려주는 용도 이름 입력이름: method 속성 - 양식을 제출할 때 사용할 HTTP 메서드 1) POST - 양식 데이터를 요청 본문으로 전송- 브라우저에 의해 캐시되지 않고, 브라우저 히스토리에도 남지 않음- POST 방식의 HTTP 요청에 의한 데이터는 쿼리 문자열과는 별도로 전송- 데이터의 길이제한이 없고, GET 방식보다는 보안성이 높음 - enctype 속성 -> method 특성이 POST인 경우 enctype은 양식 제출 시 데이터의 MIME 타입을 나타낸다. MIME 타입- 클라이언트에 전.. [TlL] 240624 월드 와이드 웹 - 인터넷 상에서 정보를 링크 형태로 연결하여 접근할 수 있게 해주는 시스템- 인터넷은 컴퓨터로 연결하며 TCP/IP(Transmission Control Protocol/Internet Protocol)라는 통신 프로토콜을 이용해 정보를 주고받는 컴퓨터 네트워크 - 인터넷을 통해 정보를 공유하고 다양한 서비스를 이용할 수 있게 해주는 서비스- 웹 페이지는 하이퍼텍스트를 이용하여 연결됨 개발자 도구 열기 1. www.naver.com 접속2. 우클릭 “검사” 또는 “개발자도구”, “ 페이지 소스보기 HTML(Hypertext Markup Language) - 웹 페이지의 구조와 내용을 정의 - 웹 브라우저에 시각적으로 보이는 웹 페이지를 만들기 위해 사용하는 표준 마크업 언어-.. [TlL] 240621 결과 보고서 작성 - 차례 - 분석 요약 한장 중요 - 밑에 분석 프로세스는 같음 chat gpt를 통한 데이터 분석 Kamp 로 랜덤 포레스트 분석 의사 결정 나무 목표 -예측 변수를 기반으로 결과를 분류하거나 예측 - 결정규칙(decision rule)을 나무구조(tree)로 도표화하여 분류(classification)와 예측(prediction)을 수행하는 분석방법 구분 1)분류 나무 (Classification Tree) - 목표변수 : 범주형 변수(분리)- 예측변수 : 범주형, 수치형 가능 - 분류 알고리즘과 불순수도 지표 - CAST : 지니지수(Gini index) - C4.5 : 엔트로피(Entropy index), 정보이익(Information ga.. [TlL] 240620 wordcount(데이터빈도분석) 실습 : 장르별 영화 빈도 분석하기 - 영화 제목, 장르 데이터에서 장르별 영화 빈도 분석하기- 실습 데이터 : 영화의 제목과 장르 데이터에서 장르별 영화 빈도 분석하기 1) - 데이터를 파이썬으로 불러오기- pandas 모듈을 활용하여 데이터를 불러 올 수 있는데 read_csv 함수를 활용하여 데이터의 구분자가 "::"이므로 다음과 같이 파일을 불러 올 수 있다. 2)- 반복문을 활용하여 장르 리스트에 모든 영화들의 장르를 분리하여 저장- 장르가 구분자 '|'로 구분되어 있는 것을 활용하여 split으로 분리 한 뒤 반복문을 활용하여 리스트에 추가 3) - 이때, 장르는 만여 개의 영화마다 각각의 장르를 모두 저장한 것으로 중복된 값이 많다. - 따라서 중복.. [TlL] 240619 참고 사이트 https://www.kamp-ai.kr/analysis 인공지능 제조 플랫폼인공지능 제조플랫폼에 오신 것을 환영합니다. 회원가입 후 로그인하시면 다양한 서비스와 컨텐츠를 제공받으실 수 있습니다.www.kamp-ai.kr 전처리 빨리 하는 방법 - gpt 이용 머신 러닝 4) 특징 추출(feature extraction)- 특징 벡터의 준비- 차원 감소(축소)기법을 사용하기도 함 PCA 분석(주성분 분석) 머신 러닝 기술 1) 분류 :2) 수치예측:3) 군집 : 분류 회귀, 수치 회귀 p.346 Training set- 모델 훈련에 사용하는 데이터 셋 Validation(확인/입증) set- 모델 훈련에 적절한 지점을 찾기 위해 사용하는 데이터 셋으로 과적합 또는 과소 적합.. [TlL] 240618 파이썬 모듈 - 파이썬 코드를 논리적으로 묶어서 관리하고 사용할 수 있도록 하는 것 - 모듈의 단위는 파이썬 파일(.py) - 모듈의 호출은 import 모듈명으로 모듈을 가져 올 수 있음 - as(alias)를 활용해 긴 모듈명을 줄일 수 있음 import keyword as K print(K.kwlist) -> keyword라는 모듈을 as K, 즉 K라는 이름으로 호출했고, keyword 모듈 내 kwlist를 출력하는 코드 https://docs.python.org/3/py-modindex.html Python Module Index — Python 3.12.4 documentationnumbers Numeric abstract base classes (Complex, Real, Integral,.. [TlL] 240617 편차, 오차, 잔차 - 크면 클 수록 안좋음 편차(Deviation)평균값과 관측치 (개별값)의 차이오차(error) 모집단의 회귀식과 관측치 (개별값)의 차이잔차 (Residual)표본의 회귀식과 관측치 (개별값)의 차이 빅데이터 분석 통계 a. 차이 검정 - T검정 -> 집단이 2개 이하인 경우 - 분산분석(ANOVA) -> 집단이 3개 이상인 경우 b. 관계검정 - 교차분석(Chi Square) -> 범주형 자료(명목,서열)간의 관계 파악 - 상관분석(Correlation) -> 두 변수간의 선형적 관계가 존재하는지 알아보는 분석 방법 - 회귀분석(Regression) -> 주어진 (독립)변수로 (종속)변수를 예측하기 위해 -> 단순회귀 - 독립변수 1개 , 종속 변.. [TIL] 240614 기계학습에서 필요한 라이브러리 - 아나콘다 배포판- 주피터 노트북- 넘파이- 맷플롯립- 판다스- 싸이킷런-텐서플로-케라스 추천 도서- 데이터분석가가 반드시 알아야 할 모든 것- 머신러닝 교과서 with 파이썬, 사이킷런, 텐서플로 - 케라스 창시자에게 배우는 딥러닝 데이터 처리 #데이터 불러오기==>import numpy as npimport pandas as pd #판다슬르 애칭 pd.# CSV 파일을 DataFrame으로 읽어옴 df = pd.read_csv('grade.csv') # 경로명을 안쓰는 이유는-> 워킹디렉토리df.head() # 데이터프레임의 첫 5행을 출력# 읽어온 데이터를 다시 DataFrame으로 변환df = pd.DataFrame(df)df.head() # 변환된 데이터프레.. 이전 1 2 3 다음