본문 바로가기

기타/글로컬청년취업사관학교

(19)
[TIL] 240625 Form  - 사용자에게 입력받은 정보를 제출하기 위한 대화형 컨트롤을 포함하는 문서 구획- 입력한 데이터를 제출, 전송하기 위해 사용하는 태그  ex) 단순히 입력받은 값을 화면에 뿌려주는 용도  이름 입력이름:   method 속성 - 양식을 제출할 때 사용할 HTTP 메서드  1) POST - 양식 데이터를 요청 본문으로 전송- 브라우저에 의해 캐시되지 않고, 브라우저 히스토리에도 남지 않음- POST 방식의 HTTP 요청에 의한 데이터는 쿼리 문자열과는 별도로 전송- 데이터의 길이제한이 없고, GET  방식보다는 보안성이 높음 - enctype 속성  -> method 특성이 POST인 경우 enctype은 양식 제출 시 데이터의 MIME 타입을 나타낸다.  MIME 타입- 클라이언트에 전..
[TlL] 240624 월드 와이드 웹 - 인터넷 상에서 정보를 링크 형태로 연결하여 접근할 수 있게 해주는 시스템- 인터넷은 컴퓨터로 연결하며 TCP/IP(Transmission Control Protocol/Internet Protocol)라는 통신 프로토콜을 이용해 정보를 주고받는 컴퓨터 네트워크 - 인터넷을 통해 정보를 공유하고 다양한 서비스를 이용할 수 있게 해주는 서비스- 웹 페이지는 하이퍼텍스트를 이용하여 연결됨   개발자 도구 열기 1. www.naver.com 접속2. 우클릭 “검사” 또는 “개발자도구”, “ 페이지 소스보기    HTML(Hypertext Markup Language)  - 웹 페이지의 구조와 내용을 정의 - 웹 브라우저에 시각적으로 보이는 웹 페이지를 만들기 위해 사용하는 표준 마크업 언어-..
[TlL] 240621 결과 보고서 작성 - 차례 - 분석 요약 한장 중요 - 밑에 분석 프로세스는 같음   chat gpt를 통한 데이터 분석      Kamp 로 랜덤 포레스트 분석      의사 결정 나무  목표  -예측 변수를 기반으로 결과를 분류하거나 예측 - 결정규칙(decision rule)을 나무구조(tree)로 도표화하여 분류(classification)와 예측(prediction)을 수행하는 분석방법 구분  1)분류 나무 (Classification Tree) - 목표변수  : 범주형 변수(분리)- 예측변수 : 범주형, 수치형 가능 - 분류 알고리즘과 불순수도 지표    - CAST : 지니지수(Gini index)    - C4.5 : 엔트로피(Entropy index), 정보이익(Information ga..
[TlL] 240620 wordcount(데이터빈도분석) 실습 : 장르별 영화 빈도 분석하기  - 영화 제목, 장르 데이터에서 장르별 영화 빈도 분석하기- 실습 데이터 : 영화의 제목과 장르 데이터에서 장르별 영화 빈도 분석하기  1) - 데이터를 파이썬으로 불러오기- pandas 모듈을 활용하여 데이터를 불러 올 수 있는데 read_csv 함수를 활용하여 데이터의 구분자가 "::"이므로 다음과 같이 파일을 불러 올 수 있다.   2)- 반복문을 활용하여 장르 리스트에 모든 영화들의 장르를 분리하여 저장- 장르가 구분자 '|'로 구분되어 있는 것을 활용하여 split으로 분리 한 뒤 반복문을 활용하여 리스트에 추가  3) - 이때, 장르는 만여 개의 영화마다 각각의 장르를 모두 저장한 것으로 중복된 값이 많다. - 따라서 중복..
[TlL] 240619 참고 사이트 https://www.kamp-ai.kr/analysis 인공지능 제조 플랫폼인공지능 제조플랫폼에 오신 것을 환영합니다. 회원가입 후 로그인하시면 다양한 서비스와 컨텐츠를 제공받으실 수 있습니다.www.kamp-ai.kr  전처리 빨리 하는 방법 - gpt 이용    머신 러닝 4) 특징 추출(feature extraction)- 특징 벡터의 준비- 차원 감소(축소)기법을 사용하기도 함   PCA 분석(주성분 분석)   머신 러닝 기술 1) 분류 :2) 수치예측:3) 군집 : 분류 회귀, 수치 회귀   p.346 Training set- 모델 훈련에 사용하는 데이터 셋 Validation(확인/입증) set- 모델 훈련에 적절한 지점을 찾기 위해 사용하는 데이터 셋으로 과적합 또는 과소 적합..
[TlL] 240618 파이썬 모듈 - 파이썬 코드를 논리적으로 묶어서 관리하고 사용할 수 있도록 하는 것 - 모듈의 단위는 파이썬 파일(.py) - 모듈의 호출은 import 모듈명으로 모듈을 가져 올 수 있음 - as(alias)를 활용해 긴 모듈명을 줄일 수 있음 import keyword as K print(K.kwlist) -> keyword라는 모듈을 as K, 즉 K라는 이름으로 호출했고, keyword 모듈 내 kwlist를 출력하는 코드 https://docs.python.org/3/py-modindex.html Python Module Index — Python 3.12.4 documentationnumbers Numeric abstract base classes (Complex, Real, Integral,..
[TlL] 240617 편차, 오차, 잔차 - 크면 클 수록 안좋음 편차(Deviation)평균값과 관측치 (개별값)의 차이오차(error) 모집단의 회귀식과 관측치 (개별값)의 차이잔차 (Residual)표본의 회귀식과 관측치 (개별값)의 차이 빅데이터 분석 통계  a. 차이 검정  - T검정  -> 집단이 2개 이하인 경우   - 분산분석(ANOVA)  -> 집단이 3개 이상인 경우    b. 관계검정  - 교차분석(Chi Square) -> 범주형 자료(명목,서열)간의 관계 파악   - 상관분석(Correlation) -> 두 변수간의 선형적 관계가 존재하는지 알아보는 분석 방법   - 회귀분석(Regression)  -> 주어진 (독립)변수로 (종속)변수를 예측하기 위해   -> 단순회귀  - 독립변수 1개 , 종속 변..
[TIL] 240614 기계학습에서 필요한 라이브러리  - 아나콘다 배포판- 주피터 노트북- 넘파이- 맷플롯립- 판다스- 싸이킷런-텐서플로-케라스 추천 도서- 데이터분석가가 반드시 알아야 할 모든 것- 머신러닝 교과서 with 파이썬, 사이킷런, 텐서플로 - 케라스 창시자에게 배우는 딥러닝 데이터 처리 #데이터 불러오기==>import numpy as npimport pandas as pd #판다슬르 애칭 pd.# CSV 파일을 DataFrame으로 읽어옴 df = pd.read_csv('grade.csv') # 경로명을 안쓰는 이유는-> 워킹디렉토리df.head() # 데이터프레임의 첫 5행을 출력# 읽어온 데이터를 다시 DataFrame으로 변환df = pd.DataFrame(df)df.head() # 변환된 데이터프레..