본문 바로가기

전체 글

(894)
[TIL] 240626 CSS 선택자  전체 선택자 - universal selector- html을 포함한 HTML 문서 내의 모든 요소를 선택. * 를 사용  타입(유형) 선택자(태그 선택자, 요소 선택자)- type selector- 특정 태그를 선택   아이디 선택자(#)- id selector- HTML 페이지 내에 id는 유일해야 한다- HTML 안에서 한 번만 사용되기 때문에 재사용성은 떨어진다 - 아이디 속성은 JavaScript 또는 해시 링크와 함께 사용되는 경우가 많다.   클래스 선택자(.) - class selector- 아이디 선택자와 다르게 한 페이지에 여러 개가 존재할 수 있다. - 재사용성이 높다.  특성 선택자([ ] ) - 주어진 특성을 가진 모든 요소를 선택  그룹 선택자(,)  복합 선택자..
[혼공] ch 4. 다양한 분류 알고리즘 1. 로지스틱 회귀  1) 럭키백의 확률  - 럭키백에 들어갈 수 있는 생선은 7개- 럭키백에 들어간 생선의 크기, 무게 등이 주어졌을 때 7개 생선에 대한 확률을 출력  - K-최근점 이웃은 주변 이웃을 찾아주니까 이웃의 클래스 비율을 확률이라고 출력   - X 주위에 가장 가까운 이웃 샘플 10개를 표시- 사각형이 3개, 삼각형이 5개, 원이 2개- 이웃한 샘플의 클래스를 확률로 삼는다면 샘플 X가 사각형일 확률은 30%, 삼각형일 확률은 50%, 원일 확률은 20%이다.  데이터 준비  import pandas as pdfish = pd.read_csv('https://bit.ly/fish_csv_data')fish.head()  - 어떤 종류의 생선이 있는지 Species 열에서 고유한 값 추출 ..
[혼공] ch 3. 회귀 알고리즘과 모델 규제 1. K-최근접 이웃 회귀  농의 높이, 길이 등의 수치로 농어의 무게를 예측하라  1) k-최근접 이웃 회귀  - 지도 학습은 분류와 회귀(regression)로 나뉜다. - 회귀는 클래스 중 하나로 분류하는 것이 아니라 임의의 어떤 숫자를 예측하는 문제 - 이웃한 샘플의 타깃은 어떤 클래스가 아니라 임의의 수치 - 샘플의 수치를 이용해 새로운 샘플 X의 타깃을 에측하기 위해 수치들의 평균을 구함 - 가장 먼저 가까운 k개의 이웃을 찾고 이웃 샘플의 타깃값을 평균하여 이 샘플의 예측값으로 사용    2) 데이터 준비  import numpy as npperch_length = np.array([8.4, 13.7, 15.0, 16.2, 17.4, 18.0, 18.7, 19.0, 19.6, 20.0, 21..
[TIL] 240625 Form  - 사용자에게 입력받은 정보를 제출하기 위한 대화형 컨트롤을 포함하는 문서 구획- 입력한 데이터를 제출, 전송하기 위해 사용하는 태그  ex) 단순히 입력받은 값을 화면에 뿌려주는 용도  이름 입력이름:   method 속성 - 양식을 제출할 때 사용할 HTTP 메서드  1) POST - 양식 데이터를 요청 본문으로 전송- 브라우저에 의해 캐시되지 않고, 브라우저 히스토리에도 남지 않음- POST 방식의 HTTP 요청에 의한 데이터는 쿼리 문자열과는 별도로 전송- 데이터의 길이제한이 없고, GET  방식보다는 보안성이 높음 - enctype 속성  -> method 특성이 POST인 경우 enctype은 양식 제출 시 데이터의 MIME 타입을 나타낸다.  MIME 타입- 클라이언트에 전..
[TlL] 240624 월드 와이드 웹 - 인터넷 상에서 정보를 링크 형태로 연결하여 접근할 수 있게 해주는 시스템- 인터넷은 컴퓨터로 연결하며 TCP/IP(Transmission Control Protocol/Internet Protocol)라는 통신 프로토콜을 이용해 정보를 주고받는 컴퓨터 네트워크 - 인터넷을 통해 정보를 공유하고 다양한 서비스를 이용할 수 있게 해주는 서비스- 웹 페이지는 하이퍼텍스트를 이용하여 연결됨   개발자 도구 열기 1. www.naver.com 접속2. 우클릭 “검사” 또는 “개발자도구”, “ 페이지 소스보기    HTML(Hypertext Markup Language)  - 웹 페이지의 구조와 내용을 정의 - 웹 브라우저에 시각적으로 보이는 웹 페이지를 만들기 위해 사용하는 표준 마크업 언어-..
[TlL] 240621 결과 보고서 작성 - 차례 - 분석 요약 한장 중요 - 밑에 분석 프로세스는 같음   chat gpt를 통한 데이터 분석      Kamp 로 랜덤 포레스트 분석      의사 결정 나무  목표  -예측 변수를 기반으로 결과를 분류하거나 예측 - 결정규칙(decision rule)을 나무구조(tree)로 도표화하여 분류(classification)와 예측(prediction)을 수행하는 분석방법 구분  1)분류 나무 (Classification Tree) - 목표변수  : 범주형 변수(분리)- 예측변수 : 범주형, 수치형 가능 - 분류 알고리즘과 불순수도 지표    - CAST : 지니지수(Gini index)    - C4.5 : 엔트로피(Entropy index), 정보이익(Information ga..
[TlL] 240620 wordcount(데이터빈도분석) 실습 : 장르별 영화 빈도 분석하기  - 영화 제목, 장르 데이터에서 장르별 영화 빈도 분석하기- 실습 데이터 : 영화의 제목과 장르 데이터에서 장르별 영화 빈도 분석하기  1) - 데이터를 파이썬으로 불러오기- pandas 모듈을 활용하여 데이터를 불러 올 수 있는데 read_csv 함수를 활용하여 데이터의 구분자가 "::"이므로 다음과 같이 파일을 불러 올 수 있다.   2)- 반복문을 활용하여 장르 리스트에 모든 영화들의 장르를 분리하여 저장- 장르가 구분자 '|'로 구분되어 있는 것을 활용하여 split으로 분리 한 뒤 반복문을 활용하여 리스트에 추가  3) - 이때, 장르는 만여 개의 영화마다 각각의 장르를 모두 저장한 것으로 중복된 값이 많다. - 따라서 중복..
[TlL] 240619 참고 사이트 https://www.kamp-ai.kr/analysis 인공지능 제조 플랫폼인공지능 제조플랫폼에 오신 것을 환영합니다. 회원가입 후 로그인하시면 다양한 서비스와 컨텐츠를 제공받으실 수 있습니다.www.kamp-ai.kr  전처리 빨리 하는 방법 - gpt 이용    머신 러닝 4) 특징 추출(feature extraction)- 특징 벡터의 준비- 차원 감소(축소)기법을 사용하기도 함   PCA 분석(주성분 분석)   머신 러닝 기술 1) 분류 :2) 수치예측:3) 군집 : 분류 회귀, 수치 회귀   p.346 Training set- 모델 훈련에 사용하는 데이터 셋 Validation(확인/입증) set- 모델 훈련에 적절한 지점을 찾기 위해 사용하는 데이터 셋으로 과적합 또는 과소 적합..