본문 바로가기

빅데이터 분석기사

(17)
2과목 정리 문제 2유형의 고정 문제 풀이 단계-------------------------------------------------------------------------------------------------------------------------------------------2 유형  0단계. train, test 데이터 지정 import pandas as pdtrain = pd.read_csv("파일명".csv)test = pd.read_csv("파일명".csv) ------------------------------------------------------------------------------------------------------------ (위의 과정 생략 후step1 시작)st..
3유형 기출 문제 - 1 7회 기출 from statsmodels.formula.api import logitimport numpy as np회귀 계수는 summary에서 coef 를 의미함 from statsmodels.formula.api import glm?from sklearn.metrics import accuracy_score?7회 문제 2-1 *cf) 알아두면 좋을 내용들1에 가까울수록 양의 선형 관계가 강함: 한 변수가 증가할 때 다른 변수도 증가하는 경향이 강합니다.-1에 가까울수록 음의 선형 관계가 강함: 한 변수가 증가할 때 다른 변수는 감소하는 경향이 강합니다.0에 가까울수록 선형 관계가 약함: 두 변수 사이에 선형 관계가 거의 없거나 약한 경우입니다.문제 2-3범주형 데이터 분석 2가지로 나뉨 적합도 검정..
1유형 기출 문제 6회 기출 - 1유형 groupby 함수 사용 방법 df.groupby('연도').['총범죄'] = df의 총범죄 컬럼의 연도별 그룹핑을 한다는 말7회 기출 - 1유형 - 1번value_counts 는 만약 a = [1,1,1,2,3] 이라면 1 : 3 2: 1 3:1 컬럼별로 개수를 알려준다.df['id'].value_counts().idxmax() = id 값이 가장 많이 나타난 값에서 가장 큰 열의 값, 12를 의미함df[cond]를 넣으면 조건문 cond 에 해당하는 df 만 산출됨7회 기출 - 1유형 - 2번corr()['close'] = df['close'] 컬럼과의 상관관계 구하는 함수corr()['close'].abs() = df['close'] 컬럼과 상관관계 구하고, 절댓값 구하는 함수..
[실기] 1유형 정리 - 3 Pandas의 dt 속성을 사용하면 날짜 및 시간 데이터에서 원하는 부분(연도, 월, 일 등)을 쉽게 추출할 수 있습니다.timedelta 쓸 때, 주의할 점 : 뒤에 다 s 가 붙어있음!!100일과 100시간 컬럼의 차이를 묻는 문제가 나옴초/분 로 나타내라. 분으로 나타내라고 문제에 나오나 분으로 나타내는 함수가 없으므로우리는 total_seconds함수를 이용함!dt.total_seconds는 timedelta에서만 사용가능함 #판다스 문자열 풀이 - str 접근자 사용
[실기] 1유형 정리 - 3 Pandas의 dt 속성을 사용하면 날짜 및 시간 데이터에서 원하는 부분(연도, 월, 일 등)을 쉽게 추출할 수 있습니다.timedelta 쓸 때, 주의할 점 : 뒤에 다 s 가 붙어있음!!100일과 100시간 컬럼의 차이를 묻는 문제가 나옴초/분 로 나타내라. 분으로 나타내라고 문제에 나오나 분으로 나타내는 함수가 없으므로우리는 total_seconds함수를 이용함!dt.total_seconds는 timedelta에서만 사용가능함
[실기] 1유형 정리 - 2 라이브러리 불러오기데이터 불러오기데이터 프레임과 시리즈(시리즈는 줄글 데이터 프레임은 표 모양)시리즈는 [] 사용, 프레임은 {} 사용 데이터 프레임 만드는 방법은 외우기sortingloc는 마지막 값을 포함하고, iloc는 마지막 값을 포함하지 않음결측치 채우기내장함수그룹핑 함수  groupby()
[실기] 1유형 정리 - 1 1 python(blank).ipynb의 사본조건문들여쓰기 : tab내어쓰기 : shift tab리스트딕셔너리 인덱싱과 슬라이싱내장함수문자열 자주 사용되는 파이썬 예제 - 반복문함수 - 기본함수
[인프런] 3과목 회귀 분석 https://quakka.notion.site/98de7bdef88b4bd6b6b19d3d480fe108 회귀 분석 - 퇴근후딴짓 | Notion상관관계quakka.notion.site회귀 분석수치형 데이터를 분석하 ㄹ때 사용 #ols :최소 제곱법단순선형 회귀 분석, 독립변수 하나종속고 독립 변수 사이는 물결로 표시컴마 찍고, data=df (df를 대입을 해).fit() : 학습한다는 의미보통 95% 신뢰구간과 예측구간임잔차 : 실제 데이터와의 거리최소제곱의 합 : 잔차 제곱의 합6회 기출 : 다중선형 회귀분석, 독립변수 복수인데괄호안에 + 로 작성함