본문 바로가기

빅데이터 분석기사

1유형 기출 문제

6회 기출 - 1유형 

groupby 함수 사용 방법 

df.groupby('연도').['총범죄'] = df의 총범죄 컬럼의 연도별 그룹핑을 한다는 말

7회 기출 - 1유형 - 1번

value_counts 는 만약 a = [1,1,1,2,3] 이라면 1 : 3 2: 1 3:1 컬럼별로 개수를 알려준다.

df['id'].value_counts().idxmax() = id 값이 가장 많이 나타난 값에서 가장 큰 열의 값, 12를 의미함

df[cond]를 넣으면 조건문 cond 에 해당하는 df 만 산출됨

value_counts() 를 먼저 print 하고, 그 다음에 idxmax() 함수 사용

7회 기출 - 1유형 - 2번

corr()['close'] = df['close'] 컬럼과의 상관관계 구하는 함수

corr()['close'].abs() = df['close'] 컬럼과 상관관계 구하고, 절댓값 구하는 함수

 

상관관계가 높은 변수명 찾기 위해서

df_corr.loc['DE1':'DE77'].idxmax() = df['DE1'] ~ df['DE77'] 까지 값들 중에서 상관관계가 높은 값이 col 임

 

df['col'].mean() = col 열의 평균을 구하는 거임

 

5회 1유형 - 1번

조건문에 맞는 값만을 출력하고 싶으면

df = df[cond1 & cond2 & cond3]

print(df) 해볼 것!

단, 가격이 0을 제외해야지 가격의 평균이 맞게 나오므로 cond1 = df['2l가격'] != 0 을 써줘야 함!

문제 2

~이상 ~미만

하나씩 작성해서 소괄호로 묶어줘야 함

하나의 조건에 cond1 = (~~) & (~~) 

df[cond1] 의 개수를 구하고 싶으면 len(df[cond1]) 라고 써주면 됨!

~이상 ~ 미만인 경우는 하나로 나타낼 수 없으므로 (df['bmi'] >= 18.5) & (df['bmi'] < 23) 로 나타내야 함!
df['순전입'] 컬럼을 만드는 단계까지는 했으나, sort_values('순전입', ascending = False) 까지 떠오르지가 않았음 ㅠ

문제의 조건에 마지막에 정수로 나타내야 한다고 했으므로

int(df.iloc[0,-2]) 라고 나타내야 함!

'빅데이터 분석기사' 카테고리의 다른 글

2과목 정리  (0) 2024.06.21
3유형 기출 문제 - 1  (0) 2024.06.19
[실기] 1유형 정리 - 3  (0) 2024.06.16
[실기] 1유형 정리 - 3  (1) 2024.06.16
[실기] 1유형 정리 - 2  (0) 2024.06.16