본문 바로가기

빅데이터 분석기사

(17)
[인프런] 3과목 범주형 데이터 분석(카이제곱 검정) 이론 강의 https://quakka.notion.site/7c21efb95fe64b1da142a9697a92f1ec 범주형 데이터 분석 - 퇴근후딴짓 | Notion적합도 검정quakka.notion.site  적합도 검정(1,2번만 할줄 알면 됨)수원에서 찍먹하는 수 1,1,2,2,1(1이 찍, 2 부먹)관찰된 빈도이므로 [3,2] 로 나오고, 2독립성 검정두 변수가 연관성이 있는지 검정표 만들어, 지역과 찍먹은 독립인가 아닌가?부산 찍:40 부;20수원 찍:110 부:40교차 표 형식임 (위에가)교차표 테이블 만들어correction = true 기본적으로
[인프런] 3과목 가설검정 이론 강의 https://quakka.notion.site/aec994822e804b5796ae950a47f0ed15 가설검정 - 퇴근후딴짓 | Notion모집단과 표본quakka.notion.site 귀무가설 : 기존에 알려진 사실#파이썬에서 함수 하나면 검정 통계량과 유의 확률(p-value) 확인이 가능함! #정규 분포 따르면 단일 표본 검정만 하면 되는데샤피로 검정 결과를 작성하라 라면 정규성 검정을 해야 함여기서 정규성 검정응ㄹ 따르지 않으면 비모수 결정 중에 윌콕슨 을 하면 됨#관심 모집단이 두개이고,정규성을 만족한다면 대응 표본을 하면 되는데샤피로 검정 결과를 출력하라 라면 정규성 검정을 확인해야 함혹시라도 정규성 검정 만족 못하면 윌콕슨 검정 실행하면 됨#독립표본검정정규 분포를 만족하고 등분산을 만족..
[인프런] 3과목 가설검정 이론 강의 https://quakka.notion.site/aec994822e804b5796ae950a47f0ed15 가설검정 - 퇴근후딴짓 | Notion모집단과 표본quakka.notion.site 귀무가설 : 기존에 알려진 사실#파이썬에서 함수 하나면 검정 통계량과 유의 확률(p-value) 확인이 가능함! #정규 분포 따르면 단일 표본 검정만 하면 되는데샤피로 검정 결과를 작성하라 라면 정규성 검정을 해야 함여기서 정규성 검정응ㄹ 따르지 않으면 비모수 결정 중에 윌콕슨 을 하면 됨#관심 모집단이 두개이고,정규성을 만족한다면 대응 표본을 하면 되는데샤피로 검정 결과를 출력하라 라면 정규성 검정을 확인해야 함혹시라도 정규성 검정 만족 못하면 윌콕슨 검정 실행하면 됨#독립표본검정정규 분포를 만족하고 등분산을 만족..
[인프런] 2과목 머신러닝 프로세스 빅분기 시험은 분류/회귀 문제가 나옴 탐색적 데이터 분석을 통해 결측지, 이상치 알 수 있음데이터 전처리, 피처 엔지니어링을 묶을수도 있지만 분리해놨음모델에서 탐색적 데이터 분석, 데이터 전처리, 피처 엔지니어링 과정으로 돌아갈 수 있음   데이터가 총 3개, 훈련용, 학습용, 예측해야 하는 데이터 = 테스트용x는 독립변수, y는 종속변수, x는 대문자 사용(X)빅분기에서 시각화를 지원하지 않아 약간 제한적 탐색적 데이터 분석 진행 이상치만 잘 찾아서 날려줘도 좋아짐IQR=3Q-1Q카테고리가 많으면 라벨 인코딩을,몇개 없으면 2~5개면 원핫 인코딩하면 됨Validation도 학습하고 평가함train data에서 일부 나눠 validation data로 사용함크게 train data와 test data로 ..
[인프런] 2과목 머신러닝 프로세스 빅분기 시험은 분류/회귀 문제가 나옴 탐색적 데이터 분석을 통해 결측지, 이상치 알 수 있음 데이터 전처리, 피처 엔지니어링을 묶을수도 있지만 분리해놨음 모델에서 탐색적 데이터 분석, 데이터 전처리, 피처 엔지니어링 과정으로 돌아갈 수 있음 데이터가 총 3개, 훈련용, 학습용, 예측해야 하는 데이터 = 테스트용 x는 독립변수, y는 종속변수, x는 대문자 사용(X) 빅분기에서 시각화를 지원하지 않아 약간 제한적 탐색적 데이터 분석 진행 이상치만 잘 찾아서 날려줘도 좋아짐 IQR=3Q-1Q 카테고리가 많으면 라벨 인코딩을, 몇개 없으면 2~5개면 원핫 인코딩하면 됨 Validation도 학습하고 평가함 train data에서 일부 나눠 validation data로 사용함 크게 train data와 tes..
자주 활용되는 파이썬 예제 가장 많이 쓰는 함수의 형태임
[빅분기 실기] 퇴근후딴짓 오리엔테이션 시험시간 : 3시간 시험환경 : 크롬, cbt 코드 실행 1분 자동완성 기능 없음 (함수명 암기) 제공된 패키지만 사용 *윈도우 기본 메모장 사용 가능 합격 기준 : 총합 60점 이상이면 됨, 과락x 작업형 1 : 3문항, 30점 작업형 2 : 1문항, 40점 (여기서 확보해야 함), 평가 지표가 있으며 구간들을 통해서 채점됨! 작업형 3 : 2문항, (소문항 4개씩, 총 8문항, 각 문항별로 배점 존재, 각 채점됨), 30점, 1유형 2유형 3유형 햄버거 바에서 선택 후 답안을 작성 후 제출 버튼 클릭! 학습 환경은 위의 환경이 아님, 단축키 없어서! 시험 일이주일 전부터 위의 환경에 익숙해지게! 파이썬 -> 판다스 -> 머신러닝 -> 통계 빠르게 훑고 실전 감각 높이기! 반복되더라도 쉬운 코딩, 직관..
빅분기 필기 후기 시험 보는 날을 포함해서 약 10일 전부터 면접을 보러 다녔다. 그래서 생각보다 시간이 없어가지고, 약간 시간 부족에 허덕였다. 무려 10일 전쯤에는 인강을 다 듣지도 못하고, 성남에서 대전 내려온 다고 이동시간도 포함되서 하루 이틀 정도는 버리고, 또 21일에는 내 생일이라서 노느라,,, 또 시간적 여유가 살짝쿵 부족했다. 노느라 부족한 거는 밤을 새서라도 시간을 채워야 하는데 잠을 줄일 생각은 조금 부족했나보다. 그룹웨어 연동하고 필요한 서류 작성도 하고, 하느라 아무래도 마음이 조금 붕 뜬 경향도 없지 않아 있었다. 그리고 그 와중에 다른 곳 입사포기도 하느라 심적으로 고민도 많이 하게 된 2~3주였다. 그럼에도 불구하고 빅분기 필기에 붙어야 했었는데 그 이유는 3년전에 수리통계학 수업을 들었기도 ..