전체 글 37

[내일배움캠프] 로지스틱회귀가 뭔데요..... 세번 들어도 이해하기 어려운,,

학습 내용오늘은 범주형 데이터를 예측하는 로지스틱 회귀(Logistic Regression) 와 분류 모델을 평가하는 방법을 배웠다.기존의 선형회귀는 집값이나 키처럼 연속적인 숫자를 예측하는 데 적합하지만, 합격/불합격, 암/정상처럼 결과가 0 또는 1인 분류 문제에는 적합하지 않다. 선형회귀는 예측값이 1보다 크거나 0보다 작아질 수도 있기 때문이다.예를 들어 시험 합격 확률을 예측한다고 했을 때, 선형회귀는 120%나 -30% 같은 말이 안 되는 확률을 예측할 수도 있다. 실제 확률은 반드시 0~1 사이여야 하므로 다른 방법이 필요하다.그래서 등장한 것이 로지스틱 회귀이다.로지스틱 회귀는 먼저 오즈(Odds) 와 로짓(Logit) 이라는 개념을 이용한다.확률(P) : 어떤 사건이 일어날 가능성오즈(O..

카테고리 없음 2026.06.26

[내일배움캠프] 통계학

통계학 심화: 가설검정부터 회귀분석까지오늘 강의에서는 A/B 테스트와 가설검정의 기본 흐름부터 시작해서, t검정 / 다중검정 / 카이제곱검정, 그리고 **회귀분석(단순선형회귀, 다중선형회귀, 다항회귀, 스플라인회귀)**까지 꽤 넓은 범위를 한 번에 다뤘다.처음에는 각각이 별개의 개념처럼 보였는데, 정리해보니 결국은 “데이터를 보고 차이가 있는지 판단하거나, 관계를 설명하고 예측하는 방법들”이라는 큰 흐름 안에 연결되어 있었다.특히 A/B 테스트는 단순히 두 버전을 비교하는 실험이 아니라, “관찰된 차이가 우연인지 실제 효과인지 검정하는 과정”이라는 점이 핵심이었다. 이 과정에서 자연스럽게 귀무가설과 대립가설, 유의수준, p-value, 제1종 오류와 제2종 오류 같은 개념이 함께 등장했다.예를 들어 실제..

카테고리 없음 2026.06.25

[내일배움캠프] QAQC_6기 어렵다 어려워 머신러닝 ㅠ

이상치 탐지와 머신러닝 실무 핵심 요약개요이 강의는 이상치(Outlier) 탐지와 불균형 데이터 처리, 평가 지표, 모델 배포 및 유지보수, AutoML 및 XAI까지 머신러닝 전 과정을 실무 중심으로 설명한다. 특히 제조/품질 관리(QA/QC) 환경에서 흔히 마주치는 상황과 해결책을 사례와 함께 제시한다. 주요 개념개념정의실무 적용 예시점 이상치 (Point Outlier)전체 분포에서 단일 데이터가 크게 벗어남센서 오작동으로 5000 °C 기록상황적 이상치 (Contextual Outlier)값은 정상 범위에 있으나 상황(시간, 기후 등)에서 비정상겨울 새벽 30 °C집단 이상치 (Collective Outlier)개별은 정상이지만 특정 패턴·집합에서 비정상모터 센서 데이터가 갑작스럽게 하락불균형 데..

카테고리 없음 2026.06.24

[내일배움캠프] 머신러닝 심화,,,,, 뭐예요ㅕ 이거

오늘은 통계학 강의와 머신러닝 심화 세션을 통해, 데이터를 해석할 때 어떤 기준으로 접근해야 하는지에 대한 기본 틀을 배웠다.통계에서는 상황에 따라 어떤 분포를 써야 하는지를 익혔고, 머신러닝에서는 정답이 없는 데이터에서 구조를 찾는 비지도학습의 개념을 배웠다.하루 내용을 쭉 돌아보면, 결국 핵심은 하나였다.“데이터를 그냥 보는 게 아니라, 데이터의 형태와 목적에 맞는 도구를 골라서 해석해야 한다”는 점이다.1. 통계학 강의 — 상황에 맞는 분포를 고르는 기준 정리오늘 통계학에서는 여러 분포를 한 번에 배웠다.처음에는 이름이 너무 많아서 헷갈렸는데, 하나씩 뜯어보니 결국 **“어떤 상황의 데이터를 설명하려는가”**에 따라 분포를 고르는 문제였다.정리하면 이런 느낌이다.데이터 수가 충분히 많으면 정규분포에..

카테고리 없음 2026.06.23

[내일배움캠프] QAQC_6기 라이브 세션! 통계는 왜....

오늘은 품질관리에서 자주 쓰이는 통계 개념들을 한 번에 정리하는 시간을 가졌다.사실 “통계”라고 하면 평균, 분산, 정규분포 정도만 막연하게 떠올랐는데, 오늘은 그걸 품질관리 상황에 어떻게 연결해서 해석해야 하는지를 조금 더 구체적으로 배운 느낌이었다.특히 좋았던 건 단순히 개념만 외우는 게 아니라, 어떤 상황에서 어떤 분포를 써야 하는지공정이 규격 안에 안정적으로 들어오는지 어떻게 판단하는지이상치가 나왔을 때 그냥 지나가면 안 되는 이유가 뭔지두 공정/두 집단/여러 집단을 비교할 때 어떤 검정을 써야 하는지이걸 전부 품질관리 시나리오에 대입해서 생각해볼 수 있었다는 점이다.그리고 마지막에는 실제 인장강도 데이터를 가지고 시각화, 정규성 확인, 검정까지 이어지는 실습도 해봤는데, 이 부분이 오늘 배운 내..

카테고리 없음 2026.06.22

[내일배움캠프] QAQC_6기 통계학 킵 고잉,,

오늘은 통계학의 가장 기본이 되는 개념인 모집단과 표본, 표본오차와 신뢰구간, 정규분포에 대해 학습했다.처음에는 용어들이 비슷하게 느껴졌지만, 실제 데이터를 모두 조사하기 어려운 현실적인 문제를 해결하기 위해 통계가 어떤 방식으로 활용되는지 이해할 수 있었다.(그리고 사실 고등학생 때랑 대학생 때 배웠긴 했음 ㅎㅎ..) 1. 모집단(Population)과 표본(Sample)통계 분석의 시작은 모집단과 표본을 구분하는 것이다.모집단 : 조사하고 싶은 전체 대상표본 : 모집단 중 일부를 추출한 데이터예를 들어 대한민국 성인의 평균 키를 알고 싶다고 가정해보자.대한민국 성인 모두를 조사하는 것은 시간과 비용이 너무 많이 들기 때문에 일부 사람들을 추출하여 조사한다.이때대한민국 성인 전체 = 모집단조사에 참여한..

카테고리 없음 2026.06.19

[내일배움캠프] QAQC_6기 통계학 강의 수강

오전부터 바쁘게 라이브 세션 수강하고 통계학 강의도 듣고,,, 점점 바빠지는 붙캠의 하루다 통계학 녹화 강의에서는!데이터 분석의 기초라고 할 수 있는 통계 개념을 학습했다. 지금까지는 데이터를 불러오고 전처리하는 과정에 집중했다면, 오늘은 데이터를 어떻게 이해하고 해석하는지에 대한 방법을 배웠다.특히 기술통계와 추론통계의 차이, 그리고 데이터의 분포와 변수 간 관계를 확인하는 여러 분석 방법들을 정리할 수 있었다. 처음에는 기술통계와 추론통계 둘 다 데이터를 분석하는 방법이라 비슷하게 느껴졌는데, 핵심 목적이 다르다는 점을 이해하게 됐다. 기술통계기술통계는 데이터를 요약하고 설명하는 방법이다.예를 들어 처음 만난 사람을 볼 때 외모, 나이, 직업, MBTI 같은 정보로 그 사람을 대략적으로 파악하는 것과..

카테고리 없음 2026.06.18

[내일배움캠프] QAQC_6기 새로운 조 오벤져스

오늘은 새로운 팀원들과 팀을 편성하여 데이터 분석 심화 주차를 시작했습니당 저희 조 이름은 오벤져스! 기념으로 캐릭터 같이 꾸미면서 화기애애하게 시작하여쑴ㅎ제 닥터스트레인지 대박이지 않습니까? 완전 똑같애 ㅋㅋㅋㅋㅋㅋㅋ 그리고 새로운 내용도 배우게 되었는데요 익숙한듯 먼 통계학,,,,,, 데이터 분석에서 가장 기본이 되는 통계 개념들을 학습하는 시간입니당 데이터를 통해서 객관적인 근거를 만들고 의사결정을 돕는 것이 바로 통계의 역할... 1. 데이터의 종류 크게 두가지로 나누어서, 수치형 - 연속형: 온도, 압력, 키, 몸무게 - 이산형: 불량품 개수, 생산 횟수 범주형 - 순서형: 품질 등급, 위험도 등급 - 명목형: 설비 ID, 제품 종류 데이터는 각 이름을 아는 것이 아니라 어떤 것들이 어디에 ..

카테고리 없음 2026.06.17

[내일배움캠프] QAQC_6기 커리어 상담!

오늘은 커리어 상담을 진행했습니다.. 최근 취업 준비를 하면서 가장 고민이 많았던 부분은 어떤 도메인으로 진출할 것인가였는데요, 품질관리 직무를 목표로 하고 있지만, 품질관리는 제조업 전반에 걸쳐 존재하는 직무이다 보니 특정 산업을 먼저 정해야 하는지에 대한 고민이 있었다. 생명화학공학화 전공으로, 주변 친구들의 진로를 보면 제약, 화장품, 식품 분야로 진출하는 경우가 많다. 자연스럽게 나 역시 해당 분야를 우선적으로 생각해왔지만, 한편으로는 내가 살고 있는 창원 지역의 산업 구조도 무시할 수 없었다. 창원에는 자동차, 모빌리티, 방산, 기계 제조업 관련 기업들이 많이 위치해 있다. 최근에는 반도체 분야에도 관심이 생기면서 오히려 선택지가 많아졌고, 그만큼 어떤 분야를 선택해야 할지 더 고민하게 되었다..

카테고리 없음 2026.06.16

[내일배움캠프] QAQC_6기 기초 프로젝트 발표와 절거운 밍글데이!

오늘 역대급.... 정신없고 자괴감 드는 하루였습니다. 프로젝트를 진행하며 마감 기한을 지키지 못하는 날이 올줄이야 누가 상상이나 했겠어요......./ 해야할 일을 제대로 마무리하지 않고 주말을 보낸 자 매를 맞으세요 근데 나임.. 팀장으로서 매우 죄송하고 후회되고.... 아쉬운 점만 많습ㄴㅣ다 열시까지 그것도 모르고 코드카타랑 진단문제 신나게 풀고 있었잖아요ㅠㅠ 일단,, 오늘 오전 내내 진행한 프로젝트 마무리에 대해 간단히 기록해보고자 합니다 저의 반성을 담아..ppt 최종검토, 발표 대본 작성, 발표 녹화본 제작 이걸 세시간만에 했다...? 그것도 마지막날에..? 주요 작업 내용① PPT 마감 및 데이터 검토결국 저희 ppt에서 말하고자 하는 내용은 아래와 같습니다. 분석에 활용한 데이터는 약 3...

카테고리 없음 2026.06.15