프로젝트 목록
서브 프로젝트SportsPipeline
Project Detail

NBA Game & Player Analysis

승리 요인과 선수 성과를 한 흐름에서 어떻게 해석할 것인가?

승리 요인, 선수 성과, 플레이 스타일을
하나의 분석 파이프라인으로 연결한

스포츠 데이터 분석입니다.

Decision Moment

질문이 바뀐 순간

이 프로젝트가 단순 분석에서 의사결정 구조로 넘어간 핵심 장면입니다.

Original Question승리 팀은 어떤 특징이 있는가?
Reframed Question승리 요인과 선수 성과를 한 분석 흐름에서 어떻게 설명할 것인가?
Key Evidence
경기·선수 데이터 통합, EDA, 통계 검정, 모델링, 군집화, 예측-실측 상관 0.68~0.72
Final Deliverable
경기/선수 분석 파이프라인과 시각화 결과
What this proves
분리된 데이터 소스를 하나의 분석 흐름으로 연결하는 역량
Evidence Snapshot

근거 스냅샷

숫자가 있는 프로젝트는 검증 지표를 먼저, 데이터가 부족한 프로젝트는 확인 가능한 산출물 중심으로 정리했습니다.

분석 흐름전처리, EDA, 통계 검정, ML, 군집화, 시각화를 Python 모듈로 분리
예측 검증문서 기준 R2 > 0.6, 예측-실측 상관 0.68~0.72, PLUS_MINUS 평균 오차 ±2.5
공개 검증public artifact check와 synthetic dataframe 기반 smoke test가 GitHub Actions에서 실행
Problem / Context

문제와 맥락

주요 도메인
스포츠 분석
역할
데이터 통합 / 모델링 / 결과 해석
기간
2026
형태
개인 프로젝트
Context

스포츠 분석은 승패 요인, 선수 성과, 플레이 스타일이 따로 노는 경우가 많지만, 실제로는 하나의 흐름으로 같이 읽혀야 해석 가치가 커집니다.

Problem

경기 결과, 선수 성과, 팀 특성이 분리되어 있어 어떤 요인이 승리에 연결되는지 한 흐름으로 해석하기 어려웠습니다.

Why it mattered

스포츠 데이터 분석은 설명과 예측이 분리되기 쉬워, 코칭 포인트로 이어질 수 있는 통합 구조가 중요하기 때문입니다.

Data & Method

데이터와 접근

데이터
  • 경기 데이터
  • 선수 기록 데이터
  • 팀 단위 비교 지표
접근
  • 경기와 선수 데이터를 하나의 분석 파이프라인으로 통합
  • EDA, 통계 검정, 모델링, 군집화 순으로 해석 연결
  • 팀 / 선수 특성이 함께 보이도록 시각화 구성
지표 / 기준
  • 승리 요인 비교 지표
  • 선수 / 팀 특성 비교 기준
  • 모델 성능 비교 기준
Output

결과물

경기 데이터와 선수 데이터를 묶고, EDA부터 통계 검정, 예측, 군집화까지 이어지는 하나의 분석 파이프라인으로 정리했습니다.

승리 요인 분석모델링 / 지표 비교선수 / 팀 특성 분석시각화 결과
Key Insight

핵심 포인트

  • 경기와 선수 데이터를 하나의 흐름으로 통합
  • 설명과 예측을 함께 보여주는 구조로 분석 단계를 배치
  • 결과를 코칭 포인트와 스카우팅 해석으로 연결
Limits / Notes

한계와 검토 메모

검증 범위와 추가로 확인해야 할 조건을 숨기지 않고 함께 남겼습니다.

  • full pipeline rerun은 Kaggle 원본 CSV 4개를 로컬 `data/` 폴더에 배치해야 합니다.
  • 공개 저장소 기준으로는 코드, 문서, PNG 산출물, smoke test를 통해 분석 구조를 검토합니다.
  • 실시간 경기 데이터와 연결한 검증은 포함되지 않았습니다.
  • 모델 일반화 성능은 후속 비교 실험이 더 필요합니다.
Links

확인 가능한 산출물

GitHub README와 분석 리포트 문서에서 전체 흐름을 확인할 수 있습니다.

Next Project

다음 프로젝트