전체 글 42

자기소개

업무 효율화를 고민하는 데이터 분석가 비즈니스 가능성을 발견하고 뾰족한 시각으로 문제 해결 방안을 모색하는 것을 좋아합니다. 특히 데이터 속에서 발견한 단서로 큰 퍼포먼스를 일으키는 힘은 혼자가 아닌 함께하는 열정에서 그 가치가 발현된다고 믿습니다. 이를 위해 다른 직군의 팀원들이 데이터를 쉽게 이해할 수 있는 언어로 전달하는 소통 방식을 중요하게 생각합니다. 업무의 효율화와 최적화를 위해 늘 고민하는 데이터 분석가가 되고 싶습니다. 특히 업무 방식의 효율성을 높이는 일은, 여타 부차적인 단계에서 벗어나 빠른 시도와 실패, 그리고 다음 스텝으로 가는 것을 가능하게 해 준다고 생각합니다. 그렇기 때문에 신속하게 문제 상황 및 해결 과정을 기록하고 공유하는 것을 지향합니다.  E-mail. subinchoi..

About 2024.05.22

Tableau Desktop: 대시보드 수정 및 고찰 (Before, After 비교)

지난번에 제작한 대시보드에 대한 피드백을 얻고자 데이터 분석 커뮤니티에 포스트를 공유하였다.(예상 외로) 많은 분들이 피드백을 해주셔서 이를 바탕으로 대시보드를 수정하고 전/후 비교를 통해 공부해보고자 한다. 이번 포스트에서는,피드백을 바탕으로 대시보드 수정하기수정 후 나아진 점 생각해보기 (왜 이렇게 수정해야 했을까?)변경된 대시보드를 보고 함의점 생각해보기 1. Before지난번에 제작한 대시보드 '서울 내 범죄 발생 현황' 은 다음과 같다.해당 대시보드에 대하여 몇 가지 피드백을 받은 후 전체적으로 문제가 있다고 생각이 되어 수정을 하고자 한다. 2. Feedback받은 피드백들을 바탕으로 해결한 것과 해결하지 못한 것에 대해 서술해보고자 한다.1) 유형별 발생건수 정렬가나다순으로 되어 있는 바 차..

Skills/Tableau 2024.05.03

Tableau Desktop: 범죄 발생 현황 대시보드 만들기 (feat. 맵 차트, 파이 차트, 도넛 차트)

지난 포스트에서 Tableau Desktop을 활용하여 여러 테마의 그래프를 만들어 대시보드를 생성하였다. 이번 포스트에서는, 지역별 범죄 발생 현황 데이터 활용 간단한 데이터 전처리를 통해 데이터 파악 with DataGrip 맵 차트, 파이 차트, 도넛 차트 생성 및 대시보드 제작 with Tableau 1. 데이터 수집 및 불러오기 맵 차트 생성에 집중해보고자 전국 단위로 분포된 값을 보여줄 수 있는 데이터가 필요했고, '공공데이터포털'에서 전국 지역별 범죄 발생 현황을 보여주는 '경찰청 - 범죄 발생 지역별 통계' 데이터를 수집할 수 있었다. DataGrip으로 수집한 데이터를 불러와주었고, 해당 데이터는 'crime'으로 설정하였다. 불러온 데이터의 일부는 다음과 같다. 국내 지역별로 범죄 발생..

Skills/Tableau 2024.04.12

Tableau Desktop: 카드 매출액 분석 대시보드 만들기 (feat. 바 차트, 라인 차트, 맵 차트)

이번 포스트에서는 Tableau를 이용하여 대시보드를 만들어볼 예정이다. Tableau 설명 및 다운로드 바 차트 라인 차트 생성 및 값 표시 태블로 맵 생성 (feat. 서울 지역구) 대시보드 생성 및 저장 Tableau(태블로)는 대표적인 데이터 시각화 플랫폼 Tableau Prep Builder: 데이터 전처리 역할 수행 Tableau Desktop: 데이터 시각화 역할 수행 Tableau Desktop 설치 (https://www.tableau.com/ko-kr/support/releases/desktop/2022.1.2) 학생용 (https://www.tableau.com/ko-kr/academic/students) 1. 시작 설치 후 Tableau Desktop 창을 열어주면 아래와 같은 화면..

Skills/Tableau 2024.04.11

Matplotlib: 라인 차트와 파이 차트 그리기

이번 포스트에서 Python의 기본적인 시각화 라이브러리인 Matplotlib를 이용하여 파이 차트를 그려볼 예정이다. 사용할 예제 데이터는 다음과 같다. 연도별 외식 소비 요일별 외식 소비 두 테이블을 가지고 라인 차트와 파이 차트를 만들어보고자 한다. 1. 라이브러리 실행 작업에 필요한 라이브러리를 실행해준다. 그리고 본격적으로 시작하기 전 필요한 작업들을 수행해준다. (경고 메세지 무시, 한글 깨짐 방지) # 필요한 패키지 실행하기. import pandas as pd import numpy as np import matplotlib import matplotlib.pyplot as plt # 경고 메세지 무시하기. import warnings warnings.filterwarnings('ignor..

Skills/Python 2024.04.06

Matplotlib: 이중 막대 그래프 그리기 (feat. 그래프 위에 값 표시)

이번 포스트에서 Python의 기본적인 시각화 라이브러리인 Matplotlib를 이용하여 이중 막대 그래프를 그려볼 예정이다. 사용할 예제 데이터는 다음과 같다. 여성 이용자의 연령별 카드이용건수가 가장 높은 분야 남성 이용자의 연령별 카드이용건수가 가장 높은 분야 두 테이블을 활용하여 남녀 연령별 카드 이용건수가 가장 높은 분야를 이중 막대그래프로 표현해보고자 한다. 1. 라이브러리 실행 먼저 작업에 필요한 패키지들을 실행해준다. 참고로 코드를 출력할 때마다 경고 메세지가 나오는 것이 신경쓰인다면, 아래와 같이 입력해주면 된다. # 작업에 필요한 라이브러리 실행하기. import pandas as pd import numpy as np import matplotlib import matplotlib.p..

Skills/Python 2024.04.06

신한카드 데이터 분석 4: 데이터 시각화와 회고 with Python, Tableau

이번 포스트에서는, 두 가지 방식으로 테이블 시각화 해보기 1️⃣ Python 2️⃣ Tableau 프로젝트를 진행하면서 부족했던 점을 돌아보며 회고하기 프로젝트 초기에 세 가지 질문을 설정해 두었다. 그러나 3번 질문을 해결하는 과정에서, 설정한 항목 중 백화점, 면세점, 실외골프/스키, 시계/귀금속에 대해서 이용건수가 조회되지 않았음. 과시소비 경향을 확인할 만큼의 표본 수가 존재하지 않기 때문에 판단에 어려움이 있다고 보았음. 그러므로 1번과 2번 결과에 대해서만 시각화를 진행할 예정이다. 시각화는 Python과 Tableau 두 가지 방식으로 시도해보고자 한다. 1. Python을 이용한 데이터 시각화 1) 수도권 지역의 성별 및 연령대별 소비 분야에 어떠한 차이가 있는가? 시작하기에 앞서, 시각..

Toy Projects 2024.04.05

신한카드 데이터 분석 3: 질문에 대한 답을 찾는 과정 with PyCharm

이번 포스트에서는, 프로젝트 초반에 설정햇던 질문에 대한 답 찾아보기 조회된 결과에 대해 나름의 분석과 의미 찾기 프로젝트 초반에 설정해 두었던 질문은 다음과 같다. 성별 및 연령별 소비 분야에 대해 어떠한 차이가 있는가? 요일별 외식 소비에 차이가 있는가? MZ세대의 과시소비(백화점, 골프, 호텔) 경향 확인해보기 질문에 대한 답을 찾기에 앞서, 중간 정리 단계가 필요하다고 생각하였다. 해당 데이터는 서울/경기에 주로 집중되어 있음. (수도권 과밀화로 인한 것으로 추정) 수도권 지역과 지방의 소비 패턴 비교, 국내외 소비 패턴 비교까지 한다면 범위가 방대해질 것으로 보았음. 수도권으로 한정하여 이용자들의 소비 패턴을 분석하고자 함. 설정한 질문들은 모두 개인 소비에 대한 것임. 개인/법인 분류 컬럼을 ..

Toy Projects 2024.04.04

신한카드 데이터 분석 2.2: 전처리 과정을 통해 데이터 파악하기 with DataGrip

이번 포스트에서는, 국내 이용자들에 이어서 국외 이용자들의 집단별 카드이용금액과 카드이용건수 조회 국내외 이용자들의 매출액 테이블과 업종별 분류 코드 테이블 JOIN 더 구체적인 그룹화를 통한 데이터 파악 1. 국외 이용자들의 카드이용건수와 카드이용금액 조회하기 1) 국가별 카드 이용금액과 이용건수 합계 미국의 카드 이용금액과 이용건수가 압도적으로 높은 것을 확인. 일본의 경우 이용금액이 낮은 편이지만 이용건수는 다른 국가들보다 높은 편임을 알 수 있음. # (국외) 국가별 카드이용금액과 카드이용건수 SELECT `국가별(COUNTRY_ENG_NM)`, SUM(`카드이용금액계(AMT_CORR)`) AS '카드이용액', SUM(`카드이용건수(USECT_CORR)`) AS '카드이용건수' FROM sales..

Toy Projects 2024.03.26

신한카드 데이터 분석 2.1: 전처리 과정을 통해 데이터 파악하기 with DataGrip

이번 포스트에서는, 데이터 전처리 개념과 과정 이해 전처리 해보기 전처리 과정을 통해 데이터 파악하기 1. 데이터 전처리 데이터 전처리는 분석을 위해 수집한 데이터를 분석에 적합한 형태로 가공하는 것이다. 가공된 데이터는 분석 모델을 구축하고 정확한 분석 결과를 제공해 준다. 전처리 과정에서 생각해야 할 것은, 불필요한 데이터 제거 🙅🏻 결측치나 이상치 처리 🔍 2. 데이터 전처리 과정 데이터 정제: 결측치, 이상치를 처리하여 결과에 영향을 미치는 오류 방지 데이터 변환: 날짜, 문자열 변환 데이터 필터링: 조건에 따른 데이터 추출 데이터 정렬: 분석에 필요한 순서대로 데이터 정렬 데이터 그룹화: 그룹별로 분류 후 통계 정보 추출 데이터 병합 및 분할 데이터 샘플링: 샘플 데이터 추출 후 분석 데이터 집..

Toy Projects 2024.03.26