데이터분석취준 8

Tableau Desktop: 대시보드 수정 및 고찰 (Before, After 비교)

지난번에 제작한 대시보드에 대한 피드백을 얻고자 데이터 분석 커뮤니티에 포스트를 공유하였다.(예상 외로) 많은 분들이 피드백을 해주셔서 이를 바탕으로 대시보드를 수정하고 전/후 비교를 통해 공부해보고자 한다. 이번 포스트에서는,피드백을 바탕으로 대시보드 수정하기수정 후 나아진 점 생각해보기 (왜 이렇게 수정해야 했을까?)변경된 대시보드를 보고 함의점 생각해보기 1. Before지난번에 제작한 대시보드 '서울 내 범죄 발생 현황' 은 다음과 같다.해당 대시보드에 대하여 몇 가지 피드백을 받은 후 전체적으로 문제가 있다고 생각이 되어 수정을 하고자 한다. 2. Feedback받은 피드백들을 바탕으로 해결한 것과 해결하지 못한 것에 대해 서술해보고자 한다.1) 유형별 발생건수 정렬가나다순으로 되어 있는 바 차..

Skills/Tableau 2024.05.03

Tableau Desktop: 범죄 발생 현황 대시보드 만들기 (feat. 맵 차트, 파이 차트, 도넛 차트)

지난 포스트에서 Tableau Desktop을 활용하여 여러 테마의 그래프를 만들어 대시보드를 생성하였다. 이번 포스트에서는, 지역별 범죄 발생 현황 데이터 활용 간단한 데이터 전처리를 통해 데이터 파악 with DataGrip 맵 차트, 파이 차트, 도넛 차트 생성 및 대시보드 제작 with Tableau 1. 데이터 수집 및 불러오기 맵 차트 생성에 집중해보고자 전국 단위로 분포된 값을 보여줄 수 있는 데이터가 필요했고, '공공데이터포털'에서 전국 지역별 범죄 발생 현황을 보여주는 '경찰청 - 범죄 발생 지역별 통계' 데이터를 수집할 수 있었다. DataGrip으로 수집한 데이터를 불러와주었고, 해당 데이터는 'crime'으로 설정하였다. 불러온 데이터의 일부는 다음과 같다. 국내 지역별로 범죄 발생..

Skills/Tableau 2024.04.12

Tableau Desktop: 카드 매출액 분석 대시보드 만들기 (feat. 바 차트, 라인 차트, 맵 차트)

이번 포스트에서는 Tableau를 이용하여 대시보드를 만들어볼 예정이다. Tableau 설명 및 다운로드 바 차트 라인 차트 생성 및 값 표시 태블로 맵 생성 (feat. 서울 지역구) 대시보드 생성 및 저장 Tableau(태블로)는 대표적인 데이터 시각화 플랫폼 Tableau Prep Builder: 데이터 전처리 역할 수행 Tableau Desktop: 데이터 시각화 역할 수행 Tableau Desktop 설치 (https://www.tableau.com/ko-kr/support/releases/desktop/2022.1.2) 학생용 (https://www.tableau.com/ko-kr/academic/students) 1. 시작 설치 후 Tableau Desktop 창을 열어주면 아래와 같은 화면..

Skills/Tableau 2024.04.11

신한카드 데이터 분석 4: 데이터 시각화와 회고 with Python, Tableau

이번 포스트에서는, 두 가지 방식으로 테이블 시각화 해보기 1️⃣ Python 2️⃣ Tableau 프로젝트를 진행하면서 부족했던 점을 돌아보며 회고하기 프로젝트 초기에 세 가지 질문을 설정해 두었다. 그러나 3번 질문을 해결하는 과정에서, 설정한 항목 중 백화점, 면세점, 실외골프/스키, 시계/귀금속에 대해서 이용건수가 조회되지 않았음. 과시소비 경향을 확인할 만큼의 표본 수가 존재하지 않기 때문에 판단에 어려움이 있다고 보았음. 그러므로 1번과 2번 결과에 대해서만 시각화를 진행할 예정이다. 시각화는 Python과 Tableau 두 가지 방식으로 시도해보고자 한다. 1. Python을 이용한 데이터 시각화 1) 수도권 지역의 성별 및 연령대별 소비 분야에 어떠한 차이가 있는가? 시작하기에 앞서, 시각..

Toy Projects 2024.04.05

신한카드 데이터 분석 3: 질문에 대한 답을 찾는 과정 with PyCharm

이번 포스트에서는, 프로젝트 초반에 설정햇던 질문에 대한 답 찾아보기 조회된 결과에 대해 나름의 분석과 의미 찾기 프로젝트 초반에 설정해 두었던 질문은 다음과 같다. 성별 및 연령별 소비 분야에 대해 어떠한 차이가 있는가? 요일별 외식 소비에 차이가 있는가? MZ세대의 과시소비(백화점, 골프, 호텔) 경향 확인해보기 질문에 대한 답을 찾기에 앞서, 중간 정리 단계가 필요하다고 생각하였다. 해당 데이터는 서울/경기에 주로 집중되어 있음. (수도권 과밀화로 인한 것으로 추정) 수도권 지역과 지방의 소비 패턴 비교, 국내외 소비 패턴 비교까지 한다면 범위가 방대해질 것으로 보았음. 수도권으로 한정하여 이용자들의 소비 패턴을 분석하고자 함. 설정한 질문들은 모두 개인 소비에 대한 것임. 개인/법인 분류 컬럼을 ..

Toy Projects 2024.04.04

신한카드 데이터 분석 2.2: 전처리 과정을 통해 데이터 파악하기 with DataGrip

이번 포스트에서는, 국내 이용자들에 이어서 국외 이용자들의 집단별 카드이용금액과 카드이용건수 조회 국내외 이용자들의 매출액 테이블과 업종별 분류 코드 테이블 JOIN 더 구체적인 그룹화를 통한 데이터 파악 1. 국외 이용자들의 카드이용건수와 카드이용금액 조회하기 1) 국가별 카드 이용금액과 이용건수 합계 미국의 카드 이용금액과 이용건수가 압도적으로 높은 것을 확인. 일본의 경우 이용금액이 낮은 편이지만 이용건수는 다른 국가들보다 높은 편임을 알 수 있음. # (국외) 국가별 카드이용금액과 카드이용건수 SELECT `국가별(COUNTRY_ENG_NM)`, SUM(`카드이용금액계(AMT_CORR)`) AS '카드이용액', SUM(`카드이용건수(USECT_CORR)`) AS '카드이용건수' FROM sales..

Toy Projects 2024.03.26

신한카드 데이터 분석 2.1: 전처리 과정을 통해 데이터 파악하기 with DataGrip

이번 포스트에서는, 데이터 전처리 개념과 과정 이해 전처리 해보기 전처리 과정을 통해 데이터 파악하기 1. 데이터 전처리 데이터 전처리는 분석을 위해 수집한 데이터를 분석에 적합한 형태로 가공하는 것이다. 가공된 데이터는 분석 모델을 구축하고 정확한 분석 결과를 제공해 준다. 전처리 과정에서 생각해야 할 것은, 불필요한 데이터 제거 🙅🏻 결측치나 이상치 처리 🔍 2. 데이터 전처리 과정 데이터 정제: 결측치, 이상치를 처리하여 결과에 영향을 미치는 오류 방지 데이터 변환: 날짜, 문자열 변환 데이터 필터링: 조건에 따른 데이터 추출 데이터 정렬: 분석에 필요한 순서대로 데이터 정렬 데이터 그룹화: 그룹별로 분류 후 통계 정보 추출 데이터 병합 및 분할 데이터 샘플링: 샘플 데이터 추출 후 분석 데이터 집..

Toy Projects 2024.03.26

신한카드 데이터 분석 1: DB 및 테이블 생성 with DataGrip

이번 포스트에서는, 사용할 데이터 파악 DB 생성 테이블 생성 (두 가지 방식) 1. 사용할 데이터 분석에 사용될 데이터들의 일부는 아래와 같으며, 모든 테이블은 500개의 row로 구성되어 있다. 이 데이터들을 전처리하기 위해 DataGrip으로 불러와 주는 단계가 필요하다. 1) 내국인 일자별 시간대별 ⏱️ 2) 내국인 성별 연령대별 👫 3) 내국인 집계구 유입지별 🌏 4) 내국인 업종 코드 🏷️ 5) 외국인 일자별 시간대별 ⏱️ 6) 외국인 집계구 국가별 🌏 7) 외국인 업종 코드 🏷️ 2. DB 생성하기 테이블을 불러오기 전에 DB를 생성할 필요가 있다. SHOW DATABASES; 코드를 실행해 주면 아래와 같이 DB 리스트가 출력된다. DB를 새로 만들고 싶다면 👉🏻 CREATE DATABAS..

Toy Projects 2024.03.19