데이터분석 19

Tableau Desktop: 대시보드 수정 및 고찰 (Before, After 비교)

지난번에 제작한 대시보드에 대한 피드백을 얻고자 데이터 분석 커뮤니티에 포스트를 공유하였다.(예상 외로) 많은 분들이 피드백을 해주셔서 이를 바탕으로 대시보드를 수정하고 전/후 비교를 통해 공부해보고자 한다. 이번 포스트에서는,피드백을 바탕으로 대시보드 수정하기수정 후 나아진 점 생각해보기 (왜 이렇게 수정해야 했을까?)변경된 대시보드를 보고 함의점 생각해보기 1. Before지난번에 제작한 대시보드 '서울 내 범죄 발생 현황' 은 다음과 같다.해당 대시보드에 대하여 몇 가지 피드백을 받은 후 전체적으로 문제가 있다고 생각이 되어 수정을 하고자 한다. 2. Feedback받은 피드백들을 바탕으로 해결한 것과 해결하지 못한 것에 대해 서술해보고자 한다.1) 유형별 발생건수 정렬가나다순으로 되어 있는 바 차..

Skills/Tableau 2024.05.03

Tableau Desktop: 카드 매출액 분석 대시보드 만들기 (feat. 바 차트, 라인 차트, 맵 차트)

이번 포스트에서는 Tableau를 이용하여 대시보드를 만들어볼 예정이다. Tableau 설명 및 다운로드 바 차트 라인 차트 생성 및 값 표시 태블로 맵 생성 (feat. 서울 지역구) 대시보드 생성 및 저장 Tableau(태블로)는 대표적인 데이터 시각화 플랫폼 Tableau Prep Builder: 데이터 전처리 역할 수행 Tableau Desktop: 데이터 시각화 역할 수행 Tableau Desktop 설치 (https://www.tableau.com/ko-kr/support/releases/desktop/2022.1.2) 학생용 (https://www.tableau.com/ko-kr/academic/students) 1. 시작 설치 후 Tableau Desktop 창을 열어주면 아래와 같은 화면..

Skills/Tableau 2024.04.11

Matplotlib: 라인 차트와 파이 차트 그리기

이번 포스트에서 Python의 기본적인 시각화 라이브러리인 Matplotlib를 이용하여 파이 차트를 그려볼 예정이다. 사용할 예제 데이터는 다음과 같다. 연도별 외식 소비 요일별 외식 소비 두 테이블을 가지고 라인 차트와 파이 차트를 만들어보고자 한다. 1. 라이브러리 실행 작업에 필요한 라이브러리를 실행해준다. 그리고 본격적으로 시작하기 전 필요한 작업들을 수행해준다. (경고 메세지 무시, 한글 깨짐 방지) # 필요한 패키지 실행하기. import pandas as pd import numpy as np import matplotlib import matplotlib.pyplot as plt # 경고 메세지 무시하기. import warnings warnings.filterwarnings('ignor..

Skills/Python 2024.04.06

신한카드 데이터 분석 4: 데이터 시각화와 회고 with Python, Tableau

이번 포스트에서는, 두 가지 방식으로 테이블 시각화 해보기 1️⃣ Python 2️⃣ Tableau 프로젝트를 진행하면서 부족했던 점을 돌아보며 회고하기 프로젝트 초기에 세 가지 질문을 설정해 두었다. 그러나 3번 질문을 해결하는 과정에서, 설정한 항목 중 백화점, 면세점, 실외골프/스키, 시계/귀금속에 대해서 이용건수가 조회되지 않았음. 과시소비 경향을 확인할 만큼의 표본 수가 존재하지 않기 때문에 판단에 어려움이 있다고 보았음. 그러므로 1번과 2번 결과에 대해서만 시각화를 진행할 예정이다. 시각화는 Python과 Tableau 두 가지 방식으로 시도해보고자 한다. 1. Python을 이용한 데이터 시각화 1) 수도권 지역의 성별 및 연령대별 소비 분야에 어떠한 차이가 있는가? 시작하기에 앞서, 시각..

Toy Projects 2024.04.05

신한카드 데이터 분석 3: 질문에 대한 답을 찾는 과정 with PyCharm

이번 포스트에서는, 프로젝트 초반에 설정햇던 질문에 대한 답 찾아보기 조회된 결과에 대해 나름의 분석과 의미 찾기 프로젝트 초반에 설정해 두었던 질문은 다음과 같다. 성별 및 연령별 소비 분야에 대해 어떠한 차이가 있는가? 요일별 외식 소비에 차이가 있는가? MZ세대의 과시소비(백화점, 골프, 호텔) 경향 확인해보기 질문에 대한 답을 찾기에 앞서, 중간 정리 단계가 필요하다고 생각하였다. 해당 데이터는 서울/경기에 주로 집중되어 있음. (수도권 과밀화로 인한 것으로 추정) 수도권 지역과 지방의 소비 패턴 비교, 국내외 소비 패턴 비교까지 한다면 범위가 방대해질 것으로 보았음. 수도권으로 한정하여 이용자들의 소비 패턴을 분석하고자 함. 설정한 질문들은 모두 개인 소비에 대한 것임. 개인/법인 분류 컬럼을 ..

Toy Projects 2024.04.04

신한카드 데이터 분석 2.2: 전처리 과정을 통해 데이터 파악하기 with DataGrip

이번 포스트에서는, 국내 이용자들에 이어서 국외 이용자들의 집단별 카드이용금액과 카드이용건수 조회 국내외 이용자들의 매출액 테이블과 업종별 분류 코드 테이블 JOIN 더 구체적인 그룹화를 통한 데이터 파악 1. 국외 이용자들의 카드이용건수와 카드이용금액 조회하기 1) 국가별 카드 이용금액과 이용건수 합계 미국의 카드 이용금액과 이용건수가 압도적으로 높은 것을 확인. 일본의 경우 이용금액이 낮은 편이지만 이용건수는 다른 국가들보다 높은 편임을 알 수 있음. # (국외) 국가별 카드이용금액과 카드이용건수 SELECT `국가별(COUNTRY_ENG_NM)`, SUM(`카드이용금액계(AMT_CORR)`) AS '카드이용액', SUM(`카드이용건수(USECT_CORR)`) AS '카드이용건수' FROM sales..

Toy Projects 2024.03.26

신한카드 데이터 분석 2.1: 전처리 과정을 통해 데이터 파악하기 with DataGrip

이번 포스트에서는, 데이터 전처리 개념과 과정 이해 전처리 해보기 전처리 과정을 통해 데이터 파악하기 1. 데이터 전처리 데이터 전처리는 분석을 위해 수집한 데이터를 분석에 적합한 형태로 가공하는 것이다. 가공된 데이터는 분석 모델을 구축하고 정확한 분석 결과를 제공해 준다. 전처리 과정에서 생각해야 할 것은, 불필요한 데이터 제거 🙅🏻 결측치나 이상치 처리 🔍 2. 데이터 전처리 과정 데이터 정제: 결측치, 이상치를 처리하여 결과에 영향을 미치는 오류 방지 데이터 변환: 날짜, 문자열 변환 데이터 필터링: 조건에 따른 데이터 추출 데이터 정렬: 분석에 필요한 순서대로 데이터 정렬 데이터 그룹화: 그룹별로 분류 후 통계 정보 추출 데이터 병합 및 분할 데이터 샘플링: 샘플 데이터 추출 후 분석 데이터 집..

Toy Projects 2024.03.26

신한카드 데이터 분석 1: DB 및 테이블 생성 with DataGrip

이번 포스트에서는, 사용할 데이터 파악 DB 생성 테이블 생성 (두 가지 방식) 1. 사용할 데이터 분석에 사용될 데이터들의 일부는 아래와 같으며, 모든 테이블은 500개의 row로 구성되어 있다. 이 데이터들을 전처리하기 위해 DataGrip으로 불러와 주는 단계가 필요하다. 1) 내국인 일자별 시간대별 ⏱️ 2) 내국인 성별 연령대별 👫 3) 내국인 집계구 유입지별 🌏 4) 내국인 업종 코드 🏷️ 5) 외국인 일자별 시간대별 ⏱️ 6) 외국인 집계구 국가별 🌏 7) 외국인 업종 코드 🏷️ 2. DB 생성하기 테이블을 불러오기 전에 DB를 생성할 필요가 있다. SHOW DATABASES; 코드를 실행해 주면 아래와 같이 DB 리스트가 출력된다. DB를 새로 만들고 싶다면 👉🏻 CREATE DATABAS..

Toy Projects 2024.03.19

신한카드 데이터 분석 0: 준비 단계

프로젝트를 시작하기 전, 지금까지 Python, SQL을 배워보았으니 이 기술들을 활용하여 데이터를 분석하는 경험이 필요하다고 생각 데이터 분석을 통해 몰랐던 부분을 알게 되거나, 이미 예상하고 있었던 경향을 확인함으로써 또 다른 공부를 하기 위해 시작 내가 생각하는 데이터 분석 과정 데이터 수집 데이터 전처리 데이터 분석 분석 결과 도출 데이터 시각화 문제 해결 및 함의점 제공 내가 사용하고자 하는 분석 스킬과 툴 💻 데이터 전처리 및 분석 - MySQL, Python 📊 데이터 시각화 - Tableau 분석 툴은 DateGrip과 Pycharm 사용할 예정 프로젝트 주제 평소 상품 구매 데이터 예제를 가지고 공부했기에 '사람들의 실제 소비 내역을 볼 수 있는' 데이터를 분석하고 싶다는 생각을 했다. ..

Toy Projects 2024.03.15

[학위논문] 데이터 분석 결과가 보여주는 결론 및 함의점

본 시리즈는 제 석사학위논문을 바탕으로 합니다. Python으로 통계 분석을 하고 사후검정을 하는 것도 중요하지만 도출된 결과에서 의미를 찾는 과정 또한 중요하다. 1. 연구의 결론 본 연구는, 인공지능 기술이 다양한 분야로 확산되고 있음을 확인 향후 인간의 인지 과정 즉, 상대방에게 진심을 전달하는 과정에도 인공지능 개입이 일어나는 상황을 고찰해보는 것에서부터 출발 인공지능과 상호작용이 일상화된 사회에서 '인간의 주체성과 책임감을 잃지 않으면서 이용성을 확대할 수 있는 방안'을 찾고자 함 본 연구의 주요 결과는 다음과 같다. ☝🏻 결과물이 실패일 때 참여수준이 높은 집단에서 행위주체감과 내적 귀인이 강하게 형성된다. 결과물이 이용자 의도와 달리 실패한 상황에도 이용자 참여수준이 높으면 행위주체감과 내적..

Skills/Python 2024.03.14