반응형

분류 전체보기 115

MySQL 평균 구하기(AVG, SUM) 유의점 정리

AVG()평균 계산 시 집계된 데이터 개수가 분모이며, NULL값 제외함이 경우 의도적으로 데이터를 누락한 상태에서 평균 계산하는 것이 아니라면, 잘못된 계산을 할 수도 있다. 예를 들어, 한 달치 데이터의 평균을 구한다고 생각해 보자.* 한 달을 28일 기준으로, 30일 기준으로 잡는 곳도 있어서 절대적으로 한 달을 며칠이다라고 말할 수는 없다. 만약 01/01~01/31까지 쌓인 1월 데이터 기반으로 평균을 낼 때, 주말마다 데이터가 누락되어 있고 오직 평일만 데이터가 쌓여있다면? 실질적인 데이터 개수는 '한 달'이 아니다. 이런 상황에서 AVG()를 사용하면 분모가 30이 아니므로, 정확한 평균 계산이 안 나온다.  SUM()의도적으로 누락한 상태에서 평균을 계산하는 경우가 아니라면 AVG()가 아..

SQL/MySQL 2024.03.08

데이터 분석에서 흔히 하는 실수(feat. 데이터문해력-카사와기 요시키)

이 글은 카사와기 요시키의 "빅데이터 시대, 성과를 이끌어내는 데이터 문해력"을 읽으면서 데이터 분석에 대해 간단히 정리한 글입니다. 데이터 문해력 문해력: 글을 제대로 읽고 이해하는 능력, 문해력은 단순히 글을 읽고 쓴다는 차원이 아니다. 이 책은 제목 그대로 데이터 문해력, 데이터를 제대로 "활용"하는 방식을 다루고 있다. 조금 더 풀어보면, 데이터를 활용할 때의 사고방식 / 데이터 분석의 핵심 등을 담고 있다. 이 책의 목차는 크게 8개로 나뉘어 있다. 이 중 두 번째 목차인 "올바른 데이터로 올바른 문제를 풀고 있는가?"에 대해 간단히 정리해보려 한다. 목적 사고력 저자는 두번째 목차에서 데이터 활용 시 자주 하는 실수, 데이터 활용의 실패 이유 등을 언급하며, 목적 사고력이라는 개념을 사용한다...

EXCEL 파일을 완전하게 로드하지 못했습니다 해결법

이 글은 EXCEL에 대용량 데이터 파일 로드 시 발생하는 "파일을 완전하게 로드하지 못했습니다." 에러 해결법을 담고 있습니다. EXCEL 파일을 완전하게 로드하지 못했습니다. 이건 엑셀에서의 대용량 데이터 파일 전체 업로드 실패 경고창이다. csv 파일은 2,176,211건의 데이터가 담겨 있으나, 엑셀에는 1,048,576건만 로드된 상황. 파일을 완전하게 로드하지 못했습니다 해결법 해결법은 생각보다 어렵지 않고 실제 해결 소요 시간은 2~5분 내외다. 1. [엑셀 - 좌측 상단 "파일" - 좌측 하단 "옵션" 클릭] 2. [Excel 옵션 좌측 "추가 기능" - 관리(A)에서 "COM 추가 기능" - 이동(G) 클릭] 3. [COM 추가 기능 "Micorsoft Power Pivot for Exc..

EXCEL 2024.03.01

MySQL Workbench 날짜 컬럼 데이터 타입과 날짜 형식 바꾸기

문제 상황 사용하려던 데이터 csv 파일을 가져와서 확인해 봤더니, 날짜 컬럼인 InvoiceDate의 데이터 타입이 TEXT인 상황.그리고 테이블을 확인하면, 날짜 형식은 미국식(MDY)이다.   내가 원하는 것은 DATETIME 데이터 타입으로, 날짜 형식은 한국식(YMD)으로 변환하기.   MySQL Workbench 날짜 컬럼 데이터 타입과 날짜 형식 바꾸기 ALTER TABLE: 테이블 변경ADD & DROP COLUMN: 컬럼 생성/삭제STR_TO_DATE: 문자를 날짜 타입으로 변환첫번째 주의할 점은 MySQL Workbench의 안전모드이다.만약 전체 테이블을 변경하고자, 코드를 그냥 실행하면 Error Code 1175를 만날 것이다.이건 워크벤치가 실수로 변경되는 것을 방지하려고 안전모..

SQL/MySQL 2024.02.28

Tableau Prep 태블로 프렙 피벗테이블 사용법 간단 정리

이 글은 태블로 프렙의 피벗테이블 개념, 사용법을 담고 있습니다. Tableau Prep 태블로 프렙 피벗테이블 파이썬, SQL, 엑셀 등에서 데이터 피보팅(Pivoting)으로 자유롭게 데이터를 재구성할 수 있다. 태블로 프렙 또한 클릭만으로 피보팅이 가능하다. 이때 명칭은 pivot, unpivot으로 나뉜다. pivot(rows to columns) 한 컬럼 내 고유 값을 새로운 컬럼(열)으로 바꾼다. 아래 과일명과 색상 컬럼이 있다. 이때 과일명 컬럼 내 고유 값인 딸기, 바나나, 오렌지를 새로운 컬럼으로 pivot 해보자. 과일명 색상 🍓딸기 빨강 🍌 바나나 노랑 🍊 오렌지 주황 ⬇️ 🍓딸기 🍌 바나나 🍊 오렌지 빨강 노랑 주황 unpivot(columns to rows) pivot의 반대 개념..

TABLEAU 2024.02.26

Tableau 태블로 프렙(Tableau Prep)은 무엇인가

이 글은 태블로 프렙(Tableau Prep)에 대한 간략한 설명, 주요 기능을 다룹니다. 태블로 프렙(Tableau Prep) 태블로 프렙은 태블로의 여러 제품군 중 하나이다. 이는 데이터 전처리, 데이터 조인/유니온/그룹화 등을 오직 클릭만으로(노코드) 가능하게 만드는 툴이다. * 태블로는 데이터 시각화 툴로 유명한데, 이때 사용하는 태블로 데스크톱은 pc에서 데이터를 시각화할 때 사용한다. 태블로 프렙은 무료 평가판으로 2주 동안 사용할 수 있으며, 이후에는 유료 결제를 해야 한다. 만약 학생이라면 학교 메일로 인증 후, 1년간 무료로 사용할 수 있는 제품키를 받아서 사용하면 된다. 👉 태블로 프렙 빌더 설치 링크 태블로 프렙(Tableau Prep) 주요 기능 6가지 태블로 프렙의 주요 기능은 데..

TABLEAU 2024.02.23

활성 사용자 AU 개념 핵심 정리

활성 사용자 (Active User, AU) 해당 기간 동안 접속한 각각의 사용자 사용자 수를 배타적으로 계산하기 위함 리텐션, 전환 같은 KPI의 출발점 * 이와 비슷한 개념으로 고유 방문자 (Unique Visitor, UV)가 있다. 하지만 "고유" 보다 "활성"이라는 개념이 요즘 비즈니스에 더 적합하여, 활성 사용자 개념을 사용함. DAU, WAU, MAU DAU, DUV: daily, 24시간 WAU, WUV: weekly, 7일 MAU, MUV: monthly, 30일, 1일~말일/28일 위 지표로 사용자의 서비스 애정도(충성도, Stickiness) 계산. 예: DAU/MAU = 1/5 = 20% = 사용자 1명이 5일에 1번씩 서비스 이용. 즉, MAU가 낮아도 비율이 높으면 충성도 높은 ..

Python 카카오 오픈 API(REST API) 주소로 위도, 경도 좌표 찾기

카카오 오픈 API 내가 가진 데이터셋에 위도, 경도가 없었다. 그래서 주소를 바탕으로 위도, 경도 좌표를 찾아주는 카카오 오픈 API(REST API)를 사용했다. 오픈 API(Open Application Programming Interface) 누구나 사용할 수 있도록 공개하고 제공하는 프로그래밍 인터페이스를 의미한다. 이는 특정 기능 구현이나 데이터 접근을 가능하게 한다. 예를 들어, 앱에서 지도를 볼 수 있는 기능을 구현할 때 사용한다. 카카오 오픈 API Kakao Developers 카카오 API를 활용하여 다양한 어플리케이션을 개발해보세요. 카카오 로그인, 메시지 보내기, 친구 API, 인공지능 API 등을 제공합니다. developers.kakao.com 위 사이트에 접속 후, [회원가입..

PYTHON/Python 2024.02.19

MySQL LENGTH, CHAR_LENGTH 함수 사용법과 예시

본문은 MySQL LEGNTH, CHAR_LENGTH 함수 개념 및 사용법, 예시를 통한 함수의 활용법을 담고 있습니다. *예시: 해커랭크 SQL Weather Observation Station 5 문제 MySQL LENGTH, CHAR_LENGTH 함수 파이썬 LEN 함수처럼, 영문자의 Byte를 반환, 문자열 길이를 반환하는 LENGTH와 CHAR_LENGTH 함수가 있다. 영문에는 LENGTH 함수를 사용한다. 한글에는 CHAR_LENGTH함수를 사용하며, 이는 Byte를 고려하지 않고 문자 개수를 반환한다. MySQL LENGTH, CHAR_LENGTH 함수 사용법과 예시 # LENGTH 함수 LENGTH('문자열'); # CHAR_LENGTH 함수 CHAR_LENGTH('문자열'); 문자열은 ..

SQL/MySQL 2024.02.08

Python 문자열 길이, 자료형 요소 개수 반환 함수 len() 기본 정리

Python 문자열 길이 반환 함수 len() 기본 정리 len() 은 객체의 길이(length)를 구할 때 쓴다 하여, 앞 글자(len)를 딴 파이썬 내장 함수이다. 이는 문자열 길이를 셀 때 많이 쓰이며, 사용법은 다음과 같다. # len() 사용법 len("문자열") 문자열 길이 한영 모두 문자 당 길이는 1이다. 아래처럼 python=6개, 파이썬=3개로 각각 6, 3을 반환한다. len("Python") # 6 반환 len("파이썬") # 3 반환 str_1="Python" len(str_1) # 6 반환 공백과 특수문자 길이 공백(띄어쓰기), 특수문자도 문자로 인식되어 1의 길이를 갖는다. len("a book")# 6 반환 len("a_book")# 6 반환 빈 문자열 길이 빈 문자열("",..

PYTHON/Python 2023.12.29
반응형
top