반응형

분류 전체보기 117

Python 머신러닝 개념 및 절차 기초 정리

이 글은 머신러닝 개념, 종류, 기본 용어 및 절차, 알고리즘 종류 기초 정리를 담고 있습니다. 머신러닝 개념 머신러닝은 기계학습(Machine Learning, ML)으로 불림. 이름처럼 컴퓨터가 알고리즘(모델)을 사용하며, 데이터 분석 및 패턴 학습. 학습 결과를 바탕으로 자동화, 예측, 솔루션 제시, 의사결정 등이 가능. 예시: 자율주행, 상담 챗봇, 판매량 예측, 맞춤형 서비스/상품 추천. 머신러닝 종류 지도 학습(Supervised Learning) 사람이 제공한 입출력값(함수 관계, 문제와 정답)을 학습하며 예측. 쉽게 말해, 정답이 있는 것을 학습. 시험을 위한 주입식 교육 같다. 지도 학습 중 하나인 일반화 예시는 다음과 같다. 만약 "A상황(문제)에서 B상황(정답)이 발생한다"라고 학습하..

PYTHON/Python 2024.04.05

Python 머신러닝 피처 엔지니어링(Feature Enginerring) 개념 기초 정리

이 글은 머신러닝 피처 엔지니어링(Feature Enginerring) 개념과 방법 기초 정리를 담고 있습니다. Python 피처 엔지니어링(Feature Enginerring) 개념 특성 공학으로도 불림. 알고리즘(모델) 성능 향상을 위해, 원본으로부터 Feature(x, 독립 변수)를 (재)구성. 테이블의 기존 컬럼을 바탕으로 새 컬럼 추가 혹은 컬럼 제거. 타깃 변수와 의미 있는 변수를 선택하는 과정. 때문에 데이터 도메인 지식, 즉 전문성이 많이 필요한 과정이다. Python 피처 엔지니어링(Feater Enginerring) 방법 피처 엔지니어링에는 여러 방법이 있는데, 그중 몇 가지만 추려보자. Feature Encoding 모델 학습을 위해 모델에 맞는 Feature로 변환. 범주형 변수(문..

PYTHON/Python 2024.04.04

빅데이터(Big Data) 개념 핵심 정리

이 글은 빅데이터 개념, 데이터의 세 가지 종류, 기존 데이터와 빅데이터의 차이 핵심 정리를 담고 있습니다. 빅데이터(Big Data) 개념 관리에 고비용이 필요하거나, 가치를 추출하기 어려운 모든 데이터를 의미 일반적인 DB SW 범위를 초과하는 규모의 데이터를 의미 방대한 양 volume(TB, PB, ZB...) + 비정형성/다양성 variety(이미지, 음성, 텍스트...) + 단기간/빠른 생산 속도 velocity + 복잡성 complexity 데이터의 세 가지 종류 정형 데이터(Structured Data) 定(정할 정) + 型(거푸집 형): 형식이나 틀이 정해져 있다. 즉, 엑셀 시트, table의 컬럼과 로우로 정해진 형식(구조)에 따라 저장되는 데이터. 이산형(숫자, 날짜) 및 짧은 텍스..

Stickiness(고착도) 개념 핵심 정리

이 글은 Stickiness(고착도) 개념, 계산 방법, 예시 등 핵심 정리를 담고 있습니다.   Stickiness(고착도) 서비스/앱 재방문율 측정 지표 중 하나.밀착도, 서비스 의존율 등으로도 불림.* DAU, WAU, MAU 관련 추천 글 활성 사용자 AU 개념 핵심 정리   Stickiness(고착도) 계산 방법 Stickiness(%) = (DAU / MAU)*100 Stickiness는 DAU / MAU 혹은 DAU / WAU로 계산하지만, 주로 DAU / MAU로 계산한다.Stickiness가 100%에 가까울수록, 사용자들이 자주 방문한다고 해석할 수 있다.Stickiness가 20% 이상이라면, 좋은 신호로 해석될 수 있다.하지만 수치보다 증감을 중점적으로 봐야 한다. 이렇게 DAU, ..

리텐션 측정 방법 세 가지(클래식, 롤링, 레인지 리텐션) 개념 핵심 정리

이 글은 리텐션 개념 재정리, 클래식 리텐션, 롤링 리텐션, 레인지 리텐션의 개념과 특성 및 예시 핵심 정리를 담고 있습니다. 리텐션(Retention) 개념 재정리 서비스 재사용률, 재방문율을 의미활성 사용자 기준 설정 후, 무료(단순 사용자) 사용자/유료(실제 사용자) 사용자 구분해서 리텐션 비교 측정 👉 리텐션 관련 추천 글: 리텐션(Retention) 개념 핵심 정리 리텐션 측정 방법 세 가지, 클래식 리텐션(Classic Retention) 첫 방문(Day0) 이후, 특정 일을 기준으로 사용자가 재방문했는가? 에 대한 비율 측정 방법클래식 리텐션은 X-Day Retention or N-Day Retention으로도 불린다. 클래식 리텐션은 "특정 일 기준"이라는 점에서 문제가 발생한다. 만약 특..

Python 머신러닝 피처 스케일링과 min-max 정규화 기초 정리

이 글은 Python 머신러닝 피처 스케일링과 min-max 정규화 개념 기초 정리를 담고 있습니다. 피처 스케일링(Feature scaling) 과적합 방지를 위해, 독립변수(x, Feature)의 범위 값 조정. 이로써 모델 성능 향상 가능. 경사 하강법(Gradient Descent) 기반 알고리즘은 x값이 경사하강법 단계 크기에 영향을 크게 미침. 따라서 피처 스케일링 적용 필요. ex. Linear Regression, Logistic Regression, Neural Network... 점들 간 거리 기반 알고리즘(Distance Based Algorithms)도 피처 스케일링 적용 필요. ex. KNN, K-means, SVM min-max 정규화(Min-max normalization) (..

PYTHON/Python 2024.03.28

리텐션(Retention) 개념 핵심 정리

이 글은 리텐션(Retention) 및 관련 개념의 핵심 정리를 담고 있습니다. AARRR과 리텐션 📌 AARRR(해적 지표) 5단계를 거쳐(퍼널, 깔때기 모양) 서비스가 성장한다고 보는 서비스 성장 분석 방법론 (서비스 성장 지표/서비스 성장 평가 프레임 워크) 고객 유치(Acquisition): 프로모션 등으로 새 고객 유치 단계. 사용자를 데려오는 모든 방법을 포괄 활성화(Acivation): 회원 가입, 튜토리얼 등 고객 활성화 단계(사용자를 만드는 단계) 👉 리텐션(Retention): 지속적으로 서비스를 사용하게 만드는 단계 매출(Revenue): 매출을 만드는 단계 추천(Referral): 기존 고객이 다른 고객에게 제품을 추천하는 단계 해적 지표(Pirate Metrics)로 불리기도 함 ..

Python os 모듈 기초 정리

이 글은 os 모듈의 개념과 자주 사용하는 함수의 기초 정리를 담고 있습니다. Python os 모듈 Operating System의 약자, 운영 체제와 상호작용을 할 수 있게 함 운영 체제와 상호작용: 디렉터리/파일 조작 가능(생성, 삭제, 변경, 파일 목록 확인 등등) 디렉토리(directory) (연관성 있는) 파일 여러 개를 모아 둔 곳. 디렉터리 내에 여러 파일과 하위 디렉터리가 존재할 수 있음. 따라서 가장 최상위 디렉터리가 존재하며, 이를 "루트 디렉토리"라고 함. 파이썬 기본 내장 모듈로 설치 필요 없음, import 하면 됨 import os Python os.chdir() 디렉토리 변경 시 사용하는 함수 경로를 입력해야 함, 이때 경로는 큰따옴표(")나 작은따옴표(')로 감싸준다. 경로..

PYTHON/Python 2024.03.25

화씨와 섭씨 온도 개념 및 변환 방법 핵심 정리

이 글은 화씨와 섭씨온도 개념 및 변환 방법의 핵심을 정리해 담고 있습니다. 화씨와 섭씨 온도 개념 핵심 정리 화씨(°F, Degree Farenheit) 시작 온도/물이 어는점: 32° 끓는점: 212° 온도 범위: 32°F - 212°F 미국 및 소수 국가에서 사용 중 섭씨(°C, Degree Celsius) 시작 온도/물이 어는점: 0° 끓는점: 100° 온도 범위: 0°C - 100°C 전 세계적으로 많이 쓰는 온도 단위 화씨와 섭씨 온도 변환 방법 핵심 정리 x: 섭씨 y: 화씨 섭씨 온도 👉 화씨온도 변환: y = 1.8x + 32 화씨온도 👉 섭씨온도 변환: x = (y - 32) / 1.8

윈도우 버전 VScode와 SQL 파일 생성, 실행 방법

이 글은 윈도우 버전이며, VScode와 터미널로 SQL 파일 생성, 실행하는 방법 등을 담고 있습니다. VScode와 SQL 파일 생성, 실행 방법 VScode가 설치되어 있어야 한다. 터미널은 VScode 터미널을 사용하거나, 본인이 직접 열어서 사용하면 된다. 작업 공간(폴더) Workspace 생성하기 먼저 작업 공간(폴더)을 생성해보자, 터미널(cmd)을 켜서 아래처럼 명령한다. *이때 "."은 현재 위치를 의미한다. cd Documents# 문서로 이동 mkdir sql_ws # sql_ws 폴더 생성 cd sql_Ws # sql_ws 폴더로 이동 code . # 현 위치에서 VScode 실행하라는 명령 SQL 파일 생성 위 과정을 거치면, VScode가 자동으로 열리며 생성한 작업 공간이 좌..

SQL/MySQL 2024.03.21
반응형
top