반응형

데이터분석 2

빅데이터(Big Data) 개념 핵심 정리

이 글은 빅데이터 개념, 데이터의 세 가지 종류, 기존 데이터와 빅데이터의 차이 핵심 정리를 담고 있습니다. 빅데이터(Big Data) 개념 관리에 고비용이 필요하거나, 가치를 추출하기 어려운 모든 데이터를 의미 일반적인 DB SW 범위를 초과하는 규모의 데이터를 의미 방대한 양 volume(TB, PB, ZB...) + 비정형성/다양성 variety(이미지, 음성, 텍스트...) + 단기간/빠른 생산 속도 velocity + 복잡성 complexity 데이터의 세 가지 종류 정형 데이터(Structured Data) 定(정할 정) + 型(거푸집 형): 형식이나 틀이 정해져 있다. 즉, 엑셀 시트, table의 컬럼과 로우로 정해진 형식(구조)에 따라 저장되는 데이터. 이산형(숫자, 날짜) 및 짧은 텍스..

데이터 분석에서 흔히 하는 실수(feat. 데이터문해력-카사와기 요시키)

이 글은 카사와기 요시키의 "빅데이터 시대, 성과를 이끌어내는 데이터 문해력"을 읽으면서 데이터 분석에 대해 간단히 정리한 글입니다. 데이터 문해력 문해력: 글을 제대로 읽고 이해하는 능력, 문해력은 단순히 글을 읽고 쓴다는 차원이 아니다. 이 책은 제목 그대로 데이터 문해력, 데이터를 제대로 "활용"하는 방식을 다루고 있다. 조금 더 풀어보면, 데이터를 활용할 때의 사고방식 / 데이터 분석의 핵심 등을 담고 있다. 이 책의 목차는 크게 8개로 나뉘어 있다. 이 중 두 번째 목차인 "올바른 데이터로 올바른 문제를 풀고 있는가?"에 대해 간단히 정리해보려 한다. 목적 사고력 저자는 두번째 목차에서 데이터 활용 시 자주 하는 실수, 데이터 활용의 실패 이유 등을 언급하며, 목적 사고력이라는 개념을 사용한다...

반응형
top