데이터의 유형
- 정성적 데이터와 정량적 데이터
- 정성적 데이터 - 언어·문자로 표현 (ex_매출이 증가하였음)
- 언어나 문자로 표현하면 저장·검색·분석에 당연히 많은 비용이 소모
- 정량적 데이터 - 수치·도형·기호로 표현 (ex_나이, 몸무게)
- 정형 데이터, 비정형 데이터, 반정형 데이터
- 정형 데이터 - 정형화된 틀이 있고 연산 가능
- 비정형 데이터 - 정형화된 틀이 없고 연산이 불가능
- 반정형 데이터 - 형태는 있지만 연산이 불가능
- 암묵지와 형식지
- 암묵지 - 메뉴얼화 되어있지 않고 개인에게 체득화되어 있어 겉으로 드러나지 않음
- ex _ 나만의 요리 레시피, 자전거 타기 등등
- 개인에게 내면화 되어 있음 → 조직에게 공통화
- 형식지 - 문서나 메뉴얼화 된 지식
- ex _ 교과서, 비디오 등등
- 언어·숫자·기호로 표출화 → 개인의 지식으로 연결화
데이터 웨어하우스, 데이터 레이크, 데이터 마트
- 데이터 웨어하우스
- 개인이나 조직이 총체적인 관점에서 의사결정을 위해 공통의 형식으로 변환해 관리
- 데이터 레이크
- 정형 데이터 뿐만이 아닌 비정형 데이터 (소셜 텍스트, 센서 데이터, 이미지, 동영상 등)를 실시간으로 수집, 정제 통합, 분석해 활용하기 위한 데이터 관리 플랫폼
- 데이터 마트
- 데이터 웨어하우스로부터 추출된 작은 데이터 베이스로 특정 목표를 달성하는데 필요한 데이터 제공
DIKW
- Data (데이터) - 가공하기 전의 순수한 수치나 기호
- Infomation (정보) - 패턴을 인식하고 의미를 부여한 데이터
- Knowledge (지식) - 상호 연결된 정보 패턴을 이해하여 이를 토대로 예측한 결과물
- Wisdom (지혜) - 창의적 아이디어
데이터베이스의 특징
- 통합된 데이터 - 동일한 내용이 중복되어 있지 않음
- 저장된 데이터 - 컴퓨터가 접근할 수 있는 저장 매체에 저장됨
- 공용 데이터 - 여러 사용자가 데이터를 공동으로 이용
- 변화되는 데이터 - 새로운 데이터의 삽입, 기존 데이터 삭제, 갱신으로 항상 변화해도 현재의 정확한 데이터를 유지해야함
- 데이터베이스 설계 절차
- 요구사항 분석 → 개념적 설계 → 논리적 설계 → 물리적 설계
기업 내부의 데이터 베이스