티스토리 뷰
데이터 종류의 구분
- 통계분석의 대상이 되는 모집단이나 표본 집단의 특성값은 숫자나 문자로 표현되는데 이들을 ‘데이터’ 또는 ‘자료’라고 한다.
수집된 데이터 종류의 구분
-통계분석을 할 때 사용하는 데이터는 연구 목적을 위해 별도로 수집하는 1차 데이터와 다른 곳에서 이미 수집 및 정리를 마친 2차 데이터가 있다.
① 1차 데이터
목적에 맞게 직접 대상을 선정하여 수집하는 데이터, 자료 수집에 시간과 비용이 많이 소요됨
(통계 분석에 맞게 수집하는 데이터이기 때문에 가장 적합한 데이터이지만 자료 수집에 시간과 비용이 소요된다.)
② 2차 데이터
다른 목적을 위해 과거에 수집된 데이터. 빠르게 활용 가능
(이미 수집하여 가공한 데이터이며 대부분 다른 목적을 위해 과거에 수집한 자료. 2차 데이터를 사용할 경우 데이터의 종류를 구분하면 저비용으로 빠르게통계 분석을 실시할 수 있다. )
형태에 따른 데이터의 종류
- 데이터 형태에 따라 간결하게 구분하는 방법으로 범주형과 수치형을 나눌 수 있습니다.
1) 범주형 데이터
질적 데이터. 그룹으로 나눠지는 데이터, 계산할 수 없는 데이터
-명목형: 명칭으로 구분되는 데이터
예) 성별 (남자, 여자), 출퇴근시 교통수단(도보, 자차, 대중교통) 등
-코드형: 명목형을 수치로 변환한 데이터
분석을 수행하려면 명목형을 그대로 사용할 수 없으므로, 수치화해야함.
예) 성별(남자: 1, 여자: 2)
예) 출퇴근 교통수단 (도보: 1, 자차: 2, 대중교통: 3 )
2) 수치형 데이터
양적 데이터, 평균, 중위수 등의 계산을 할 수 있는 데이터
-이산형: 정수로 표시할 수 있는 데이터
예) 가족구성원의 수(2), 나이(45) 등
-연속형: 연속적인 수치로, 정수로 딱 떨어지지 않는 데이터
예) 길이(12.5cm), 무게(3.25kg) 등
척도에 따른 데이터의 종류
- 통계 분석을 위한 데이터를 척도에 따라 구분하면 다음과 같습니다.
1) 질적 데이터(범주형)
데이터를 구분하여 그룹으로 나눌 수 있는 데이터
-명목형: 명칭으로 분류하여 수치로 변환한 데이터
예) 성별을 남자, 여자로 구분하여 남자는 1, 여자는 2
예) 온라인 매장은 1, 오프라인 매장은 2
-순서형: 순서적으로 의미가 있는 데이터,
예) 1학년은 1, 2학년은 2
예) A등급은 1, B등급은 2, C등급은 3
2) 양적 데이터(연속형)
수치로 표시된 데이터를 조사 목적에 따라 구분한 데이터
-등간형: 데이터인 숫자의 간격에 의미가 있는 데이터. 데이터가 없다는 의미의 0값이 존재하지 않는 데이터
예) 설문문항 좋음 3, 보통 2, 나쁨 1
예) 온도: 0도에 비해 낮으면 영하 (-16˚), 높으면 영상 (21˚)
-비율형: 수치의 크고 작은 값의 차이 자체에 의미가 있는 데이터. 없다는 의미의 0값이 존재하는 데이터
예) 길이(12.5cm), 무게(3.25kg), 시간(3분 13초)
함수로 데이터 요약
1) 수집된 데이터의 속성
2) 함수로 데이터 요약
엑셀 함수로 전체 인원 수와 명목 데이터별 인원 수 구하기
설문에 참여한 전체 응답자의 수와 각 명목형 데이터의 빈도를 구할 때는 엑셀의 함수 중 개수를 세는 함수를 사용합니다.
(출퇴근 소요 시간을 정리한 자료에서 응답자의 수는 엑셀 함수 COUNT를 사용해서 구할 수 있습니다. )
함수식
-응답자 수 =COUNT(순번의 범위)
-남자, 여자 =COUNTIF(성별의 범위, 조건)
-수도권, 지방 = COUNTIF(지역의 범위, 조건)
피벗테이블로 데이터 요약하기
피벗테이블은 대량의 데이터를 사용자 관점에서 표를 재구성하여 요약하는 기능 피벗테이블을 사용하면 함수를 사용하지 않아도 더 빠르고 손쉽게 데이터를 요약 할 수 있습니다.
(질적 데이터의 경우 데이터들의 빈도 또는 수량을 바로 요약할 수 있고, 양적 데이터라면 평균, 중위수, 최빈수, 분산, 표준편차 등의 기초통계량도 구할 수 있습니다. 이번 차시에는 피벗테이블을 활용해 질적 데이터의 빈도를 구하는 과정을 알아
보겠습니다.)
데이터가 입력된 표를 피벗테이블로 만들면 각 변수들을 자유롭게 행과 열로배치하여 해당되는 값을 요약할 수 있습니다.
요약할 데이터를 피벗테이블의 각 영역에 선택 또는 이동을 하는 방법으로 각 변수의 빈도를 바로 계산할 수 있고,
피벗테이블의 값 표시 형식 메뉴를 이용하여 변수값들의 비율도 손쉽게 계산할 수있습니다.
(피벗테이블의 각 영역에 들어갈 값이 문자일 경우 필드를 선택하면 곧바로 ‘개수’를 구하는 함수가 적용된다)
'빅데이터 > 엑셀로 배우는 통계분석' 카테고리의 다른 글
가설 검정과 통계적 추정 (0) | 2023.05.31 |
---|---|
통계 데이터의 시각화 방법 (0) | 2023.05.31 |
분산과 표준편차 (0) | 2023.05.30 |
중위수와 최빈수(대푯값) (0) | 2023.05.30 |
엑셀 통계분석의 시작 (1) | 2023.05.29 |
- Total
- Today
- Yesterday
- 가트너 2023 전략기술
- 가트너 2023
- 6G
- 공격표면 관리 최소화 방안
- 디지털 휴먼의 발전 단계
- IoT 보안 대응
- IoT 안전 이용환경
- lot 센서 케이블 관리
- 아이튜버크리에이터
- 의료마이데이터
- 리얼VR피싱
- 공격표면관리
- 삼성 네 제로 홈
- 가트너 전략기술
- 공격표면 관리 개념
- 디지털 휴먼 상호작용기술
- 물류로봇 기술 동향
- 공격표면 관리 최신 동향
- lot 동향
- ls전선 전선관제
- 5G
- 사이버공격 대응 전략
- 물류로봇 시장 동향
- 메타버스 대상
- 마이헬스웨이
- 디지털 휴먼 기술
- IoT 보안 이슈
- 사이버저
- 디지털 휴먼
- 지능형 IoT 보안
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |