데이터를 모으는 방법
질문을 만드는 방법
조사 대상과 조사 방법이 정해지면 무엇을 질문할지 정리해서 질문과 응답 선택지를 만듭니다.
질문 문항을 만들 때 주의해야 할 포인트는 다음과 같습니다.
▶ 하나의 질문에는 한 가지 내용만 담을 것
하나의 질문에 여러 가지 내용이 담기게 되면 각각의 내용에 해당하는 응답 선택지가 따로 존재하게 될 가능성이 생깁니다. 이런 경우 응답자가 어느 응답 선택지를 골라야 할지 헷갈릴 수도 있습니다. 따라서 비슷한 내용이더라도 하나의 질문에는 여러 내용을 담지 않도록 주의해야 합니다.
▶ 유도하는 표현을 쓰지 않을 것
실태를 조사하는 질문에는 해당되지 않지만, 어떤 의견에 찬성하는지 반대하는지를 조사할 경우 응답자의 응답 내용이 질문에 영향을 받기도 합니다. 예를 들어 음식점의 전면 금연화에 대해 찬반을 조사할 때,
A. “당신은 음식점의 전면 금연화에 찬성합니까, 반대합니까?”
B. “‘담배의 규제에 관한 세계보건기구 기본협약’에 나와 있듯이, 간접 흡연이 건강에 미치는 피해는 명백하므로 전면 금연화가 속속 진행되고 있습니다. 선진국 중 실내에서 전면 금연이 실시되지 않은 곳은 우리나라 정도밖엔 없습니다. 당신은 음식점의
전면 금연화에 찬성합니까, 반대합니까?”
와 같은 2가지 질문이 있다고 가정하겠습니다.
B는 단순한 질문(A와 동일한 문장) 앞에 ‘전면 금연화가 옳다’라는 생각이 들게 하는 문장이 포함되어 있어서 A에 비해 ‘찬성’이라고 응답하는 비율이 커질 수 있습니다.
중요한 질문의 내용을 알기 쉽게 만들기 위해서 설명문을 넣는 것 자체는 나쁘지 않지만, 응답자가 아무런 영향을 받지 않은 상태로 응답할 수 있도록 주의를 기울여야 합니다.
▶ 질문의 순서를 고려할 것
가장 처음에 대답하기 어려운 질문이 있으면 설문조사 자체를 진행하기 싫어질 수 있습니다. 그러므로 맨 앞에는 간단히 대답할 수 있는 질문을 배치하는 편이 좋습니다. 그리고 한 설문조사에서 여러 주제에 대해 질문을 할 경우, 질문을 주제별로 묶어두는 것이 좋습니다.
선택지를 만드는 방법
응답 선택지는 ‘응답자가 대답할 것’으로 예상되는 항목을 미리 여러 개 준비해둔 것입니다. 상정할 수 있는 선택지가 너무 많을 경우(예를 들자면 과거 병력 등)에는 어느 정도 선택지를 좁힌 뒤에 ‘기타’를 추가합니다. 그리고 ‘기타’를 고른 경우, 구체적인 내용을 기재할 수 있도록 기입란을 만들어 둡니다. 참고로 처음부터 선택지를 준비하지 않고 응답자가 자유롭게 작성하게 하는 응답 형식도 있습니다.
응답자는 선택지 중에서 해당하는 것을 고르게 되는데, 하나만 고르는 방식(단일 응답: Single Answer, SA)과 여러 개를 고르는 방식(복수 응답: Multiple Answer, MA)이 있습니다. 그리고 복수 응답에는 해당하는 선택지를 ‘모두 고르는’ 선택 개수 제한이 없는 형식과 ‘3개 선택’,‘최대 3개까지 선택’처럼 선택 개수 제한이 있는 형식이 존재합니다.
[그림 2-1]의 설문조사에서는 생활 습관에 대해서 12개의 질문을 하고 있습니다. ‘데이터 01’(292~293쪽)의 Q1~Q12는 해당 설문조사의 결과입니다. 수면 시간을 묻는 Q1에 대해서는 ‘1: 6시간 미만 / 2: 6시간 이상~8시간 미만 / 3: 8시간 이상’의 3가지 선택지가 준비되어 있고, 이외의 질문은 ‘1: 네 / 2: 아니오’ 중 하나로 응답을 받는 형식입니다. 같은 질문이라도 선택지의 패턴은 여러 가지가 될 수 있습니다.
예를 들어, [그림 2-1]의 설문조사에서는 ‘Q7. 단 음식을 좋아하시나요?’라는 질문에 대해 ‘1:네 / 2: 아니오’라는 선택지를 준비했지만, 이것과는 다른 선택지도 생각해볼 수 있습니다.
A. 1: 좋아한다, 2: 좋아하지 않는다 / 1: 좋아한다, 2: 싫어한다
B. 1: 좋아한다, 2: 좋아하지도 싫어하지도 않는다, 3: 좋아하지 않는다 /
1: 좋아한다, 2: 좋아하지도 싫어하지도 않는다, 3: 싫어한다
C. 1: 좋아한다, 2: 약간 좋아한다, 3: 별로 좋아하지 않는다, 4: 좋아하지 않는다 /
1: 좋아한다, 2: 약간 좋아한다, 3: 약간 싫어한다, 4: 싫어한다
D. 1: 좋아한다, 2: 약간 좋아한다, 3: 좋아하지도 싫어하지도 않는다,
4: 별로 좋아하지 않는다, 5: 좋아하지 않는다 /
1: 좋아한다, 2: 약간 좋아한다, 3: 좋아하지도 싫어하지도 않는다,
4: 약간 싫어한다, 5: 싫어한다
D와 같은 5단계 응답 선택지 형식을 5단계 척도라고 부릅니다. 6단계 척도, 7단계 척도로 늘릴 수도 있습니다. 단, 선택지가 늘어난다고 대답하기가 쉬워지는 것은 아닙니다. 그 질문으로 어떤 분석을 할 것인지, 설문조사 전체에 걸친 선택지의 밸런스는 어떠한지 등을 고려해서 선택지를 준비해야 합니다.
기존 자료를 사용해서 데이터를 모으는 방법
요즘에는 알고 싶은 것이 있다면 가장 먼저 인터넷으로 검색부터 해볼 것입니다. 인터넷에는 방대한 데이터가 넘쳐나기 때문입니다. 하지만 데이터 양이 너무 많은 나머지 정말로 알고 싶은 정보를 찾아내지 못하는 경우도 있습니다. 그러므로 평소에 어떤 웹사이트에 어떤 정보가 올라오는지를 정리해두면 도움이 됩니다.
국가통계포털 ‘KOSIS’에는 각 정부 부처에서 공표한 통계 데이터가 올라와 있습니다. 통계 데이터 검색을 비롯하여 시각화 콘텐츠 등의 다양한 정보가 있는 사이트입니다. 아래 주소로 접속해서 어떠한 통계 데이터가 있는지 살펴보세요.
‘데이터 03’(296~297쪽)은 일본의 국가통계포털 사이트인 ‘e-Stat(http://www.e-stat.go.jp)’을 이용하여 만든 것입니다.
엑셀만 알아도 할 수 있는 데이터 과학 자세히 보러가기 >
이전 글 : 피벗 테이블 만드는 방법
최신 콘텐츠