매스미디어조사방법론 - SPSS를 이용한 가설검증 기초통계분석 기법

 

  

1. 연구목적 : 독립변인 학력/소득/니아(여기서는 열광적인 사람을 말함)집단/연령 등이 디지털 매체 환경에서 매체 선호도, 미디어 보유 수, 이용 시간, 디지털 TV 구매의사 등 라이프 스타일을 분석하는 데 있다.

 

2. 연구 방법

 

. 교차분석

1)     가설 1 : 고학력자는 저학력자 보다 상대적으로 신문을 열독할 것이다.

2)     가설 2 : 고학력자는 저학력자들에 비해서 미래형 TV HDTV 구매의사가 높을 것이다.

 

. t 검증

1)     가설 1 (독립표본 t 검증) : 학력에 따라서 월 소득의 평균 차이가 날 것이다.

2)     가설 2 (독립표본 t 검증) : TV 시청을 많이 하는 집단은 인터넷 역시 상대적으로 많이 이용할 것이다.

3)     가설 3 (대응표본 t 검증) : TV 시청 정도에 따라서 TV의 화질, 음질, 화면크기 채택 간의 평균 차이가 날 것이다.

 

. F 검증

1)     가설 1 (일원변량 분석 one-way ANOVA) : 소득이 높은 계층은 낮은 계층에 비해서 보유한 미디어 수가 많고 또한 각 계층별로 보유한 미디어 수의 차이가 있을 것이다.

2)     가설 2 : 비디오시청을 많이 하는 집단은 인터넷 이용에도 차이가 있을 것이다.

 

. 상관관계

1)     가설 1 (Pearson r) : 인터넷 이용시간과 TV이용 시간은 상관관계가 있을 것이다.

2)     가설 2 (Spearman ρ) : 연령이 많을수록 신문을 더 상세하게 읽을 것이다

 

 



 

교차분석

 

. 가설 1 : 고학력을 가진 사람은 저학력보다는 상대적으로 신문을 열독할 것이다.

 

종속변인

독립변인

비열독

열독

저학력(대졸 미만)

고학력(대졸 이상)

 

1)     독립변인은 ‘학력’을 학력2로 코딩(대졸 미만 / 대졸이상)과 종속변인 ‘신문열독정도’를 신문열독2로 코딩(14번 ①,,③을 비열독, ④⑤를 열독)하면 아래 <1>과 같이 2×2의 비율차를 검증할 수 있다.  

 

 

빈도

퍼센트

유효 퍼센트

누적퍼센트

유효

거의안읽는다

238

15.3

15.3

15.3

특정코너한두개정도본다

282

18.1

18.1

33.4

제목위주로본다

322

20.7

20.7

54.1

관심있는기사는끝까지본다

480

30.8

30.8

84.9

거의다읽는다

235

15.1

15.1

100.0

합계

1557

100.0

100.0

 

2)     신문열독이 합당한 분석대상인지 살펴보기 위해 빈도분석을 해보면, 비열독자들은 총 842명으로 54.1%를 차지했고, 열독자는 715(45.9%)를 차지하고 있다.

3)     검증 결과 : < 4>의 학력2와 신문열독2의 교차표를 보면 전체 1,550명을 대상으로 설문조사를 한 결과 저학력의 경우 비열독이 61.5%, 열독한다고 대답한 비율이 38.5%이며, 고학력은 비열독 45.8%, 열독 54.2%로 고학력자들이 저학력자들에 비해서 신문을 더 열독한다는 비율 차이가 드러난다.

 

케이스

유효

결측

전체

N

퍼센트

N

퍼센트

N

퍼센트

학력2 * 신문열독2

1550

99.6%

7

.4%

1557

100.0%

 

가설의 유의미성을 검증하기 위해서, < 5> 카이제곱χ2을 살펴보면 유의확률 p 0.01 (신뢰수준 99%) 보다 작기 때문에 이 가설은 유의미한 가설로 판단된다. 즉 학력이 대졸이상의 고학력자들은 상대적으로 저학력자들에 비해서 관심 있는 기사는 끝까지 보며, 신문을 거의 다 읽는다고 볼 수 있다.

 

 

 

 

신문열독2

전체

비열독

열독

학력2

저학력

빈도

511

320

831

기대빈도

450.3

380.7

831.0

학력2 %

61.5%

38.5%

100.0%

고학력

빈도

329

390

719

기대빈도

389.7

329.3

719.0

학력2 %

45.8%

54.2%

100.0%

전체

빈도

840

710

1550

기대빈도

840.0

710.0

1550.0

학력2 %

54.2%

45.8%

100.0%

 

 

자유도

점근 유의확률 (양측검정)

정확한 유의확률 (양측검정)

정확한 유의확률 (단측검정)

Pearson 카이제곱

38.443(b)

1

.000

(5.638926181232e)

 

 

연속수정(a)

37.811

1

.000

 

 

우도비

38.560

1

.000

 

 

Fisher의 정확한 검정

 

 

 

.000

.000

(3.681529380176e)

선형 대 선형결합

38.418

1

.000

 

 

유효 케이스 수

1550

 

 

 

 

a 2x2 표에 대해서만 계산됨

b 0 (.0%)() 5보다 작은 기대 빈도를 가지는 셀입니다. 최소 기대빈도는 329.35입니다.

 

. 가설 2 : 고학력자는 저학력자들에 비해서 미래형 TV HD TV 구매의사가 높을 것이다.

 

1)     코딩 : 독립변인은 ‘학력’을 학력2로 코딩(대졸 미만 / 대졸이상)과 종속변인 ‘구매의향’을 구매의향2로 코딩(3번문제 ①,,③을 비구매, ④⑤를 구매)하면 2×2 형태의 비율차 검증을 할 수 있다.

종속변인

독립변인

비구매

구매

저학력(대졸 미만)

고학력(대졸 이상)

 

2)     < 7>구매와 비구매로 나누는 것이 합당한 것인지 살펴보기 위해 빈도분석을 해보면, 구매의사가 별로 없는 사람은 총 818명으로 52.5%를 차지했고, 구매의사가 있는 사람은 739명으로 47.5%를 차지했다.

 

 

빈도

퍼센트

유효 퍼센트

누적퍼센트

유효

관심없다

69

4.4

4.4

4.4

별로관심

262

16.8

16.8

21.3

그저그렇다

487

31.3

31.3

52.5

어느정도관심

574

36.9

36.9

89.4

관심없다

165

10.6

10.6

100.0

합계

1557

100.0

100.0

 

 

3) 검증결과 : < 9>의 학력2와 구매의향2의 교차표를 보면 전체 1,550명을 대상으로 설문조사를 한 결과 저학력의 경우 구매를 망설이거나 구매하는 것에 관심을 보이지 않는 의견이 55.4%, 구매할 의향이 있다고 밝힌 의견이 44.6%로 구매하지 않을 비율이 많다. 고학력의 경우 구매하지 않겠다가 44.1%, 구매하겠다는 의견이 55.9%로 저학력과 반대의 결과를 보여준다.

학력2 * 구매의향2

케이스

유효

결측

전체

N

퍼센트

N

퍼센트

N

퍼센트

1550

99.6%

7

.4%

1557

100.0%

 

가설의 유의미성을 검증하기 위해서 < 10> 카이제곱χ2을 살펴보면, 카이제곱 19.570b, 유의확률은 .000으로 p < 0.01 보다 작기 때문에 이 가설은 유의미한 가설로 채택된다. 즉 학력이 대졸이상의 고학력자들은 상대적으로 저학력자들에 비해서 미래형 TV HDTV에 관심을 가진다고 볼 수 있다. 결론적으로 고학력자들은 저학력자들에 비해서 상대적으로 신문을 더 열독하고 새로운 매체인 디지털TV에 대해서도 구매의사가 높다고 볼 수 있다.

 

 

 

 

구매의향2

전체

비구매

구매

학력2

저학력

빈도

460

371

831

기대빈도

416.6

414.4

831.0

학력2 %

55.4%

44.6%

100.0%

고학력

빈도

317

402

719

기대빈도

360.4

358.6

719.0

학력2 %

44.1%

55.9%

100.0%

전체

빈도

777

773

1550

기대빈도

777.0

773.0

1550.0

학력2 %

50.1%

49.9%

100.0%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

자유도

점근 유의확률 (양측검정)

정확한 유의확률 (양측검정)

정확한 유의확률 (단측검정)

Pearson 카이제곱

19.570(b)

1

.000

.000

(1.162308501043e-005)

.000

(6.010137166627e)

연속수정(a)

19.122

1

.000

우도비

19.612

1

.000

Fisher의 정확한 검정

 

 

 

선형 대 선형결합

19.558

1

.000

유효 케이스 수

1550

 

 

a 2x2 표에 대해서만 계산됨

b 0 (.0%)() 5보다 작은 기대 빈도를 가지는 셀입니다. 최소 기대빈도는 358.57입니다.

 

t검증

 

. 가설 1 : 학력에 따라서 월 소득 평균 차이가 날 것이다.

 

 

학력2

N

평균

표준편차

평균의 표준오차

소득

저학력

815

4.26

2.410

.084

고학력

706

5.09

2.979

.112

1)     두 집단(고학력과 저학력)에 따라서 월소득의 평균의 차이가 있는가를 분석하기 때문에 독립표본 t검증을 쓴다. 집단 통계량을 < 11>을 살펴보면 저학력의 경우 소득이 200~249만원이며, 고학력의 경우 250~299만원이다. 표준편차는 각각 2.4102.979인데 집단 간 표준편차가 크지만 값 자체가 크기 때문에 계층 내 소득 편차가 크다는 것을 알 수 있다. 따라서 저학력과 고학력 이용자는 소득에 영향을 미치지 않는 독립된 집단이므로, 독립표본 T-테스트를 이용하기로 한다.

 

2)     2) 검증결과 : < 12> F값이 36.952일때 유의확률 (p) .000이므로 유의수준 .001보다 작기 때문에 영가설은 기각되었으므로 등분산이 가정되지 않을 경우의 유의확률과 유의수준을 비교한다. < 12> 독립표본 t검증 levene의 등분산검증을 살펴보면 t값은 -5.955이며 자유도는 1353.97, p 0.01보다 작다. 따라서 학력에 따라서 소득의 평균 차이가 없음을 확인 할 수 있다.

 

Levene의 등분산 검정

평균의 동일성에 대한 t-검정

F

유의확률

t

자유도

유의확률 (양쪽)

평균차

차이의 표준오차

차이의 95% 신뢰구간

하한

상한

등분산이 가정됨

36.952

.000

-6.045

1519

.000

-.836

.138

-1.107

-.565

등분산이 가정되지 않음

 

 

-5.955

1353.973

.000

(3.3088134008)

-.836

.140

-1.111

-.560

 

 

. 가설 : TV 시청을 많이 하는 집단은 인터넷 역시 상대적으로 많이 이용할 것이다.

 

1)     TV시청에 따라서 두 집단(경시청/중시청)에 따라서 인터넷 이용정도가 차이가 날 것이라는 가설을 검증하기 위해 독립표본 T검증을 쓴다. 빈도분석 < 13>에서 0~2시간 미만을 경시청자 집단으로 그 이상을 중시청자 집단으로 나눌 수 있다. TV 시청에 대한 2집단 < 14>통계량을 살펴보면 경시청이 797(평균 51.2%), 중시청이 760(48.8%)이다.

 

 

빈도

퍼센트

유효 퍼센트

누적퍼센트

유효

1시간미만

261

16.8

16.8

16.8

1~2시간

536

34.4

34.4

51.2

2~3시간미만

436

28.0

28.0

79.2

3~4시간미만

183

11.8

11.8

90.9

4시간이상

141

9.1

9.1

100.0

합계

1557

100.0

100.0

 

 

2)     분석 : < 15> 집단통계량을 살펴보면 경시청과 중시청의 표준편차는 각각 1.416 1.516으로 집단 간 차이가 미약하게 존재한다. < 16> F값이 11.314일때 유의확률 (p) .001이므로 유의수준 p .001에서는 영가설이 기각되므로 등분산이 가정되지 않을 경우의 유의확률과 유의수준을 비교한다. < 16> 독립표본 t검증 levene의 등분산검증 가정되지 않은 t값은 -2.749이며 자유도는 1336.847, p 0.006이다. 즉 유의확률 0.01 수준에서 TV를 많이 보는 집단은 적게 보는 집단에 비해서 인터넷 이용 시간 또한 많을 것이다 가설은 채택된다.

 

 

TV시청정도

N

평균

표준편차

평균의 표준오차

인터넷

경시청

797

2.92

1.416

.050

중시청

760

3.12

1.506

.055

 

 

 

Levene의 등분산 검정

평균의 동일성에 대한 t-검정

F

유의확률

t

자유도

유의확률 (양쪽)

평균차

차이의 표준오차

차이의 95% 신뢰구간

하한

상한

인터넷

등분산이 가정됨

11.314

.001

-2.753

1555

.006

-.204

.074

-.349

-.059

등분산이 가정되지 않음

 

 

-2.749

1536.847

.006

-.204

.074

-.349

-.058

 

   

. 가설 2 (대응표본 t 검증) : TV 시청 정도에 따라서 TV의 화질, 음질, 화면크기 채택 간의 평균 차이가 날 것이다.

1)      TV시청 정도에 따라서 화질과 음질, 화면 크기를 선호하는 데 있어서 그 평균 차이를 검증하기 위해 대응표본 T검증을 실시한다. 모표본에서 추출한 2집단은 1,557명으로 유의수준 0.01(신뢰구간 99%)에서 검정을 해보았다.

 

 

 

평균

N

표준편차

평균의 표준오차

대응 1

TV기능중화질이무엇보다중요

3.97

1557

.899

.023

TV시청정도

1.49

1557

.500

.013

대응 2

TV기능중음질이중요

3.82

1557

.891

.023

TV시청정도

1.49

1557

.500

.013

대응 3

TV기능중화면크기가커야함

3.60

1557

.976

.025

TV시청정도

1.49

1557

.500

.013

 

2)      분석 : < 17> 분석 결과를 보면, 독립표본 회사원은 화질선호도 3.97, 음질 선호도 3.82, 화면크기 선호도 3.60으로 화질, 음질, 크기순으로 나타났다. < 18> 대응표본 상관계수를 보면, 유의확률이 각각 .60, .171, .082로 유의수준 p .01보다 크다. 따라서 TV시청 정도에 따른 화질, 음질, 크기 채택의 평균치 간의 차이는 없다. 다만 대응 1,3 2사이에는 약간의 유의미한 차이가 존재한다고 볼 수 있다.

 

 

 

N

상관계수

유의확률

대응 1

TV기능중화질이무엇보다중요 &TV시청정도

1557

.048

.060

대응 2

TV기능중음질이중요 &TV시청정도

1557

.035

.171

대응 3

TV기능중화면크기가커야함 &TV시청정도

1557

.044

.082

 

 

 

대응차

t

자유도

유의확률 (양쪽)

평균

표준편차

평균의 표준오차

차이의 95% 신뢰구간

하한

상한

대응 1

TV기능중화질이무엇보다중요 - TV시청정도

2.478

1.008

.026

2.428

2.529

97.036

1556

.000

대응 2

TV기능중음질이중요 - TV시청정도

2.328

1.007

.026

2.278

2.378

91.230

1556

.000

대응 3

TV기능중화면크기가커야함 - TV시청정도

2.107

1.076

.027

2.054

2.161

77.243

1556

.000

 

 

ANOVA (F test)

 

. 가설 1 (일원변량 분석 one-way ANOVA) : 소득높은 계층은 낮은 계층에 비해서 보유한 미디어 수가 많고 각 계층별로 보유한 미디어 수의 차이가 있을 것이다.

 

N

유효

1557

결측

0

평균

2.97

평균의 표준오차

.031

중위수

3.00

최빈값

3

표준편차

1.207

분산

1.458

왜도

.412

왜도의 표준오차

.062

첨도

.588

첨도의 표준오차

.124

범위

8

최소값

0

최대값

8

합계

4623

1)     <10번 설문> 가정에서 보유한 미디어 수를 연속적 변인으로 만들어 빈도분석을 한 결과 미디어를 3(최빈값 3) 가진 사람이 636(40.8%)으로 제일 많고 층이 두텁다는 것을 알 수 있다. 또한 3개 이하로 가진 사람이 제일 많고 많이 가진 사람들이 적음을 알 수 있다. 따라서 tail 형이다.

 

 

 

빈도

퍼센트

유효 퍼센트

누적퍼센트

유효

0

8

.5

.5

.5

1

171

11.0

11.0

11.5

2

318

20.4

20.4

31.9

3

636

40.8

40.8

72.8

4

266

17.1

17.1

89.9

5

116

7.5

7.5

97.3

6

32

2.1

2.1

99.4

7

8

.5

.5

99.9

8

2

.1

.1

100.0

합계

1557

100.0

100.0

 

 

빈도

퍼센트

유효 퍼센트

누적퍼센트

유효

100만원미만

128

8.2

8.4

8.4

100~149만원

193

12.4

12.7

21.0

150~149만원

261

16.8

17.1

38.2

200~249만원

295

18.9

19.3

57.5

250~299만원

204

13.1

13.4

70.9

300~349만원

165

10.6

10.8

81.7

350~399만원

66

4.2

4.3

86.0

400~449만원

47

3.0

3.1

89.1

9

44

2.8

2.9

92.0

500~549만원

41

2.6

2.7

94.7

550~599만원

17

1.1

1.1

95.8

600만원이상

64

4.1

4.2

100.0

합계

1525

97.9

100.0

결측

시스템 결측값

32

2.1

합계

1557

100.0

 

2)     < 22> 소득을 3집단으로 코딩(//)하면 < 23>과 같이 100만원~149만원이 321명으로 21%, 중은 150만원에서~349만원으로 925(60.7%), 상은 350만원~600만원 이상으로 279명으로 18.3%를 차지한다. 따라서 왜도와 첨도를 살펴보면 +이며 상위층 수가 적다는 것을 알 수 있다.

 

 

 

N

평균

표준편차

표준오차

평균에 대한 95% 신뢰구간

최소값

최대값

하한값

상한값

저소득

321

2.57

1.082

.060

2.45

2.69

0

6

중산층

925

2.99

1.173

.039

2.91

3.07

0

8

상위층

279

3.37

1.310

.078

3.22

3.53

1

8

합계

1525

2.97

1.207

.031

2.91

3.03

0

8

 

 

제곱합

자유도

평균제곱

F

유의확률

집단-

96.168

2

48.084

34.477

.000

집단-

2122.675

1522

1.395

 

 

합계

2218.843

1524

 

 

 

 

(I) 소득2

(J) 소득2

평균차 (I-J)

표준오차

유의확률

95% 신뢰구간

하한값

상한값

저소득

중산층

-.417(*)

.077

.000

-.60

-.23

상위층

-.800(*)

.097

.000

-1.04

-.56

중산층

저소득

.417(*)

.077

.000

.23

.60

상위층

-.382(*)

.081

.000

-.58

-.18

상위층

저소득

.800(*)

.097

.000

.56

1.04

중산층

.382(*)

.081

.000

.18

.58

* .05 수준에서 평균차가 큽니다.

 

3)     분석 : F 테스트 결과 기< 23>의 기술통계를 살펴보면 저소득층은 평균 2.57개를 소유(321), 중산층은 2.99(925), 상위층은 3.37(279)를 소유하고 있다. 보유한 미디어수의 유의미한 차이를 분석하기 위해 < 24>의 분산분석을 살펴보면 집단간 F 값이 34.477이다. 유의확률 p .000이다. 집단별 다중비교를 살펴보면 평균차가 크며 모두 유의수준 p 0.1% 수준에서 각 집단별로 평균차이가 나고 각각 유의미한 차이가 있다고 할 수 있다.

 

 

. 가설 2 : 비디오시청을 많이 하는 사람은 인터넷 역시 많이 이용할 것이다.

 

1)     <15번 설문 : 평균적으로 일주일에 비디오 시청을 어느 정도 하십니까?> 라는 질문지를 분석하기 전에 빈도분석을 실시하면 안본다 815(52.3%), 1~2 566(36.4%), , 3~7 176(11.3%)으로 3 그룹으로 독립변수를 생성한다.  

빈도

퍼센트

유효 퍼센트

누적퍼센트

유효

안본다

815

52.3

52.3

52.3

1~2

566

36.4

36.4

88.7

3~4

116

7.5

7.5

96.1

5~6

42

2.7

2.7

98.8

7이상

18

1.2

1.2

100.0

합계

1557

100.0

100.0

 

 

 

빈도

퍼센트

유효 퍼센트

누적퍼센트

유효

안봄

815

52.3

52.3

52.3

한두편

566

36.4

36.4

88.7

메니아

176

11.3

11.3

100.0

합계

1557

100.0

100.0

 

 

(I) 비디오시청2

(J) 비디오시청2

평균차 (I-J)

표준오차

유의확률

95% 신뢰구간

하한값

상한값

안봄

1~2

-.177(*)

.044

.000

-.28

-.07

메니아

-.220(*)

.067

.004

-.38

-.06

1~2

안봄

.177(*)

.044

.000

.07

.28

메니아

-.043

.069

.823

-.21

.13

메니아

안봄

.220(*)

.067

.004

.06

.38

1~2

.043

.069

.823

-.13

.21

* .05 수준에서 평균차가 큽니다.

 

2)     분석 : F 테스트 결과 기< 28>의 기술통계를 살펴보면 독립변인 인터넷 이용시간 평균이 세 집단 모두 비슷하지만 집단간 F 값이 10.737이며, 유의확률 p .000이다. F값이 충분히 크고, p가 낮다. < 30> 집단별 다중비교를 살펴보면 ‘안보는 집단’과 ‘1~2편 보는 집단’, ‘안보는 집단’과 ‘메니아 집단’은 유의확률 p가 각각 .000 .004이므로 신뢰수준 99%(유의확률 0.01)에서 집단 간 평균차이가 유의미하다. 나머지 집단 간에는 평균치 간의 차이를 발견할 수 없다.  

 

상관관계 correlation

 

. 가설 1(Pearson r) : 인터넷 이용시간과 TV이용 시간은 정(+)의 상관관계가 있을 것이다.

 

1)    분석 : TV이용 시간과 인터넷 이용시간은 연속변인에 해당한다. 따라서 적률상관관계 Pearson r 분석을 하면 +0.072 값이 도출된다. 유의수준 p 값이 .005이기 때문에 0.01 수준에서 유의미한 가설로 채택할 수 있다. 따라서 TV와 인터넷 이용 간의 관계에는 상관관계가 있으나 그 강도는 미약하다. 귀무가설은 기각되고 연구가설은 채택할 수 있다.

 

 

TV 이용시간

인터넷 이용시간

TV 이용시간

Pearson 상관계수

1

.072(**)

유의확률 (양쪽)

 

.005

인터넷 이용시간

Pearson 상관계수

.072(**)

1

유의확률 (양쪽)

.005

 

** 상관계수는 0.01 수준(양쪽)에서 유의합니다.

a 목록별 N=1557

 

 

 

 

만연령

신문열독률

Spearman rho

만연령

상관계수

1.000

.215(**)

유의확률(단측)

.

.000

신문열독률

상관계수

.215(**)

1.000

유의확률(단측)

.000

.

** 상관 유의수준이 0.01입니다(단측).

a 목록별 N = 1551

 

. 가설 2 (Spearman ρ) : 연령이 많을수록 신문을 더 상세하게 읽을 것이다.

 

1)    분석 : 위 가설은 서열상관관계 또는 순위상관관계에 해당된다. Spearman ρ 관계로 분석한 결과 그 값이 + 0.215 이다. 따라서 정비례 관계이며 강도 또한 매우 강하다. 유의수준 p 0.01(99% 신뢰수준)이므로 연령이 많을수록 신문을 더 열독한다는 것은 유의미한 관계가 있다고 볼 수 있다

Posted by 노마드 따따와 철따구니
TAG , , , , ,