ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 자료의 변이성
    카테고리 없음 2023. 1. 8. 10:18

     

    자료수집을 위해 설문조사 또는 실험을 설계하고 계획하는 단계에서 자료의 변이성을 미리 예측하고 고려하는 것이 매우 중요하다. 다양한 종류의 변이성과 그 예시를 알아보자

     

    1. 측정 변이성

    동일한 사람 또는 사물을 대상으로 반복해서 측정할 경우 그 측정 결과는 다를 수 있다. 가령, 어떤 한 학생이 30cm 자를 이용하여 책상의 가로를 반복해서 측정하는 경우 그 측정값들 사이에 차이가 있을 수 있다. 또는 한 학급의 학생들이 한 번씩 30cm 자를 이용하여 책상의 가로를 측정하는 경우 그 측정값들 또한 다를 수 있다. 이와 같이 하나의 대상을 한 사람이 여러 번 측정하는 경우나 여러 사람이 한 번씩 측정하는 경우 모두 그 측정값들의 결과는 일정하지 않고 다를 것임을 예상할 수 있다. 이와 같이 측정 상황에서 발생할 수 있는 변화, 차이, 다양성, 다름을 측정에 의한 변이성이라고 한다. 한편, 측정하려는 대상이 변하기 때문에 측정에 의한 변화가 발생할 수 있다. 예를 들어, 어떤 사람의 체온을 재는 경우 아무리 정확한 측정 도구를 사용하더라도 그 사람의 체온의 측정값은 서로 다를 것이다.

     

    2. 고유 변이성

    ‘고유 변이성’은 체계에 고유하게 존재하는 변이성을 말한다. 가령, 한 학급에 있는 학생들의 키를 측정할 때 그 측정값들은 서로 다를 것이다. 학생들의 키가 서로 다른 것은 일부 측정도구 때문에 발생할 수도 있지만 대부분은 사람의 키가 갖는 고유한 특성 때문이다. 사람들의 신체는 자연적으로 서로 다르고, 사람은 서로 다른 태도와 능력을 가지고 있으며, 서로 다른 의견이나 감정을 가지고 있다. 우리가 이런 자연적으로 발생한 사람의 속성(키, 몸무게, 태도, 의견, 감정 등)을 측정할 때 측정치들 간에 차이를 예상하는 것은 자연스럽다. 같은 종자의 콩을 동일한 환경에서 키우더라도 콩의 길이는 다를 수 있다. 그 이유는 콩의 종자가 서로 다르고 그 종자들마다 고유의 성장 가능성을 잠재하고 있기 때문이다.

     

    3. 유도 변이성

    한 화분에 같은 종류의 콩 종자 5개를 심어 햇빛이 잘 드는 곳에서 키우고, 다른 화분에 동일한 종류의 콩 종자 5개를 심어 그늘에서 키운다고 했을 때 콩의 성장에서 발생하는 차이는 콩의 자연발생에 의한 변이성 때문일 수도 있고 빛의 조건이 달라서 이기 때문일 수도 있다. 이와 관련된 변이성은 햇빛이 콩의 성장에 미치는 영향을 알아보기 위해 의도적으로 유도하면서 발생한 것이다. 한 화분에는 비료를 주고 다른 화분에는 다른 종류의 비료를 주어 키웠을 때 콩의 성장의 차이는 비료의 차이 때문에 생겼을 것이다. 이와 같이 조건을 달리하여 설계한 실험은 다양한 요인들의 영향, 효과, 관계를 결정할 수 있게 해 준다. 자연발생에 의한 변이 성과 의도적으로 요인을 달리하여 다른 요인에 의해 발생하는 변이성을 비교하는 이 기본적인 아이디어가 현대 통계학에서 가장 핵

    심이다. 의학을 연구하는 과학자들은 이 아이디어를 이용하여 어떤 약이 효과가 있고 안전하며 다른 약은 효과가 없거나 해로운 부작용이 있음을 밝힌다. 농업과 관련된 식물을 연구하는 과학자들은 이 아이디어를 이용하여 어떤 식물이 잘 자랄 수 있는 특정 환경을 조사하고 특정 비료가 다른 비료보다 더 효과적이며 특정 화학물질이 다른 물질보다 인체에 무해하고 병충해를 막는데 더 효과적이라는 주장을 세울 수 있다.

     

    4. 표집 변이성

    특정 후보를 지지하는 유권자들의 비율을 알아보기 위해 일부 유권자들을 대상으로 여론조사를 실시하여 이를 통해 추정하는 것은 통계에서 일반적이다. 이때 한 표본에서 얻은 통계치가 다른 한 표본에서 얻은 통계치와 완전히 같지는 않을 것이다. 즉, 동일한 크기의 표본을 반복해서 추출할 때 표본마다 통계치는 서로 다를 것이다. 이와 같이 추출된 표본들 사이에 발생하는 차이를 '표집 변이성’이라고 한다. 만약 한 표본에서 구한 비율을 이용하여 모집단의 비율을 0.6이라고 추정하고 다른 한 표본에서 구한 비율을 이용하여 모집단의 비율을 0.4라고 추정하게 된다면 표본으로부터 얻은 모집단의 정보를 신뢰하기 힘들 것이다. 이런 결과가 가급적 발생하지 않도록 하기 위해서는 표본을 전략적으로 추출할 필요가 있다. 이를 위해 표본은 모집단을 잘 반영하도록 추출해야 하고 표본의 크기는 충분히 커야 한다. 이와 같은 방법으로 뽑힌 표본으로부터 모집단을 추정할 때 표본들 사이에 차이를 수용하지 못할 만큼 경우가 발생할 가능성은 거의 희박하다고 주장할 수 있다.

     

    5. 우연 변이성

    여론조사를 위해 표본을 추출하거나 실험을 설계하는 경우 무작위 아이디어는 두 가지 용도로 사용될 수 있다. 먼저 하나는 표본을 뽑을 때 무작위로 뽑는다. 다른 하나는 실험을 설계할 때 한 집단의 사람들을 무작위로 할당한다.

    무작위 선택과 무작위 할당은 편향을 제거하지만 그 결과에 있어서 우연에 의한 차이를 발생시킬 수 있다. 이러한 차이를 '우연에 의한 변이성'이라고 하고, 이 우연에 의한 변이성은 확률모형으로 설명할 수 있다. 확률은 무작위로 뽑아서 나온 특정 표본의 결과에 대해서는 관심이 없지만 표본을 반복하여 추출했을 때 표본들 간에 차이에 대해서는 관심이 많다. 실험에서는 특정 실험 결과보다는 동일한 실험을 계속 반복할 경우에 생기는 변이성이 중요하다.

     

     

     

    댓글

Designed by Tistory.