데이터 분석가:Applied Data Analytics/Google Data Analytics - 전문 인증서

공정성을 고려해야 된다.

데이터분석 2025. 3. 25. 21:11

공정한 분석을 지원하는 몇 가지 전략은 다음과 같습니다.

분석을 지원하는 몇 가지 전략은 다음과 같습니다.

모범 사례 설명
사용 가능한 모든 데이터를 고려하세요 데이터 분석가로서 당신의 업무 중 일부는 당신의 분석에 어떤 데이터가 유용할지 결정하는 것입니다. 종종 당신이 집중하는 것과 관련이 없거나 당신의 기대와 일치하지 않는 데이터가 있을 것입니다. 하지만 그냥 무시할 수는 없습니다. 당신의 분석이 당신의 기대만이 아니라 진실을 반영하도록 모든 사용 가능한 데이터를 고려하는 것이 중요합니다. 한 주의 교통부는 휴일 교통 패턴을 측정하는 데 관심이 있습니다. 처음에는 교통량과 휴일이라는 사실과 관련된 지표만 포함합니다. 하지만 데이터 팀은 휴일 날씨가 교통량에 어떤 영향을 미칠 수 있는지 고려하지 못했다는 것을 깨닫습니다. 이러한 추가 데이터를 고려하면 더 완전한 통찰력을 얻는 데 도움이 됩니다.
주변 요인을 파악하세요 이 과정에서 배우게 되겠지만, 맥락은 귀하와 귀하의 이해 관계자가 모든 분석의 최종 결론을 이해하는 데 중요합니다. 모든 데이터를 고려하는 것과 마찬가지로, 귀하가 얻고 있는 통찰력에 영향을 미칠 수 있는 주변 요인도 이해해야 합니다. 인사부는 직원 휴가 기간을 더 잘 계획하여 인력 수요를 예상하고자 합니다. 인사부는 국가 은행 공휴일 목록을 데이터 수집 프로세스의 핵심 부분으로 사용합니다. 하지만 은행 달력에 없는 중요한 공휴일을 고려하지 못하여 이를 기념하는 직원에 대한 편견이 생깁니다. 또한 은행 공휴일이 실제 직원 인구에 반드시 적용되지 않을 수 있으므로 인사부에 덜 유용한 결과를 제공합니다.
자체 보고 데이터 포함 자체 보고는 참가자가 자신에 대한 정보를 제공하는 데이터 수집 기술입니다. 자체 보고 데이터는 데이터 수집 프로세스에 공정성을 도입하는 좋은 방법이 될 수 있습니다. 사람들은 다른 사람을 포함하여 세상에 대한 관찰에 의식적이고 무의식적인 편견을 가져옵니다. 자체 보고 방법을 사용하여 데이터를 수집하면 이러한 관찰자 편견을 피하는 데 도움이 될 수 있습니다. 또한 자체 보고 데이터를 수집하는 다른 데이터와 분리하면 결론에 중요한 맥락을 제공합니다! 데이터 분석가는 오프라인 매장의 프로젝트를 진행하고 있습니다. 그들의 목표는 고객 기반에 대해 더 많이 알아가는 것입니다. 이 데이터 분석가는 데이터를 수집할 때 공정성을 고려해야 한다는 것을 알고 있습니다. 그들은 고객이 스스로에 대한 정보를 보고할 수 있도록 설문 조사를 만들기로 결정했습니다. 그렇게 함으로써 다른 인구 통계적 데이터 수집 방법에서 발생할 수 있는 편견을 피할 수 있습니다. 예를 들어, 영업 사원이 고객에 대한 관찰 내용을 보고하도록 하면 직원이 데이터에 대해 무의식적으로 가지고 있던 편견을 도입할 수 있습니다.
오버샘플링을 효과적으로 사용하세요 인구에 대한 데이터를 수집할 때 해당 인구의 실제 구성을 아는 것이 중요합니다. 때때로, 오버샘플링은 그렇지 않으면 공정하게 표현되지 않을 인구의 그룹을 표현하는 데 도움이 될 수 있습니다. 오버샘플링은 인구 에서 비우세 그룹의 샘플 크기를 늘리는 프로세스입니다. 이를 통해 그룹을 더 잘 표현하고 불균형 데이터 세트를 해결하는 데 도움이 될 수 있습니다. 피트니스 회사가 장비 사용자를 위해 새로운 디지털 콘텐츠를 출시하고 있습니다. 그들은 다양한 사용자에게 어필하는 콘텐츠를 디자인하는 데 관심이 있으며, 다른 사람들이 장비와 다른 방식으로 상호 작용할 수 있다는 것을 알고 있습니다. 예를 들어, 사용자 기반의 일부는 70세 이상입니다. 이러한 사용자를 대표하기 위해 데이터에서 과다 샘플링합니다. 이렇게 하면 피트니스 콘텐츠에 대한 의사 결정이 더 포괄적이 될 것입니다.
처음부터 끝까지 공정성에 대해 생각해보세요 분석과 최종 결론이 공정하도록 하려면 프로젝트의 초기 단계부터 데이터 통찰력에 따라 조치를 취할 때까지 공정성을 고려해야 합니다. 즉, 데이터 수집, 정리, 처리 및 분석은 모두 공정성을 염두에 두고 수행해야 합니다. 데이터 팀은 데이터 수집 프로세스에 공정성 측정을 포함시켜 프로젝트를 시작합니다. 이러한 측정에는 인구 과다 샘플링과 자체 보고 데이터 사용이 포함됩니다. 그러나 그들은 프레젠테이션 중에 이러한 측정에 대해 이해 관계자에게 알리지 못합니다. 결과적으로 이해 관계자는 데이터에 대한 왜곡된 이해를 가지고 떠납니다. 이러한 경험에서 얻은 교훈을 바탕으로 그들은 공정성 고려 사항에 대한 핵심 정보를 향후 이해 관계자 프레젠테이션에 추가합니다.

주요 내용

데이터 전문가로서, 당신은 항상 공정성을 고려해야 합니다. 이를 통해 편견을 만들거나 강화하거나 실수로 오해의 소지가 있는 결론을 내리는 것을 피할 수 있습니다. 이러한 모범 사례를 사용하면 분석을 안내하고 더 나은 데이터 전문가가 될 수 있습니다!