기사 본문 영역

상세페이지

논란의 ‘집회 인원’, 빅데이터에 숨어 있다
입력 2019.10.12 (17:45) 수정 2019.10.12 (18:57) 취재K
논란의 ‘집회 인원’, 빅데이터에 숨어 있다
때아닌 숫자 대첩이 벌어졌습니다. 매주 이어지는 대규모 집회 참가 인원을 두고 논란이 끊이지 않고 있습니다.

지난달 28일 열린 서초동 '조국 수호·검찰 개혁' 촛불집회의 주최 측이 밝힌 참가 인원은 200만 명. 지난 3일 광화문 '조국 반대·문재인 정권 규탄' 집회 주최 측은 그보다 많은 300만 명이 참여했다고 밝혔습니다.

이틀 뒤 열린 5일 서초동 집회에선 주최 측이 인원 공식 집계를 하지 않겠다고 밝혔지만, 28일 집회보다는 많은 인원이 왔다고 말했습니다.

참다못해 터져 나온 시민들의 목소리는 결국 그 크기에 관한 다툼으로 번졌습니다. 소모적인 숫자 싸움이 계속되는 가운데, 객관적인 데이터 분석 결과 하나를 제시해봅니다.

■ 휴대폰 이용자 토대로 한 '추정치'…"정확한 값 얻긴 어려워"

‘서울 생활인구’는 서울시와 KT가 공공빅데이터와 통신데이터를 이용해 추계한 값입니다. 쉽게 말하면 KT 기지국에서 이용자들의 휴대폰 단말기 신호를 감지해 서울의 특정 지역, 특정 시점에 존재하는 모든 인구를 추산한 겁니다. KBS는 이 데이터를 이용해 각 집회 참가 인원과 연령대를 살펴보기로 했습니다.

다만 이 수치는 어디까지나 '추정치'라는 점을 미리 밝혀둡니다. 통신 3사 중 시장 점유율 약 30% 정도를 차지하는 KT의 데이터를 기준으로 100% 값을 추정한 것이고, 휴대폰을 꺼둔 사람이나 아예 이용하지 않는 고령자·어린이 등에 대해서도 추정을 통해 데이터를 보정했습니다.

무엇보다 이 수치만으로는 그 시간, 그 장소에 존재했던 사람들의 '목적'까지 파악하는 게 불가능합니다. 친구들과 식사를 하기 위해 서초동을 찾았는지, 아니면 집회에 참석하기 위해서였는지 알 수 없다는 겁니다.

또 드나든 사람의 숫자를 모두 포함한 '연인원' 방식으로 집계된 게 아니라 특정 시점의 인원을 센 것이므로 실제로는 더 많은 인원이 다녀갔을 수도 있습니다. 현재 집회 주최 측은 연인원 방식으로 인원을 집계했다고 밝히고 있습니다.

서울시 빅데이터담당관 관계자는 "전지전능한 AI 로봇이 집계하지 않는 이상 정확한 값을 얻기는 어렵다"며 "그 누구도 정답을 모르는 상황에서 최대한 과학적이고 합리적인 방법을 동원한 것이고, 전문가들이 데이터의 정확성을 검증했다"고 설명했습니다.

또 집회 당시 갑자기 몰린 인파로 통신장애가 발생해 인원이 제대로 집계되지 않았을 수 있다는 지적에 대해서는 "단순 연결 지연이 해당 데이터에 영향을 미치지는 않는다"고 답했습니다.

■ 어떻게 집계했나?

먼저 집계 대상은 각 집회 주최 측이 가장 많은 인원이 참여했다고 밝힌 10월 3일 광화문 집회와, 10월 5일 서초동 집회입니다.




집계 지역은 '서울 생활인구'가 사용하고 있는 통계청 집계구 기준에 맞춰 집회 참가자들의 행렬이 이어진 곳을 중심으로 선정했습니다. 광화문 집회의 경우 광화문 광장과 시청 등을 포함해 7개 집계구를, 서초동 집회의 경우 서초역 사거리와 교대역 등을 포함해 17개 집계구를 선정했습니다. 기존 집계구를 사용하다 보니 집회 참가자들이 있었던 곳만 정확하게 구획하기는 어렵다는 한계가 있습니다.

온전히 집회를 위해 참석한 인원을 추정해보기 위해 배경 인구도 제외했습니다. 무슨 뜻인가 하면 10월 3일 광화문 집회 참석 인원을 추산하기 위해 바로 직전 주말인 9월 28일과 29일 이틀 동안 7개 집계구 총인원(이틀 평균값)을 빼는 방식입니다. 지난 3일은 개천절로 공휴일이기 때문에 평일이 아닌 주말을 비교 대상으로 선정했습니다. 10월 5일 서초동 집회의 경우엔 그 전주 토요일인 28일도 대규모 집회가 열렸으므로, 대신 9월 21일 토요일에 집계된 인원을 뺐습니다.

■ 10.3 광화문 집회는 36만 명, 10.5 서초동 집회는 11만 명


우선 10월 3일 광화문 집회에선, 오전 10시쯤부터 사람들이 늘어나기 시작해 오후 2시 무렵 가장 많은 인원이 모였습니다. 오후 2시 36만 7,157명이 집계됐는데, 한 시간마다 집계되는 인원인 만큼 2시 전후로 이보다 많은 인원이 운집했을 가능성도 있습니다. 집회 참가자들은 오후 5시까지 10만 명 이상 자리를 지키다, 6시 이후 서서히 광화문을 빠져나갔습니다.

10월 5일 서초동 집회도 분석해봤습니다. 가장 많은 사람이 모였던 건 오후 6시~7시 무렵이었습니다. 오후 2시가 지나면서 사람이 몰리기 시작해, 오후 7시 기준으로 11만 4,704명이 모였습니다. 역시 오후 6시~7시 전후로 이보다 많은 인원이 참여했을 가능성이 있습니다.

■ 광화문 집회는 60대 이상이 77%…서초동 집회는 40-50대가 61%


눈에 띄는 것은 두 집회 참가자들의 연령대입니다. 10월 3일 광화문 집회의 경우, 70대 이상이 독보적으로 많았고, 그다음이 60대였습니다. 가장 많은 인원이 모였던 오후 2시 기준으로 70대 이상은 16만 413명, 60대는 12만 3,230명으로 60~70대 이상 노년층이 전체 인원의 77.2%를 차지했습니다. 압도적인 수칩니다. 이후 50대(15.1%), 40대(4.5%), 30대(1.8%) 순으로 나타났습니다.


10월 5일 서초동 집회는 10월 3일 광화문 집회와는 뚜렷하게 다른 양상을 보입니다. 가장 많은 연령대는 40대, 그다음이 50대로 40~50대 중·장년층이 독보적인 비율을 차지합니다. 오후 7시 기준으로 40대는 3만 7,560명, 50대는 3만 3,453명으로 전체 인원의 61.9%입니다. 그다음으로 30대(11.1%)와 60대(9.9%)가 거의 비슷한 수준으로 집계됐습니다.

■ 문제는 숫자가 아니야!

서울시 빅데이터담당관 관계자는 이 두 집회를 두고 "종목이 다른 경기"라고 평가했습니다. 완전히 다른 두 경기를 단일한 잣대로 해석하고 평가할 수 있는 심판은 없다는 겁니다.

그러면서 "숫자는 현상을 찍어내는 것뿐이고 '추정치'라는 한계가 있다"며 "여기에 정치적 의미를 부여해 단순 비교하는 것은 바람직하지 않다"고 거듭 강조했습니다. 해석이 변질되고, 갈등이 확대될까 봐 우려된다는 입장도 조심스럽게 밝혔습니다.

오늘(12일)도 서초동에서 검찰 개혁을 요구하는 집회와 조국 법무부 장관 사퇴를 촉구하는 집회가 열렸습니다. 각 집회에 얼마나 많은 참가자가 왔느냐를 두고 또 한 번 신경전이 벌어질 수도 있습니다.

하지만 집회 참가자들이 다수결의 원칙을 적용하기 위해 광화문으로, 서초동으로 모인 건 아닐 겁니다. 머릿수 싸움에만 몰두해 상대 집회의 의미를 깎아내리는 동안, 정작 그 숫자는 의미를 잃고 있습니다. 거리에 나선 국민들의 요구가 너무나 무거운 상황, 잇따르는 대규모 집회의 본질을 들여다보려는 노력이 필요해 보입니다.
  • 논란의 ‘집회 인원’, 빅데이터에 숨어 있다
    • 입력 2019.10.12 (17:45)
    • 수정 2019.10.12 (18:57)
    취재K
논란의 ‘집회 인원’, 빅데이터에 숨어 있다
때아닌 숫자 대첩이 벌어졌습니다. 매주 이어지는 대규모 집회 참가 인원을 두고 논란이 끊이지 않고 있습니다.

지난달 28일 열린 서초동 '조국 수호·검찰 개혁' 촛불집회의 주최 측이 밝힌 참가 인원은 200만 명. 지난 3일 광화문 '조국 반대·문재인 정권 규탄' 집회 주최 측은 그보다 많은 300만 명이 참여했다고 밝혔습니다.

이틀 뒤 열린 5일 서초동 집회에선 주최 측이 인원 공식 집계를 하지 않겠다고 밝혔지만, 28일 집회보다는 많은 인원이 왔다고 말했습니다.

참다못해 터져 나온 시민들의 목소리는 결국 그 크기에 관한 다툼으로 번졌습니다. 소모적인 숫자 싸움이 계속되는 가운데, 객관적인 데이터 분석 결과 하나를 제시해봅니다.

■ 휴대폰 이용자 토대로 한 '추정치'…"정확한 값 얻긴 어려워"

‘서울 생활인구’는 서울시와 KT가 공공빅데이터와 통신데이터를 이용해 추계한 값입니다. 쉽게 말하면 KT 기지국에서 이용자들의 휴대폰 단말기 신호를 감지해 서울의 특정 지역, 특정 시점에 존재하는 모든 인구를 추산한 겁니다. KBS는 이 데이터를 이용해 각 집회 참가 인원과 연령대를 살펴보기로 했습니다.

다만 이 수치는 어디까지나 '추정치'라는 점을 미리 밝혀둡니다. 통신 3사 중 시장 점유율 약 30% 정도를 차지하는 KT의 데이터를 기준으로 100% 값을 추정한 것이고, 휴대폰을 꺼둔 사람이나 아예 이용하지 않는 고령자·어린이 등에 대해서도 추정을 통해 데이터를 보정했습니다.

무엇보다 이 수치만으로는 그 시간, 그 장소에 존재했던 사람들의 '목적'까지 파악하는 게 불가능합니다. 친구들과 식사를 하기 위해 서초동을 찾았는지, 아니면 집회에 참석하기 위해서였는지 알 수 없다는 겁니다.

또 드나든 사람의 숫자를 모두 포함한 '연인원' 방식으로 집계된 게 아니라 특정 시점의 인원을 센 것이므로 실제로는 더 많은 인원이 다녀갔을 수도 있습니다. 현재 집회 주최 측은 연인원 방식으로 인원을 집계했다고 밝히고 있습니다.

서울시 빅데이터담당관 관계자는 "전지전능한 AI 로봇이 집계하지 않는 이상 정확한 값을 얻기는 어렵다"며 "그 누구도 정답을 모르는 상황에서 최대한 과학적이고 합리적인 방법을 동원한 것이고, 전문가들이 데이터의 정확성을 검증했다"고 설명했습니다.

또 집회 당시 갑자기 몰린 인파로 통신장애가 발생해 인원이 제대로 집계되지 않았을 수 있다는 지적에 대해서는 "단순 연결 지연이 해당 데이터에 영향을 미치지는 않는다"고 답했습니다.

■ 어떻게 집계했나?

먼저 집계 대상은 각 집회 주최 측이 가장 많은 인원이 참여했다고 밝힌 10월 3일 광화문 집회와, 10월 5일 서초동 집회입니다.




집계 지역은 '서울 생활인구'가 사용하고 있는 통계청 집계구 기준에 맞춰 집회 참가자들의 행렬이 이어진 곳을 중심으로 선정했습니다. 광화문 집회의 경우 광화문 광장과 시청 등을 포함해 7개 집계구를, 서초동 집회의 경우 서초역 사거리와 교대역 등을 포함해 17개 집계구를 선정했습니다. 기존 집계구를 사용하다 보니 집회 참가자들이 있었던 곳만 정확하게 구획하기는 어렵다는 한계가 있습니다.

온전히 집회를 위해 참석한 인원을 추정해보기 위해 배경 인구도 제외했습니다. 무슨 뜻인가 하면 10월 3일 광화문 집회 참석 인원을 추산하기 위해 바로 직전 주말인 9월 28일과 29일 이틀 동안 7개 집계구 총인원(이틀 평균값)을 빼는 방식입니다. 지난 3일은 개천절로 공휴일이기 때문에 평일이 아닌 주말을 비교 대상으로 선정했습니다. 10월 5일 서초동 집회의 경우엔 그 전주 토요일인 28일도 대규모 집회가 열렸으므로, 대신 9월 21일 토요일에 집계된 인원을 뺐습니다.

■ 10.3 광화문 집회는 36만 명, 10.5 서초동 집회는 11만 명


우선 10월 3일 광화문 집회에선, 오전 10시쯤부터 사람들이 늘어나기 시작해 오후 2시 무렵 가장 많은 인원이 모였습니다. 오후 2시 36만 7,157명이 집계됐는데, 한 시간마다 집계되는 인원인 만큼 2시 전후로 이보다 많은 인원이 운집했을 가능성도 있습니다. 집회 참가자들은 오후 5시까지 10만 명 이상 자리를 지키다, 6시 이후 서서히 광화문을 빠져나갔습니다.

10월 5일 서초동 집회도 분석해봤습니다. 가장 많은 사람이 모였던 건 오후 6시~7시 무렵이었습니다. 오후 2시가 지나면서 사람이 몰리기 시작해, 오후 7시 기준으로 11만 4,704명이 모였습니다. 역시 오후 6시~7시 전후로 이보다 많은 인원이 참여했을 가능성이 있습니다.

■ 광화문 집회는 60대 이상이 77%…서초동 집회는 40-50대가 61%


눈에 띄는 것은 두 집회 참가자들의 연령대입니다. 10월 3일 광화문 집회의 경우, 70대 이상이 독보적으로 많았고, 그다음이 60대였습니다. 가장 많은 인원이 모였던 오후 2시 기준으로 70대 이상은 16만 413명, 60대는 12만 3,230명으로 60~70대 이상 노년층이 전체 인원의 77.2%를 차지했습니다. 압도적인 수칩니다. 이후 50대(15.1%), 40대(4.5%), 30대(1.8%) 순으로 나타났습니다.


10월 5일 서초동 집회는 10월 3일 광화문 집회와는 뚜렷하게 다른 양상을 보입니다. 가장 많은 연령대는 40대, 그다음이 50대로 40~50대 중·장년층이 독보적인 비율을 차지합니다. 오후 7시 기준으로 40대는 3만 7,560명, 50대는 3만 3,453명으로 전체 인원의 61.9%입니다. 그다음으로 30대(11.1%)와 60대(9.9%)가 거의 비슷한 수준으로 집계됐습니다.

■ 문제는 숫자가 아니야!

서울시 빅데이터담당관 관계자는 이 두 집회를 두고 "종목이 다른 경기"라고 평가했습니다. 완전히 다른 두 경기를 단일한 잣대로 해석하고 평가할 수 있는 심판은 없다는 겁니다.

그러면서 "숫자는 현상을 찍어내는 것뿐이고 '추정치'라는 한계가 있다"며 "여기에 정치적 의미를 부여해 단순 비교하는 것은 바람직하지 않다"고 거듭 강조했습니다. 해석이 변질되고, 갈등이 확대될까 봐 우려된다는 입장도 조심스럽게 밝혔습니다.

오늘(12일)도 서초동에서 검찰 개혁을 요구하는 집회와 조국 법무부 장관 사퇴를 촉구하는 집회가 열렸습니다. 각 집회에 얼마나 많은 참가자가 왔느냐를 두고 또 한 번 신경전이 벌어질 수도 있습니다.

하지만 집회 참가자들이 다수결의 원칙을 적용하기 위해 광화문으로, 서초동으로 모인 건 아닐 겁니다. 머릿수 싸움에만 몰두해 상대 집회의 의미를 깎아내리는 동안, 정작 그 숫자는 의미를 잃고 있습니다. 거리에 나선 국민들의 요구가 너무나 무거운 상황, 잇따르는 대규모 집회의 본질을 들여다보려는 노력이 필요해 보입니다.
KBS는 여러분과 함께 만들어갑니다.

kbs가 손수 골랐습니다. 네이버에서도 보세요.
기자 정보

    KBS사이트에서 소셜계정으로 로그인한 이용자는 댓글 이용시 KBS회원으로 표시되고
    댓글창을 통해 소셜계정으로 로그인한 이용자는 소셜회원으로 표시됩니다.