[김경래의 최강시사] 4050은 서초동, 6070은 광화문 더 많이 갔다

입력 2019.10.14 (10:54) 수정 2019.10.14 (10:57)

읽어주기 기능은 크롬기반의
브라우저에서만 사용하실 수 있습니다.

- 서초동 vs. 광화문 총인원 측정 불가능하지만 ‘서울시 생활인구데이터’ 통해 특성 추계는 가능
- 집회일 순간 최대인파 추산해 보니 10/3 광화문 - “38만명” vs. 10/5 서초동 - “11만명”
- 서초동 집회는 남녀차이 별로 없고 40~50대가 주축, 20~30대 비중은 낮아
- 광화문 집회는 강남 3구 주민 참여율 높아. 60대 이상 압도적, 70대 이상은 남성 많아
- 해당 데이터는 추정치일뿐이지만, 주최측의 ‘선언적 수치’에 의존하는 보도관행은 탈피해야

■ 프로그램명 : 김경래의 최강시사
■ 코너명 : <최강 인터뷰 2>
■ 방송시간 : 10월 14일(월) 8:31~8:45 KBS1R FM 97.3 MHz
■ 진행 : 김경래 (뉴스타파 탐사팀장)
■ 출연 : 김동인 기자 (시사인)



▷ 김경래 : 이틀 전 토요일에도 서초동 검찰개혁 촛불집회가 대규모로 열렸죠. 그 전에 한글날에 광화문집회가 또 열렸고. 그게 뭐 며칠 상간으로 계속 광화문, 서초동, 광화문, 서초동 이런 식으로 계속 집회가 이어졌습니다. 여기에 뭐 숫자 논란도 굉장히 많았어요, 200만이니 300만이니. 그 뒤로는 숫자 이야기는 또 쑥 들어가기는 했는데 그런데 궁금한 건 여기에 참여한, 양쪽에 참여하신 분들이 어떤 분들일까. 이게 딱 잘라서 이야기하기는 쉽지 않겠지만 그거를 좀 여러 가지 데이터를 통해서 분석을 한 기사가 있어서, 흥미로운 기사를 쓴 게 있어서 저희들이 담당 기자를 좀 모셨습니다. 김동인 시사인 기자 스튜디오에 나와 계십니다. 안녕하세요.

▶ 김동인 : 안녕하세요. 시사인 사회팀 김동인 기자입니다.

▷ 김경래 : 이게 애초에 서초동, 광화문 집회가 몇 명이냐, 몇 명이냐 이러고 싸울 때 그거를 좀 약간 심판처럼 판정을 내리려고 기획한 기사 아니에요, 사실?

▶ 김동인 : 심판처럼 판정을 내릴 수가 없어요.

▷ 김경래 : 그래요?

▶ 김동인 : 네, 왜냐하면 저희가 어떤 분석을 하려면 사실 데이터의 근거가 있어야 하는데 이 집회에 총량이 얼마나 왔느냐라는 건 사실 데이터로 이게 측정 자체가 좀 불가능하거든요.

▷ 김경래 : 그래요?

▶ 김동인 : 네, 그렇기 때문에 가령 일각에서는 지하철 몇만 명이 탔다. 그러니까 몇만 명 아니냐 이런 식으로도 이야기를 하는데 모든 변수를 다 고려해서 사실 신이 아닌 이상 그 자리에 몇만 명이 모였다 이거를 측정하기가 쉽지 않거든요.

▷ 김경래 : 그러면 이번 기사의 핵심은 뭡니까? 숫자가 아니라면.

▶ 김동인 : 숫자는 아니지만 활용 가능한 공개 데이터라는 것들이 있고요. 그리고 그 데이터를 근거로 해서 여기에 대체 어떤 사람들이 모였느냐. 그리고 어느 지역에서 왔고 연령 구조는 어떻고 또 성별 구조는 어떠냐 이런 것들을 정확히 말하면 추계하는 겁니다. 약간 추정치를 우리가 뽑아보는 거거든요.

▷ 김경래 : 그러니까 연령과 지역을 알 수 있다?

▶ 김동인 : 네, 그리고 성별까지.

▷ 김경래 : 성별까지. 그거는 좀 흥미롭네요. 그런데 일단 아까 공개된 데이터를 활용했다는데 어떤 데이터를 활용한 거예요?

▶ 김동인 : 서울시 열린데이터광장이라는 사이트가 있습니다. 데이터 전문 사이트인데 여기에 '생활인구데이터'라는 게 공개돼요. 그리고 이 '생활인구데이터'는 매일 5일 전 걸 공개합니다. 그러니까 우리가 5일 전 게 오늘 이렇게 매일매일 공개가 되는 형태인 건데 '생활인구데이터'라는 게 뭔지 좀 간단하게 설명을 드리자면 어느 특정 시점에 특정 지역의 총인구가 몇 명이었냐 이거를 추계하는 겁니다.

▷ 김경래 : 그런 데이터가 있어요?

▶ 김동인 : 네, 그렇습니다. 집계구라는 게 있는데요. 행정 경계에서 우리가 통계할 때 가장 작은 최소 단위가 집계구인데 이게 서울에 한 1만 9,153개가 있어요. 그래서 그 지역을 고른 다음에 그 집계구 몇 개를 골라서 거기에 총 몇 명이 있었냐 그리고 이 사람들은 어떤 사람들이었냐 이런 구성들을 뽑아보는 거죠.

▷ 김경래 : 그거를 어떻게 알아요? 서울 그 데이터는.

▶ 김동인 : 기본 베이스는 서울시가 공개하는 방식이 KT LTE 데이터를 활용해서 추계를 합니다. 그런데 나는 SKT 내지는 나는 LG U+인데 나는 당연히 집계 안 되는 거 아니냐 이렇게 생각하실 수 있는데 그게 아니라 KT 사용률, 시장점유율도 보정이 되고요. 그리고 LTE 사용자 비율 95% 정도인데 또 그게 보정이 되고 핸드폰이 없는 사람, 연령대 같은 게 10세 미만 같은 경우에는 그런 데이터들도 보정을 일일이 합니다. 그래서 그 보정치에 근거한 추출치다 이렇게 보시면 될 것 같아요.

▷ 김경래 : 그러니까 KT의 기본 데이터를 통계적인 기법으로 활용을 해서 특정 시간대 특정 지역에 어떤 사람들이 있느냐를 추정하는 거군요?

▶ 김동인 : 네, 그렇습니다. 거기에다가 LTE 데이터 플러스 서울시가 가지고 있는 또 공공데이터가 있어요. 교통량이라든가 또는 서울시 자체적인 여러 가지 산출 근거들이 있는데 그거를 혼합해서 만들어내는 수치죠.

▷ 김경래 : 일단은 집회에 전체가 몇 명이 참여했다 이거는 아까 불가능하다고 말씀하셨잖아요.

▶ 김동인 : 네, 맞습니다.

▷ 김경래 : 불가능하지만 똑같은 기준으로 양쪽을 비교할 수는 있잖아요. 그렇죠?

▶ 김동인 : 네.

▷ 김경래 : 예컨대 9월 28일, 10월 5일 이때 서초동집회가 있지 않았습니까?

▶ 김동인 : 네, 그렇습니다.

▷ 김경래 : 그리고 10월 3일, 10월 9일 이때 광화문집회가 있었고요.

▶ 김동인 : 광화문집회가 있었죠.

▷ 김경래 : 같은 시간대에 어느 정도의 사람들이 있었나 이거는 비교해 볼 수 있지 않나요?

▶ 김동인 : 정확히 말씀드리면 광화문집회는 권역이 넓어요.

▷ 김경래 : 그래요?

▶ 김동인 : 그렇습니다. 왜냐하면 서울역광장에서 광화문광장까지를 계산해야 하거든요.

▷ 김경래 : 길이가 길다?

▶ 김동인 : 워낙 거리가 넓습니다. 그리고 한 가지 좀 생각해야 할 게 가령 우리가 이 자리에 그러면 평소에 비해서 얼마나 많이 모였냐는 걸 따져야 하잖아요.

▷ 김경래 : 그게 중요한 거죠.

▶ 김동인 : 그러면 그 평소라는 건 대체 언제냐가 중요해요.

▷ 김경래 : 아이고, 어렵네.

▶ 김동인 : 한마디로 모수를 따져보는 건데 저희가 서초동집회 같은 경우에는 평시를 어떻게 둘 거냐를 고민하다가 2018년 9월에 총 토요일이 5번 있었어요.

▷ 김경래 : 작년이요.

▶ 김동인 : 네, 그렇죠. 작년 9월 5번의 토요일의 평균을 잰 겁니다.

▷ 김경래 : 합리적이네요.

▶ 김동인 : 그래서 그게 밑바닥이 있으면 그때에 비해서 얼마나 많이 왔냐는 걸 산출하는 건데 9월 28일에는 약 9만여 명 정도였고, 그 집회의 공간에서 순간 스폿만 따지면요.

▷ 김경래 : 그렇죠.

▶ 김동인 : 그리고 10월 5일 서초동집회에서는 11만여 명 정도여서 한마디로 이게 뭐 그러면 9만 명 아니냐 이게 아니라 그 순간 잡히는 숫자라는 거고요. 대신 이거는 볼 수 있겠죠. 9월 28일에 비해서 10월 5일에는 훨씬 더 같은 공간에 더 밀도 있게 사람들이 모였다 이 정도.

▷ 김경래 : 더 많은 사람들이 모였다?

▶ 김동인 : 네, 그렇습니다. 이 정도는 알 수 있습니다.

▷ 김경래 : 광화문은 어떻게 보세요?

▶ 김동인 : 광화문은 워낙 권역이 넓었고요. 그리고 광화문은 사실 저희가 평균을 잡는 게 너무 어려웠어요. 왜냐하면 광화문에서는 항시 이벤트가 열리고 집회가 열리고 이게 서울광장까지 합치고 이러다 보니까.

▷ 김경래 : 그런 문제가 있네.

▶ 김동인 : 네, 사실 통계 전문가들도 이거를 어떻게 하면 좋을까 이런 부분을 제가 조언을 구하면서 굉장히 고민을 많이 했는데 그래도 한번 좀 구성비를 따져보자는 의미로 저희가 평균이라는 걸 2018년 전체 토요일, 일요일을 합쳤습니다. 총 104개 정도 되거든요. 거기에 있는 중앙값을 활용해서 평시 데이터를 구했고 그 데이터를 구했을 때 저희가 조금 산출했던 건 약 한 38만여 명 정도. 이거는 또 워낙 권역이 넓으니까 물론 이게 완벽하게 그만큼이 왔다 이렇게는 볼 수 없겠지만 어쨌든 이날도 사람이 이만큼이나 평소에 비해서 많이 왔다 이렇게 보시면 될 것 같습니다.

▷ 김경래 : 그러면 10월 3일에 비해서 10월 9일은 늘었나요?

▶ 김동인 : 10월 9일은 문제는 분석이 안 돼요, 지금.

▷ 김경래 : 아직 안 되나요?

▶ 김동인 : 네.

▷ 김경래 : 지금 날짜가 안 됐구나.

▶ 김동인 : 네, 그렇습니다.

▷ 김경래 : 10월 3일만 분석이 가능하군요? 5일이 지나야 데이터가 나오기 때문에.

▶ 김동인 : 그렇습니다. 오늘 아마 데이터가 나올 겁니다.

▷ 김경래 : 궁금하신 분들은 오늘 데이터를 한번 활용하셔서.

▶ 김동인 : 네, 가능합니다.

▷ 김경래 : 저는 불가능할 것 같습니다, 산수가 어려워서. 아까 말씀하셨잖아요. 인구하고 관련된, 그러니까 서초동에 온 촛불집회 사람들은 연령이라든가 성별이라든가 지역이라든가 이런 특징을 가지고 있다고 분석이 된 거잖아요. 어떤 특징을 보이고 있습니까, 서초동은.

▶ 김동인 : 먼저 첫 번째로 말씀드릴 건 지역인데요. 지역은 강남 쪽 사람들이 많이 왔습니다.

▷ 김경래 : 근처니까 뭐 그거는 그럴 수 있어요, 개연성이.

▶ 김동인 : 강남, 관악. 그리고 서초는 일단 저희가 집계에서는 뺐고요. 왜냐하면 서초는 거기 열린 게 서초니까. 또 송파 이쪽 지역에서 많이 왔어요. 그러면 가까워서 많이 온 거지 그쪽 사람들이 많이 유독 이 문제에 분노한 건 아니지 않겠냐 이렇게 말씀하시는 분들도 있는데 저희가 이거를 또 권역별로도 한번 모아봤어요. 그래서 서울 동남권 그리고 서울 경기 경부권에서 굉장히 많은 분들이 합류했다, 꽤 많은 비중을 차지했다.

▷ 김경래 : 그래요?

▶ 김동인 : 그리고 여기서 중요한 게 연령대인데 연령대는 40대에서 50대 사이가 굉장히 많이 참석했다 이렇게 볼 수 있습니다.

▷ 김경래 : 40-50대가 주축이었군요?

▶ 김동인 : 네, 그렇습니다.

▷ 김경래 : 젊은 사람들도 꽤 있었던 것 같은데 그래도 비율로 보면 40-50대가 그 집회의 주축이었다는 걸로 보이네요.

▶ 김동인 : 네, 그렇습니다. 그런데 사실 비율로 따졌을 때 20-30대의 비중이 확실히 낮았어요.

▷ 김경래 : 그래요?

▶ 김동인 : 네, 그렇습니다.

▷ 김경래 : 40-50대의 비중이 한 어느 정도로 보입니까?

▶ 김동인 : 저희가 퍼센티지로 지금 계산하기는 좀 어려울 것 같아요.

▷ 김경래 : 그래요? 이것도 어려운 거구나.

▶ 김동인 : 네, 그런데 다만 그 당시 구성비를 따져봤을 때 45세에서 49세 사이가 그 순간에 한 1만 2천 명 정도 모인다고 생각하시면 되는데 같은 시간대에 25세에서 29세까지가 한 3천여 명 정도예요.

▷ 김경래 : 한 3배 정도 되네요. 그렇죠?

▶ 김동인 : 네, 그렇습니다.

▷ 김경래 : 아까 연령도 분석이 가능하다고 하셨잖아요. 연령은 어떻습니까? 연령이란다, 참. 성별, 성별.

▶ 김동인 : 성별 같은 경우에는 40대 이하는 여성이 더 많고요. 50대에서부터는 남성이 조금 많은데 서초동집회는 그래도 남녀 비율의 격차가 그렇게 크지는 않습니다.

▷ 김경래 : 비슷비슷한가요?

▶ 김동인 : 네, 그렇습니다.

▷ 김경래 : 그러면 그거를 준해서 광화문집회를 한번 보면 일단 지역별로 한번 볼까요?

▶ 김동인 : 광화문집회는 지역을 보고 저도 좀 충격을 받았는데.

▷ 김경래 : 왜요?

▶ 김동인 : 강남권의 비중이 더 높습니다.

▷ 김경래 : 이거 재미있네요?

▶ 김동인 : 네, 강남권의 비중이 더 높은 게 휴일에 광화문 근처에 누가 가냐 그게 궁금하실 텐데 제가 따져봤더니 마포, 서대문, 은평 이쪽 서울 서부권에 있는 분들이 평소에는 많이 와요.

▷ 김경래 : 평소에는 그쪽 지역들, 가까운 지역들이 많이 간다?

▶ 김동인 : 가까운 지역들이 많이 오는데 이날만큼은 서울 동남권이라고 하죠. 송파, 강남, 서초에 계신 분들이 압도적이었고 그리고 순위로 따져봤을 때 강남, 송파, 서초 그다음 순위는 분당입니다.

▷ 김경래 : 이거 재미있는 팩트인데요? 그러니까 아까 서초동집회도 강남권이 높다 그랬잖아요. 광화문집회도 강남권이 높다?

▶ 김동인 : 강남권의 비중이 어떤 높은 정도는 심지어 광화문이 더 심합니다.

▷ 김경래 : 이게 의미하는 바가 뭐라고 좀 전문가나 분석을 하셨습니까?

▶ 김동인 : 그런데 사실 뭐 단순히 어떤 의미를 억지로 추측할 수는 없지만.

▷ 김경래 : 그렇죠.

▶ 김동인 : 그런데 저희가 이런 생각이 있어요. 그러면 같은 강남 사람들이 분화된 건가? 이런 고민을 해볼 수 있는데.

▷ 김경래 : 여기도 가고 저기도 가나? 그거는 아니겠죠.

▶ 김동인 : 그렇죠. 그런데 그러면 대체 어떤 기준으로 분화됐을까라는 건 연령 그래프에서 나왔습니다.

▷ 김경래 : 그거 좀 설명해 주세요.

▶ 김동인 : 연령 그래프에서 정확히 말씀드리면 60대 이상이 압도적인 퍼센티지를 차지하고요.

▷ 김경래 : 광화문 말씀하시는 거죠?

▶ 김동인 : 네, 광화문광장에서요. 그리고 70세 이상 남성이 비율상으로는 가장 많았습니다, 같은 공간에서.

▷ 김경래 : 그러면 약간 단순하게 이야기하면 강남권이 연령으로 분화되어서 약간 고연령층은 광화문으로, 그거보다 상대적으로 좀 낮은 연령층은 서초동으로 갔다? 거칠게 이야기하면.

▶ 김동인 : 거칠게 이야기하면 강남 4050은 서초동으로, 강남 6070은 광화문으로 향했다고 볼 수 있는데 물론 이게 모든 참석자들을 대변하는 건 아니지만.

▷ 김경래 : 물론 그렇죠.

▶ 김동인 : 일단 분석했을 때 눈에 띄는 지점들은 이 지점이었다 이 정도로 이야기할 수 있겠네요.

▷ 김경래 : 그게 이제 그 팩트가 어떤 것을 의미하느냐는 조금 더 분석이 필요하고 해석이 필요하겠지만 어쨌든 굉장히 재미있는 상황 데이터인 것 같습니다.

▶ 김동인 : 서초동 같은 경우에는 괜찮은데 광화문은 데이터를 보고 나니까 좀 이런 생각이 들기는 했어요. 압도적인 다수라 하더라도 모든 공론을 대변하는 성격은 아니라는 생각이 들기는 하더라고요.

▷ 김경래 : 그러면 강남권 말고 좀 눈에 띄는 어떤 지역이 있었습니까? 광화문 쪽에서는.

▶ 김동인 : 광화문 쪽에서는 역시 경기 경부권이 많았고요.

▷ 김경래 : 그래요? 경부권?

▶ 김동인 : 경부권이라고 하면 어디인가 궁금하실 텐데 경부고속도로가 인접해 있는 지역이라고 생각하시면 됩니다. 경기 경부권에서 저희가 집회 참가 기준으로만 봤을 때 한 5만여 명 정도. 그리고 서울 동남권, 그러니까 서초부터 강동까지도 한 5만여 명 정도. 그러니까 비율은 비슷하다, 합쳐놓고 보니까. 이렇게 좀 판단을 할 수 있을 것 같아요.

▷ 김경래 : 경북이라고 하면 거기서 원정을 온 사람들이 꽤 많다는?

▶ 김동인 : 경기 경부권이요.

▷ 김경래 : 경기에서.

▶ 김동인 : 경부권입니다.

▷ 김경래 : 그렇게 표현을 하는군요? 경기도에서 경부고속도로 라인에 있는 쪽을.

▶ 김동인 : 네, 그렇습니다.

▷ 김경래 : 그러니까 경상북도가 아니라.

▶ 김동인 : 네.

▷ 김경래 : 죄송합니다.

▶ 김동인 : 그런데 경상북도도 순위권에 오르기는 했습니다.

▷ 김경래 : 진짜요?

▶ 김동인 : 네, 저희가 이 집계구 분석을 하면, OD 분석을 한다고 하는데 지역별로 추출하는데요. 경북에서도 단일 집단으로 따졌을 때 약 한 1만여 명 정도가 이날 자리에 좀 자리하셨더라고요. 평소에는 사실 이분들이 한 1천 명 정도 있는데 그날따라서 한 10배 정도가 많이 오셨다 이렇게 볼 수 있습니다.

▷ 김경래 : 지역에서 원정을 온 사람들이 꽤 많다 이런 거네요. 그렇죠?

▶ 김동인 : 네, 그렇죠.

▷ 김경래 : 성별로는 어떻습니까? 광화문은.

▶ 김동인 : 광화문은 성별로는 사실 60세 이상 같은 경우에는 남성이 훨씬 높은데요. 특히 70대 이상 같은 경우에는 여성에 비해서 남성이 한 40% 정도 더 많습니다. 그래서 70대 남성이 굉장히 압도적인 다수를 차지하고 있었다 이렇게 볼 수 있을 것 같아요.

▷ 김경래 : 이게 5060보다 70대 남성이 더 비중이 높다? 그러니까 광화문집회의 주축은 고연령대라고 일단 보면 되겠네요. 그렇죠?

▶ 김동인 : 네, 그렇습니다.

▷ 김경래 : 아까 서초동집회는 4050, 성별은 조금 엇비슷하다. 그렇죠? 그 차이는 없다고 말씀하셨는데. 젊은층의 비율은 양쪽이 비교하면 어떻습니까? 2030.

▶ 김동인 : 젊은층의, 생활인구 추계다 보니까 그 시점에 얼마나 있었냐는 비율이 되게 중요한데 서초동 같은 경우에는 20대, 30대들이 그래도 평소보다 조금 있기는 했어요.

▷ 김경래 : 평소보다 조금?

▶ 김동인 : 네, 한마디로 집회 참가자들이 없지는 않았다는 건데 문제는 광화문입니다. 광화문 같은 경우에는 평소에 비해서 20대는 줄어듭니다.

▷ 김경래 : 그래요?

▶ 김동인 : 네, 그 순간에 20대, 30대들이 그 공간에 아예 가지를 않았던 거라고 보시면 됩니다.

▷ 김경래 : 집회 때문에 일부러 간 사람들 말고는 평소에 가던 사람들이 오히려 덜 갔다?

▶ 김동인 : 네. 30대는 조금 늘기는 했는데 20대 같은 경우에는, 특히 20세에서 24세 사이 같은 경우에는 평소에 비해서 오히려 적게 갔다 이렇게 볼 수 있을 것 같습니다.

▷ 김경래 : 이게 서울시 아까 데이터 사이트 이름이 뭐라고 하셨죠? 열린데이터광장?

▶ 김동인 : 네, 열린데이터광장입니다.

▷ 김경래 : 여기 가면 지금 말씀하신 모 데이터들을 다 구할 수 있다는 거죠?

▶ 김동인 : 네, 더미 데이터를 구하실 수 있고요. 이 더미 데이터를 활용하면서 얼마든지, 가령 코딩을 좀 하실 수 있는 분들은 분석이 가능합니다.

▷ 김경래 : 한번 가보시면 좋을 것 같고요. 마지막으로 기사에 담지 못했는데 굉장히 흥미로웠던 지점 이런 게 하나 있을 것 같아요.

▶ 김동인 : 제가 서초동 같은 경우에는 현장을 한번 가봤어요. 가봤고 그 현장에서 사람들이 얼마나 밀집해 있었고 어떤 목소리를 내는가 이런 것도 보면서 데이터랑 같이 비교해서 봤는데 사실 데이터라는 건 어디까지나 추정치에 가깝고 실제 현장에서의 목소리는 무척 뜨거웠다 이렇게 좀 볼 수 있을 것 같습니다.

▷ 김경래 : 그래도 어쨌든 서로간에 논란만 있는데 이렇게 데이터로 한번 개략적이나마 상황을 파악해 보는 건 굉장히 좋은 자세가 아닐까, 기자로서는.

▶ 김동인 : 네, 그리고 워낙 요즘 수치를 선언적 수치에 저희가 의존하는 경우가 많아요.

▷ 김경래 : 200만, 300만 이런 거요?

▶ 김동인 : 네, 이게 80만이었다가 갑자기 150만이 됐다 200만이 돼요. 숫자라는 게 앞으로는 좀 보도를 할 때도 저도 좀 조심스럽게 보도를 해야겠다 이런 생각이 들더라고요.

▷ 김경래 : 맞아요. 여러 가지 합의도 필요하고 공부도 좀 필요한 영역인 것 같습니다.

▶ 김동인 : 네, 그렇습니다.

▷ 김경래 : 오늘 말씀 감사합니다.

▶ 김동인 : 고맙습니다.

▷ 김경래 : 재미있네요. 시사인 김동인 기자였습니다.

[사진 출처 : 연합뉴스]

■ 제보하기
▷ 카카오톡 : 'KBS제보' 검색, 채널 추가
▷ 전화 : 02-781-1234, 4444
▷ 이메일 : kbs1234@kbs.co.kr
▷ 유튜브, 네이버, 카카오에서도 KBS뉴스를 구독해주세요!


  • [김경래의 최강시사] 4050은 서초동, 6070은 광화문 더 많이 갔다
    • 입력 2019-10-14 10:54:21
    • 수정2019-10-14 10:57:11
    최강시사
- 서초동 vs. 광화문 총인원 측정 불가능하지만 ‘서울시 생활인구데이터’ 통해 특성 추계는 가능
- 집회일 순간 최대인파 추산해 보니 10/3 광화문 - “38만명” vs. 10/5 서초동 - “11만명”
- 서초동 집회는 남녀차이 별로 없고 40~50대가 주축, 20~30대 비중은 낮아
- 광화문 집회는 강남 3구 주민 참여율 높아. 60대 이상 압도적, 70대 이상은 남성 많아
- 해당 데이터는 추정치일뿐이지만, 주최측의 ‘선언적 수치’에 의존하는 보도관행은 탈피해야

■ 프로그램명 : 김경래의 최강시사
■ 코너명 : <최강 인터뷰 2>
■ 방송시간 : 10월 14일(월) 8:31~8:45 KBS1R FM 97.3 MHz
■ 진행 : 김경래 (뉴스타파 탐사팀장)
■ 출연 : 김동인 기자 (시사인)



▷ 김경래 : 이틀 전 토요일에도 서초동 검찰개혁 촛불집회가 대규모로 열렸죠. 그 전에 한글날에 광화문집회가 또 열렸고. 그게 뭐 며칠 상간으로 계속 광화문, 서초동, 광화문, 서초동 이런 식으로 계속 집회가 이어졌습니다. 여기에 뭐 숫자 논란도 굉장히 많았어요, 200만이니 300만이니. 그 뒤로는 숫자 이야기는 또 쑥 들어가기는 했는데 그런데 궁금한 건 여기에 참여한, 양쪽에 참여하신 분들이 어떤 분들일까. 이게 딱 잘라서 이야기하기는 쉽지 않겠지만 그거를 좀 여러 가지 데이터를 통해서 분석을 한 기사가 있어서, 흥미로운 기사를 쓴 게 있어서 저희들이 담당 기자를 좀 모셨습니다. 김동인 시사인 기자 스튜디오에 나와 계십니다. 안녕하세요.

▶ 김동인 : 안녕하세요. 시사인 사회팀 김동인 기자입니다.

▷ 김경래 : 이게 애초에 서초동, 광화문 집회가 몇 명이냐, 몇 명이냐 이러고 싸울 때 그거를 좀 약간 심판처럼 판정을 내리려고 기획한 기사 아니에요, 사실?

▶ 김동인 : 심판처럼 판정을 내릴 수가 없어요.

▷ 김경래 : 그래요?

▶ 김동인 : 네, 왜냐하면 저희가 어떤 분석을 하려면 사실 데이터의 근거가 있어야 하는데 이 집회에 총량이 얼마나 왔느냐라는 건 사실 데이터로 이게 측정 자체가 좀 불가능하거든요.

▷ 김경래 : 그래요?

▶ 김동인 : 네, 그렇기 때문에 가령 일각에서는 지하철 몇만 명이 탔다. 그러니까 몇만 명 아니냐 이런 식으로도 이야기를 하는데 모든 변수를 다 고려해서 사실 신이 아닌 이상 그 자리에 몇만 명이 모였다 이거를 측정하기가 쉽지 않거든요.

▷ 김경래 : 그러면 이번 기사의 핵심은 뭡니까? 숫자가 아니라면.

▶ 김동인 : 숫자는 아니지만 활용 가능한 공개 데이터라는 것들이 있고요. 그리고 그 데이터를 근거로 해서 여기에 대체 어떤 사람들이 모였느냐. 그리고 어느 지역에서 왔고 연령 구조는 어떻고 또 성별 구조는 어떠냐 이런 것들을 정확히 말하면 추계하는 겁니다. 약간 추정치를 우리가 뽑아보는 거거든요.

▷ 김경래 : 그러니까 연령과 지역을 알 수 있다?

▶ 김동인 : 네, 그리고 성별까지.

▷ 김경래 : 성별까지. 그거는 좀 흥미롭네요. 그런데 일단 아까 공개된 데이터를 활용했다는데 어떤 데이터를 활용한 거예요?

▶ 김동인 : 서울시 열린데이터광장이라는 사이트가 있습니다. 데이터 전문 사이트인데 여기에 '생활인구데이터'라는 게 공개돼요. 그리고 이 '생활인구데이터'는 매일 5일 전 걸 공개합니다. 그러니까 우리가 5일 전 게 오늘 이렇게 매일매일 공개가 되는 형태인 건데 '생활인구데이터'라는 게 뭔지 좀 간단하게 설명을 드리자면 어느 특정 시점에 특정 지역의 총인구가 몇 명이었냐 이거를 추계하는 겁니다.

▷ 김경래 : 그런 데이터가 있어요?

▶ 김동인 : 네, 그렇습니다. 집계구라는 게 있는데요. 행정 경계에서 우리가 통계할 때 가장 작은 최소 단위가 집계구인데 이게 서울에 한 1만 9,153개가 있어요. 그래서 그 지역을 고른 다음에 그 집계구 몇 개를 골라서 거기에 총 몇 명이 있었냐 그리고 이 사람들은 어떤 사람들이었냐 이런 구성들을 뽑아보는 거죠.

▷ 김경래 : 그거를 어떻게 알아요? 서울 그 데이터는.

▶ 김동인 : 기본 베이스는 서울시가 공개하는 방식이 KT LTE 데이터를 활용해서 추계를 합니다. 그런데 나는 SKT 내지는 나는 LG U+인데 나는 당연히 집계 안 되는 거 아니냐 이렇게 생각하실 수 있는데 그게 아니라 KT 사용률, 시장점유율도 보정이 되고요. 그리고 LTE 사용자 비율 95% 정도인데 또 그게 보정이 되고 핸드폰이 없는 사람, 연령대 같은 게 10세 미만 같은 경우에는 그런 데이터들도 보정을 일일이 합니다. 그래서 그 보정치에 근거한 추출치다 이렇게 보시면 될 것 같아요.

▷ 김경래 : 그러니까 KT의 기본 데이터를 통계적인 기법으로 활용을 해서 특정 시간대 특정 지역에 어떤 사람들이 있느냐를 추정하는 거군요?

▶ 김동인 : 네, 그렇습니다. 거기에다가 LTE 데이터 플러스 서울시가 가지고 있는 또 공공데이터가 있어요. 교통량이라든가 또는 서울시 자체적인 여러 가지 산출 근거들이 있는데 그거를 혼합해서 만들어내는 수치죠.

▷ 김경래 : 일단은 집회에 전체가 몇 명이 참여했다 이거는 아까 불가능하다고 말씀하셨잖아요.

▶ 김동인 : 네, 맞습니다.

▷ 김경래 : 불가능하지만 똑같은 기준으로 양쪽을 비교할 수는 있잖아요. 그렇죠?

▶ 김동인 : 네.

▷ 김경래 : 예컨대 9월 28일, 10월 5일 이때 서초동집회가 있지 않았습니까?

▶ 김동인 : 네, 그렇습니다.

▷ 김경래 : 그리고 10월 3일, 10월 9일 이때 광화문집회가 있었고요.

▶ 김동인 : 광화문집회가 있었죠.

▷ 김경래 : 같은 시간대에 어느 정도의 사람들이 있었나 이거는 비교해 볼 수 있지 않나요?

▶ 김동인 : 정확히 말씀드리면 광화문집회는 권역이 넓어요.

▷ 김경래 : 그래요?

▶ 김동인 : 그렇습니다. 왜냐하면 서울역광장에서 광화문광장까지를 계산해야 하거든요.

▷ 김경래 : 길이가 길다?

▶ 김동인 : 워낙 거리가 넓습니다. 그리고 한 가지 좀 생각해야 할 게 가령 우리가 이 자리에 그러면 평소에 비해서 얼마나 많이 모였냐는 걸 따져야 하잖아요.

▷ 김경래 : 그게 중요한 거죠.

▶ 김동인 : 그러면 그 평소라는 건 대체 언제냐가 중요해요.

▷ 김경래 : 아이고, 어렵네.

▶ 김동인 : 한마디로 모수를 따져보는 건데 저희가 서초동집회 같은 경우에는 평시를 어떻게 둘 거냐를 고민하다가 2018년 9월에 총 토요일이 5번 있었어요.

▷ 김경래 : 작년이요.

▶ 김동인 : 네, 그렇죠. 작년 9월 5번의 토요일의 평균을 잰 겁니다.

▷ 김경래 : 합리적이네요.

▶ 김동인 : 그래서 그게 밑바닥이 있으면 그때에 비해서 얼마나 많이 왔냐는 걸 산출하는 건데 9월 28일에는 약 9만여 명 정도였고, 그 집회의 공간에서 순간 스폿만 따지면요.

▷ 김경래 : 그렇죠.

▶ 김동인 : 그리고 10월 5일 서초동집회에서는 11만여 명 정도여서 한마디로 이게 뭐 그러면 9만 명 아니냐 이게 아니라 그 순간 잡히는 숫자라는 거고요. 대신 이거는 볼 수 있겠죠. 9월 28일에 비해서 10월 5일에는 훨씬 더 같은 공간에 더 밀도 있게 사람들이 모였다 이 정도.

▷ 김경래 : 더 많은 사람들이 모였다?

▶ 김동인 : 네, 그렇습니다. 이 정도는 알 수 있습니다.

▷ 김경래 : 광화문은 어떻게 보세요?

▶ 김동인 : 광화문은 워낙 권역이 넓었고요. 그리고 광화문은 사실 저희가 평균을 잡는 게 너무 어려웠어요. 왜냐하면 광화문에서는 항시 이벤트가 열리고 집회가 열리고 이게 서울광장까지 합치고 이러다 보니까.

▷ 김경래 : 그런 문제가 있네.

▶ 김동인 : 네, 사실 통계 전문가들도 이거를 어떻게 하면 좋을까 이런 부분을 제가 조언을 구하면서 굉장히 고민을 많이 했는데 그래도 한번 좀 구성비를 따져보자는 의미로 저희가 평균이라는 걸 2018년 전체 토요일, 일요일을 합쳤습니다. 총 104개 정도 되거든요. 거기에 있는 중앙값을 활용해서 평시 데이터를 구했고 그 데이터를 구했을 때 저희가 조금 산출했던 건 약 한 38만여 명 정도. 이거는 또 워낙 권역이 넓으니까 물론 이게 완벽하게 그만큼이 왔다 이렇게는 볼 수 없겠지만 어쨌든 이날도 사람이 이만큼이나 평소에 비해서 많이 왔다 이렇게 보시면 될 것 같습니다.

▷ 김경래 : 그러면 10월 3일에 비해서 10월 9일은 늘었나요?

▶ 김동인 : 10월 9일은 문제는 분석이 안 돼요, 지금.

▷ 김경래 : 아직 안 되나요?

▶ 김동인 : 네.

▷ 김경래 : 지금 날짜가 안 됐구나.

▶ 김동인 : 네, 그렇습니다.

▷ 김경래 : 10월 3일만 분석이 가능하군요? 5일이 지나야 데이터가 나오기 때문에.

▶ 김동인 : 그렇습니다. 오늘 아마 데이터가 나올 겁니다.

▷ 김경래 : 궁금하신 분들은 오늘 데이터를 한번 활용하셔서.

▶ 김동인 : 네, 가능합니다.

▷ 김경래 : 저는 불가능할 것 같습니다, 산수가 어려워서. 아까 말씀하셨잖아요. 인구하고 관련된, 그러니까 서초동에 온 촛불집회 사람들은 연령이라든가 성별이라든가 지역이라든가 이런 특징을 가지고 있다고 분석이 된 거잖아요. 어떤 특징을 보이고 있습니까, 서초동은.

▶ 김동인 : 먼저 첫 번째로 말씀드릴 건 지역인데요. 지역은 강남 쪽 사람들이 많이 왔습니다.

▷ 김경래 : 근처니까 뭐 그거는 그럴 수 있어요, 개연성이.

▶ 김동인 : 강남, 관악. 그리고 서초는 일단 저희가 집계에서는 뺐고요. 왜냐하면 서초는 거기 열린 게 서초니까. 또 송파 이쪽 지역에서 많이 왔어요. 그러면 가까워서 많이 온 거지 그쪽 사람들이 많이 유독 이 문제에 분노한 건 아니지 않겠냐 이렇게 말씀하시는 분들도 있는데 저희가 이거를 또 권역별로도 한번 모아봤어요. 그래서 서울 동남권 그리고 서울 경기 경부권에서 굉장히 많은 분들이 합류했다, 꽤 많은 비중을 차지했다.

▷ 김경래 : 그래요?

▶ 김동인 : 그리고 여기서 중요한 게 연령대인데 연령대는 40대에서 50대 사이가 굉장히 많이 참석했다 이렇게 볼 수 있습니다.

▷ 김경래 : 40-50대가 주축이었군요?

▶ 김동인 : 네, 그렇습니다.

▷ 김경래 : 젊은 사람들도 꽤 있었던 것 같은데 그래도 비율로 보면 40-50대가 그 집회의 주축이었다는 걸로 보이네요.

▶ 김동인 : 네, 그렇습니다. 그런데 사실 비율로 따졌을 때 20-30대의 비중이 확실히 낮았어요.

▷ 김경래 : 그래요?

▶ 김동인 : 네, 그렇습니다.

▷ 김경래 : 40-50대의 비중이 한 어느 정도로 보입니까?

▶ 김동인 : 저희가 퍼센티지로 지금 계산하기는 좀 어려울 것 같아요.

▷ 김경래 : 그래요? 이것도 어려운 거구나.

▶ 김동인 : 네, 그런데 다만 그 당시 구성비를 따져봤을 때 45세에서 49세 사이가 그 순간에 한 1만 2천 명 정도 모인다고 생각하시면 되는데 같은 시간대에 25세에서 29세까지가 한 3천여 명 정도예요.

▷ 김경래 : 한 3배 정도 되네요. 그렇죠?

▶ 김동인 : 네, 그렇습니다.

▷ 김경래 : 아까 연령도 분석이 가능하다고 하셨잖아요. 연령은 어떻습니까? 연령이란다, 참. 성별, 성별.

▶ 김동인 : 성별 같은 경우에는 40대 이하는 여성이 더 많고요. 50대에서부터는 남성이 조금 많은데 서초동집회는 그래도 남녀 비율의 격차가 그렇게 크지는 않습니다.

▷ 김경래 : 비슷비슷한가요?

▶ 김동인 : 네, 그렇습니다.

▷ 김경래 : 그러면 그거를 준해서 광화문집회를 한번 보면 일단 지역별로 한번 볼까요?

▶ 김동인 : 광화문집회는 지역을 보고 저도 좀 충격을 받았는데.

▷ 김경래 : 왜요?

▶ 김동인 : 강남권의 비중이 더 높습니다.

▷ 김경래 : 이거 재미있네요?

▶ 김동인 : 네, 강남권의 비중이 더 높은 게 휴일에 광화문 근처에 누가 가냐 그게 궁금하실 텐데 제가 따져봤더니 마포, 서대문, 은평 이쪽 서울 서부권에 있는 분들이 평소에는 많이 와요.

▷ 김경래 : 평소에는 그쪽 지역들, 가까운 지역들이 많이 간다?

▶ 김동인 : 가까운 지역들이 많이 오는데 이날만큼은 서울 동남권이라고 하죠. 송파, 강남, 서초에 계신 분들이 압도적이었고 그리고 순위로 따져봤을 때 강남, 송파, 서초 그다음 순위는 분당입니다.

▷ 김경래 : 이거 재미있는 팩트인데요? 그러니까 아까 서초동집회도 강남권이 높다 그랬잖아요. 광화문집회도 강남권이 높다?

▶ 김동인 : 강남권의 비중이 어떤 높은 정도는 심지어 광화문이 더 심합니다.

▷ 김경래 : 이게 의미하는 바가 뭐라고 좀 전문가나 분석을 하셨습니까?

▶ 김동인 : 그런데 사실 뭐 단순히 어떤 의미를 억지로 추측할 수는 없지만.

▷ 김경래 : 그렇죠.

▶ 김동인 : 그런데 저희가 이런 생각이 있어요. 그러면 같은 강남 사람들이 분화된 건가? 이런 고민을 해볼 수 있는데.

▷ 김경래 : 여기도 가고 저기도 가나? 그거는 아니겠죠.

▶ 김동인 : 그렇죠. 그런데 그러면 대체 어떤 기준으로 분화됐을까라는 건 연령 그래프에서 나왔습니다.

▷ 김경래 : 그거 좀 설명해 주세요.

▶ 김동인 : 연령 그래프에서 정확히 말씀드리면 60대 이상이 압도적인 퍼센티지를 차지하고요.

▷ 김경래 : 광화문 말씀하시는 거죠?

▶ 김동인 : 네, 광화문광장에서요. 그리고 70세 이상 남성이 비율상으로는 가장 많았습니다, 같은 공간에서.

▷ 김경래 : 그러면 약간 단순하게 이야기하면 강남권이 연령으로 분화되어서 약간 고연령층은 광화문으로, 그거보다 상대적으로 좀 낮은 연령층은 서초동으로 갔다? 거칠게 이야기하면.

▶ 김동인 : 거칠게 이야기하면 강남 4050은 서초동으로, 강남 6070은 광화문으로 향했다고 볼 수 있는데 물론 이게 모든 참석자들을 대변하는 건 아니지만.

▷ 김경래 : 물론 그렇죠.

▶ 김동인 : 일단 분석했을 때 눈에 띄는 지점들은 이 지점이었다 이 정도로 이야기할 수 있겠네요.

▷ 김경래 : 그게 이제 그 팩트가 어떤 것을 의미하느냐는 조금 더 분석이 필요하고 해석이 필요하겠지만 어쨌든 굉장히 재미있는 상황 데이터인 것 같습니다.

▶ 김동인 : 서초동 같은 경우에는 괜찮은데 광화문은 데이터를 보고 나니까 좀 이런 생각이 들기는 했어요. 압도적인 다수라 하더라도 모든 공론을 대변하는 성격은 아니라는 생각이 들기는 하더라고요.

▷ 김경래 : 그러면 강남권 말고 좀 눈에 띄는 어떤 지역이 있었습니까? 광화문 쪽에서는.

▶ 김동인 : 광화문 쪽에서는 역시 경기 경부권이 많았고요.

▷ 김경래 : 그래요? 경부권?

▶ 김동인 : 경부권이라고 하면 어디인가 궁금하실 텐데 경부고속도로가 인접해 있는 지역이라고 생각하시면 됩니다. 경기 경부권에서 저희가 집회 참가 기준으로만 봤을 때 한 5만여 명 정도. 그리고 서울 동남권, 그러니까 서초부터 강동까지도 한 5만여 명 정도. 그러니까 비율은 비슷하다, 합쳐놓고 보니까. 이렇게 좀 판단을 할 수 있을 것 같아요.

▷ 김경래 : 경북이라고 하면 거기서 원정을 온 사람들이 꽤 많다는?

▶ 김동인 : 경기 경부권이요.

▷ 김경래 : 경기에서.

▶ 김동인 : 경부권입니다.

▷ 김경래 : 그렇게 표현을 하는군요? 경기도에서 경부고속도로 라인에 있는 쪽을.

▶ 김동인 : 네, 그렇습니다.

▷ 김경래 : 그러니까 경상북도가 아니라.

▶ 김동인 : 네.

▷ 김경래 : 죄송합니다.

▶ 김동인 : 그런데 경상북도도 순위권에 오르기는 했습니다.

▷ 김경래 : 진짜요?

▶ 김동인 : 네, 저희가 이 집계구 분석을 하면, OD 분석을 한다고 하는데 지역별로 추출하는데요. 경북에서도 단일 집단으로 따졌을 때 약 한 1만여 명 정도가 이날 자리에 좀 자리하셨더라고요. 평소에는 사실 이분들이 한 1천 명 정도 있는데 그날따라서 한 10배 정도가 많이 오셨다 이렇게 볼 수 있습니다.

▷ 김경래 : 지역에서 원정을 온 사람들이 꽤 많다 이런 거네요. 그렇죠?

▶ 김동인 : 네, 그렇죠.

▷ 김경래 : 성별로는 어떻습니까? 광화문은.

▶ 김동인 : 광화문은 성별로는 사실 60세 이상 같은 경우에는 남성이 훨씬 높은데요. 특히 70대 이상 같은 경우에는 여성에 비해서 남성이 한 40% 정도 더 많습니다. 그래서 70대 남성이 굉장히 압도적인 다수를 차지하고 있었다 이렇게 볼 수 있을 것 같아요.

▷ 김경래 : 이게 5060보다 70대 남성이 더 비중이 높다? 그러니까 광화문집회의 주축은 고연령대라고 일단 보면 되겠네요. 그렇죠?

▶ 김동인 : 네, 그렇습니다.

▷ 김경래 : 아까 서초동집회는 4050, 성별은 조금 엇비슷하다. 그렇죠? 그 차이는 없다고 말씀하셨는데. 젊은층의 비율은 양쪽이 비교하면 어떻습니까? 2030.

▶ 김동인 : 젊은층의, 생활인구 추계다 보니까 그 시점에 얼마나 있었냐는 비율이 되게 중요한데 서초동 같은 경우에는 20대, 30대들이 그래도 평소보다 조금 있기는 했어요.

▷ 김경래 : 평소보다 조금?

▶ 김동인 : 네, 한마디로 집회 참가자들이 없지는 않았다는 건데 문제는 광화문입니다. 광화문 같은 경우에는 평소에 비해서 20대는 줄어듭니다.

▷ 김경래 : 그래요?

▶ 김동인 : 네, 그 순간에 20대, 30대들이 그 공간에 아예 가지를 않았던 거라고 보시면 됩니다.

▷ 김경래 : 집회 때문에 일부러 간 사람들 말고는 평소에 가던 사람들이 오히려 덜 갔다?

▶ 김동인 : 네. 30대는 조금 늘기는 했는데 20대 같은 경우에는, 특히 20세에서 24세 사이 같은 경우에는 평소에 비해서 오히려 적게 갔다 이렇게 볼 수 있을 것 같습니다.

▷ 김경래 : 이게 서울시 아까 데이터 사이트 이름이 뭐라고 하셨죠? 열린데이터광장?

▶ 김동인 : 네, 열린데이터광장입니다.

▷ 김경래 : 여기 가면 지금 말씀하신 모 데이터들을 다 구할 수 있다는 거죠?

▶ 김동인 : 네, 더미 데이터를 구하실 수 있고요. 이 더미 데이터를 활용하면서 얼마든지, 가령 코딩을 좀 하실 수 있는 분들은 분석이 가능합니다.

▷ 김경래 : 한번 가보시면 좋을 것 같고요. 마지막으로 기사에 담지 못했는데 굉장히 흥미로웠던 지점 이런 게 하나 있을 것 같아요.

▶ 김동인 : 제가 서초동 같은 경우에는 현장을 한번 가봤어요. 가봤고 그 현장에서 사람들이 얼마나 밀집해 있었고 어떤 목소리를 내는가 이런 것도 보면서 데이터랑 같이 비교해서 봤는데 사실 데이터라는 건 어디까지나 추정치에 가깝고 실제 현장에서의 목소리는 무척 뜨거웠다 이렇게 좀 볼 수 있을 것 같습니다.

▷ 김경래 : 그래도 어쨌든 서로간에 논란만 있는데 이렇게 데이터로 한번 개략적이나마 상황을 파악해 보는 건 굉장히 좋은 자세가 아닐까, 기자로서는.

▶ 김동인 : 네, 그리고 워낙 요즘 수치를 선언적 수치에 저희가 의존하는 경우가 많아요.

▷ 김경래 : 200만, 300만 이런 거요?

▶ 김동인 : 네, 이게 80만이었다가 갑자기 150만이 됐다 200만이 돼요. 숫자라는 게 앞으로는 좀 보도를 할 때도 저도 좀 조심스럽게 보도를 해야겠다 이런 생각이 들더라고요.

▷ 김경래 : 맞아요. 여러 가지 합의도 필요하고 공부도 좀 필요한 영역인 것 같습니다.

▶ 김동인 : 네, 그렇습니다.

▷ 김경래 : 오늘 말씀 감사합니다.

▶ 김동인 : 고맙습니다.

▷ 김경래 : 재미있네요. 시사인 김동인 기자였습니다.

[사진 출처 : 연합뉴스]

이 기사가 좋으셨다면

오늘의 핫 클릭

실시간 뜨거운 관심을 받고 있는 뉴스

이 기사에 대한 의견을 남겨주세요.

수신료 수신료