[이슈&뉴스] 말하고 듣는 AI 시대…뒤처진 한국어

입력 2017.02.21 (21:28) 수정 2017.02.21 (22:37)

읽어주기 기능은 크롬기반의
브라우저에서만 사용하실 수 있습니다.

<앵커 멘트>

'안녕하세요'라는 인삿말, 세계 각국의 언어로 바꾸면 이렇게나 많습니다.

인간의 언어는 무려 5천 개 이상으로 추정이 되는데요.

그렇다보니 외국어 책을 읽거나 외국인을 만났을 때, 해외 여행을 가서, 언어의 벽에 부딪히게 되곤 합니다.

그런데 최근엔 이 스마트폰에 외국어를 통·번역해주는 앱이 실리고 있습니다.

인공지능, AI 덕에 완성도도 나날이 나아지고 있고, 이젠 인공지능 번역기가 인간과 대결을 펼치는 수준까지 발전했습니다.

결과가 어땠을까요.

송형국 기자입니다.

▼ 인간 vs A.I…이번엔 번역대결 ▼

<리포트>

인간 번역사들과 인공지능 번역기에 각각 시험 문제가 전달됩니다.

번역사들에겐 50분이 주어졌고, 인공지능은 거의 실시간으로 번역을 내놓습니다.

번역사협회 채점 결과 4명의 인간 번역사 평균 점수는 82점, 3개의 인공지능은 33점이 나왔습니다.

점수로는 인간 번역사의 압도적 우위지만, 인공지능도 속도는 물론 품질 면에서도 놀랄만큼 성장했다는 평가입니다.

<인터뷰> 성창권(전문 번역사) : "상당히 좀 위협적이다... 번역한 결과물을 보면 사람이 번역한 내용하고 거의 비슷하게..."

수많은 번역 데이터를 스스로 학습하는 방식인 인공신경망 기반 서비스가 등장하면서 비약적으로 발전한 겁니다.

<인터뷰> 김유석(인공지능언어 전문업체 상무) : "스스로 오류를 제거하는 학습을 할 수 있는 기반이 있기 때문에 성능 차이가 굉장히 많아졌다."

<녹취> "나는 오늘 저녁에 맛있는 저녁을 먹었다."

인공신경망이 맥락을 파악하기 때문에 '저녁'을 '저녁식사'와 구분해 번역하는 겁니다.

일어 번역의 경우, 더 방대한 데이터 덕분에 소설가 무라카미 하루키가 번역한 소설 '위대한 개츠비'가 구글이 번역한 것과 큰 차이가 없다는 평가가 나오기도 했습니다.

업계에선 인공지능의 한국어 번역이 전문가 수준에 이르기까지 3년 정도 남은 것으로 보고 있습니다.

KBS 뉴스 송형국입니다.

▼ ‘말귀 밝은’ 인공지능 폭발 성장 ▼

<기자 멘트>

1년 앞둔 평창 올림픽에서 통역 안내를 맡게 된 인공지능, AI 로봇입니다.

말 한 번 시켜볼까요?

<녹취> "주경기장으로 가는 버스를 놓쳤는데 택시 좀 불러주세요."

8개 국어가 가능합니다.

현재 2천만 개의 문장을 배웠고, 내년까지 학습하면 3천2백만 개 문장을 듣고 말 할 수 있게 됩니다.

퇴근하고 집에 왔습니다.

<녹취> "거실등 더 밝게."

<녹취> "KBS 1 틀어줘."

AI가 사물인터넷과 결합한 음성 인식 비서입니다.

글로벌 IT 기업뿐만 아니라 SKT, KT 같은 국내 기업도 이 시장에 뛰어들었죠.

올해만 전 세계에서 2,400만 대가 팔릴 것으로 예상되는데, 최근 2년동안 팔린 양의 4배나 됩니다.

삼성, LG전자도 차기작 스마트폰의 핵심 기능에 이 음성 인식 비서를 탑재합니다.

이렇게 말을 알아듣는 AI가 더 똑똑해지려면, 컴퓨터가 이해할 수 있게 코드화한 언어 자료가 필요합니다.

알파고가 이세돌을 꺾기 위해 스스로 학습할 때 수많은 기보를 활용한 것과 마찬가지입니다.

AI가 배우는 인간의 음성, 의미 등을 '말뭉치'라고 하는데요,

이 말뭉치가 많을수록 똑똑해질 수 있습니다.

한국어 기반 AI의 수준은 어디쯤 와 있을까요.

▼ 멈춰선 ‘한국어’ 말뭉치…‘산업 경쟁력’ 발목 ▼

<리포트>

관광객이 붐비는 인사동, 경찰이 통역 어플리케이션으로 외국인과 대화중입니다.

경찰 업무에 쓰는 특수한 표현들, 곧장 중앙 서버에 저장됩니다.

이 AI 비서는 출시 초기, 많은 사람들의 목소리 수집을 우선 전략으로 삼았습니다.

<인터뷰> 신윤호(SKT 마케팅팀 팀장) : "음성의 고조와 빠르기, 사투리와 같은 여러 가지 요소들이 있기 때문에 이러한 것들은 계속해서 연습시켜야..."

이렇게 개별 기업이나 연구단체가 한국어 말뭉치를 모은 게 5억 어절 정도, 영어는 2,000억 어절, 일본어는 100억 어절 이상의 말뭉치를 확보한 데 비하면 턱없이 부족합니다.

국립국어원이 한국어 말뭉치 수집 사업을 펼쳤지만 2007년 끝난 뒤 10년째 제자리입니다.

산업 현장에선 사람과 협업하는 AI 로봇이 쓰이고 있고, 미래엔 극한 환경에서 말을 알아듣는 로봇의 활용도 늘어날 것으로 예측됩니다.

그런데 기계가 우리 말을 이해하지 못하면 생산성 저하는 물론이고, 미래 먹거리인 음성인식 AI 시장의 주도권을 외국 업체에 빼앗길 가능성도 상당합니다.

<인터뷰> 김선철(국립국어원 언어정보과장) : "지금이라도 시작을 해서 많은 말뭉치를 확보하고 공급해줘야 해외 의존도도 낮아지고 우리 국부도 창출될 가수 있다는 것이죠."

영어권 국가에서는 방대한 영어 데이터를 벤처기업이 언제든 쓸 수 있어 경쟁력을 키우고 있습니다.

KBS 뉴스 지형철입니다.

■ 제보하기
▷ 카카오톡 : 'KBS제보' 검색, 채널 추가
▷ 전화 : 02-781-1234, 4444
▷ 이메일 : kbs1234@kbs.co.kr
▷ 유튜브, 네이버, 카카오에서도 KBS뉴스를 구독해주세요!


  • [이슈&뉴스] 말하고 듣는 AI 시대…뒤처진 한국어
    • 입력 2017-02-21 21:31:06
    • 수정2017-02-21 22:37:48
    뉴스 9
<앵커 멘트>

'안녕하세요'라는 인삿말, 세계 각국의 언어로 바꾸면 이렇게나 많습니다.

인간의 언어는 무려 5천 개 이상으로 추정이 되는데요.

그렇다보니 외국어 책을 읽거나 외국인을 만났을 때, 해외 여행을 가서, 언어의 벽에 부딪히게 되곤 합니다.

그런데 최근엔 이 스마트폰에 외국어를 통·번역해주는 앱이 실리고 있습니다.

인공지능, AI 덕에 완성도도 나날이 나아지고 있고, 이젠 인공지능 번역기가 인간과 대결을 펼치는 수준까지 발전했습니다.

결과가 어땠을까요.

송형국 기자입니다.

▼ 인간 vs A.I…이번엔 번역대결 ▼

<리포트>

인간 번역사들과 인공지능 번역기에 각각 시험 문제가 전달됩니다.

번역사들에겐 50분이 주어졌고, 인공지능은 거의 실시간으로 번역을 내놓습니다.

번역사협회 채점 결과 4명의 인간 번역사 평균 점수는 82점, 3개의 인공지능은 33점이 나왔습니다.

점수로는 인간 번역사의 압도적 우위지만, 인공지능도 속도는 물론 품질 면에서도 놀랄만큼 성장했다는 평가입니다.

<인터뷰> 성창권(전문 번역사) : "상당히 좀 위협적이다... 번역한 결과물을 보면 사람이 번역한 내용하고 거의 비슷하게..."

수많은 번역 데이터를 스스로 학습하는 방식인 인공신경망 기반 서비스가 등장하면서 비약적으로 발전한 겁니다.

<인터뷰> 김유석(인공지능언어 전문업체 상무) : "스스로 오류를 제거하는 학습을 할 수 있는 기반이 있기 때문에 성능 차이가 굉장히 많아졌다."

<녹취> "나는 오늘 저녁에 맛있는 저녁을 먹었다."

인공신경망이 맥락을 파악하기 때문에 '저녁'을 '저녁식사'와 구분해 번역하는 겁니다.

일어 번역의 경우, 더 방대한 데이터 덕분에 소설가 무라카미 하루키가 번역한 소설 '위대한 개츠비'가 구글이 번역한 것과 큰 차이가 없다는 평가가 나오기도 했습니다.

업계에선 인공지능의 한국어 번역이 전문가 수준에 이르기까지 3년 정도 남은 것으로 보고 있습니다.

KBS 뉴스 송형국입니다.

▼ ‘말귀 밝은’ 인공지능 폭발 성장 ▼

<기자 멘트>

1년 앞둔 평창 올림픽에서 통역 안내를 맡게 된 인공지능, AI 로봇입니다.

말 한 번 시켜볼까요?

<녹취> "주경기장으로 가는 버스를 놓쳤는데 택시 좀 불러주세요."

8개 국어가 가능합니다.

현재 2천만 개의 문장을 배웠고, 내년까지 학습하면 3천2백만 개 문장을 듣고 말 할 수 있게 됩니다.

퇴근하고 집에 왔습니다.

<녹취> "거실등 더 밝게."

<녹취> "KBS 1 틀어줘."

AI가 사물인터넷과 결합한 음성 인식 비서입니다.

글로벌 IT 기업뿐만 아니라 SKT, KT 같은 국내 기업도 이 시장에 뛰어들었죠.

올해만 전 세계에서 2,400만 대가 팔릴 것으로 예상되는데, 최근 2년동안 팔린 양의 4배나 됩니다.

삼성, LG전자도 차기작 스마트폰의 핵심 기능에 이 음성 인식 비서를 탑재합니다.

이렇게 말을 알아듣는 AI가 더 똑똑해지려면, 컴퓨터가 이해할 수 있게 코드화한 언어 자료가 필요합니다.

알파고가 이세돌을 꺾기 위해 스스로 학습할 때 수많은 기보를 활용한 것과 마찬가지입니다.

AI가 배우는 인간의 음성, 의미 등을 '말뭉치'라고 하는데요,

이 말뭉치가 많을수록 똑똑해질 수 있습니다.

한국어 기반 AI의 수준은 어디쯤 와 있을까요.

▼ 멈춰선 ‘한국어’ 말뭉치…‘산업 경쟁력’ 발목 ▼

<리포트>

관광객이 붐비는 인사동, 경찰이 통역 어플리케이션으로 외국인과 대화중입니다.

경찰 업무에 쓰는 특수한 표현들, 곧장 중앙 서버에 저장됩니다.

이 AI 비서는 출시 초기, 많은 사람들의 목소리 수집을 우선 전략으로 삼았습니다.

<인터뷰> 신윤호(SKT 마케팅팀 팀장) : "음성의 고조와 빠르기, 사투리와 같은 여러 가지 요소들이 있기 때문에 이러한 것들은 계속해서 연습시켜야..."

이렇게 개별 기업이나 연구단체가 한국어 말뭉치를 모은 게 5억 어절 정도, 영어는 2,000억 어절, 일본어는 100억 어절 이상의 말뭉치를 확보한 데 비하면 턱없이 부족합니다.

국립국어원이 한국어 말뭉치 수집 사업을 펼쳤지만 2007년 끝난 뒤 10년째 제자리입니다.

산업 현장에선 사람과 협업하는 AI 로봇이 쓰이고 있고, 미래엔 극한 환경에서 말을 알아듣는 로봇의 활용도 늘어날 것으로 예측됩니다.

그런데 기계가 우리 말을 이해하지 못하면 생산성 저하는 물론이고, 미래 먹거리인 음성인식 AI 시장의 주도권을 외국 업체에 빼앗길 가능성도 상당합니다.

<인터뷰> 김선철(국립국어원 언어정보과장) : "지금이라도 시작을 해서 많은 말뭉치를 확보하고 공급해줘야 해외 의존도도 낮아지고 우리 국부도 창출될 가수 있다는 것이죠."

영어권 국가에서는 방대한 영어 데이터를 벤처기업이 언제든 쓸 수 있어 경쟁력을 키우고 있습니다.

KBS 뉴스 지형철입니다.

이 기사가 좋으셨다면

오늘의 핫 클릭

실시간 뜨거운 관심을 받고 있는 뉴스

이 기사에 대한 의견을 남겨주세요.

수신료 수신료