[AI의 습격]④ 구글 ‘바드’ 엉터리 답변에 망신…인공지능도 한계는 있다?

입력 2023.02.09 (13:46)

읽어주기 기능은 크롬기반의
브라우저에서만 사용하실 수 있습니다.


다윗(오픈AI)의 공격에 골리앗(구글)이 당황한 걸까.

미 인공지능 스타트업 오픈AI의 언어 인공지능 '챗GPT'에 맞서 구글이 야심 차게 발표한 언어 인공지능 '바드'가 엉터리 답변을 내놓은 점이 알려지며 주가가 급락했습니다.

■ 우주망원경 제임스웹 관련 엉터리 답변으로 주가 급락

8일(현지시간) 마감한 미 뉴욕 나스닥 시장에서 알파벳(구글 모회사)은 7.68% 급락한 99.37달러를 기록했습니다. 이날 구글은 유튜브 행사를 통해 자신들의 인공지능 사업들을 설명할 예정이라 화제를 모았던 터였습니다.

그러나 행사 몇 시간 전 알려진 오답 소식에 이날 주가는 크게 하락했습니다.

앞서 지난 6일(현지시간) 구글은 홈페이지를 통해 언어 인공지능 '바드' 출시 소식을 알렸습니다. 바드는 대화형 인공지능으로 챗GPT처럼 이용자와 문답을 주고받을 수 있습니다.

지난해 말 챗GPT가 공개된 후 전 세계서 화제를 모으자 다급한 구글이 반격에 나섰다는 평가가 나왔습니다. 챗GPT는 지난달 월간활성이용자수(MAU)가 1억 명을 돌파하며 인스타그램이나 틱톡보다도 빠른 성장 속도를 보이고 있습니다.

앞으로 점차 커질 인공지능 시장을 오픈AI가 선점하는 것을 우려한 구글은 지난해 말 사내 비상경계령 '코드 레드'까지 발령하며 인공지능 사업에 속도를 내왔습니다.

그런데 구글이 공개한 시연 영상에서 바드는 '우주망원경 제임스웹의 새로운 발견을 9살 아이에게 설명해 달라'는 질문에 '제임스웹은 태양계 밖의 행성을 처음으로 촬영했다'고 답변합니다.

구글 ‘바드’는 ‘제임스웹이 태양계 밖 행성을 처음 촬영했다’고 답했다.구글 ‘바드’는 ‘제임스웹이 태양계 밖 행성을 처음 촬영했다’고 답했다.

이 답변은 '오답'입니다.

미 항공우주국(NASA)에 따르면 태양계 밖 행성에 대한 최초의 사진은 2004년 유럽남방천문대의 초거대망원경(VLT)이 촬영했습니다.

이를 두고 로이터는 "지난 몇 주 동안 구글은 (챗GPT 때문에) 다급하게 움직였고, 급하게 발표를 하느라 잘못된 답변을 게시했다"고 전했습니다.

■ 편견.오류 위험 여전..언어적 한계도

챗GPT가 전 세계서 폭발적 인기를 모으고 있지만 한 편에선 이런 언어 인공지능 모델의 여러 한계점도 지적되고 있습니다.

챗GPT는 거대한 언어 데이터를 자료로 사전학습한 뒤 이를 기반으로 이용자의 질문에 답변하는 식입니다. 이를 위해 챗GPT는 인터넷 문서와 책, 위키피디아 자료 등 3000억 개 이상 문서를 딥러닝 학습했습니다.

문제는 이들 데이터의 사실과 허구 구분이 어렵다는 점입니다. 인공지능은 그저 입력된 언어 데이터에 기반해 답변할 뿐이기 때문입니다. 앞서 구글 '바드'가 엉터리 답변을 내놓은 것도 그래섭니다.

출시 사흘 만에 종료된 MS 인공지능 ‘테이’출시 사흘 만에 종료된 MS 인공지능 ‘테이’

앞서 출시됐던 마이크로소프트의 인공지능 '테이', 국내 '이루다' 등도 모두 이런 문제점들이 논란되며 서비스를 조기 종료했습니다. 성차별이나 각종 오류, 편견 등이 섞인 답변을 마치 사실인 것처럼 이용자에게 제시할 수 있습니다.

챗GPT는 시기적 한계도 있습니다. 챗GPT가 채택한 트랜스포머 딥러닝 모델은 사전학습이 필요하기 때문에 챗GPT는 2021년까지 자료로만 학습했습니다. 챗GPT에게 '한국 대통령이 누구입니까?'라고 물으면 문재인 전 대통령이라고 답하는 이유입니다.

언어적 한계도 존재합니다. 챗GPT는 3,000억 개 이상 데이터를 학습했지만 92.6%는 영어 데이터입니다. 한글 데이터는 0.2%에도 미치지 못합니다. 챗GPT가 사전학습 모델인 점을 감안하면, 우리가 한글로 질문을 입력하면 챗GPT 성능의 0.2%도 사용하지 못하는 셈입니다.

다만, 인공지능 관련 기술이 발전하며 현재 존재하는 여러 한계점도 해결될 여지는 있습니다. 예컨대 2006년 딥러닝 알고리즘 발견 후에도 인공지능은 한동안 자연스러운 대화가 어려웠지만, 2017년 트랜스포머 모델이 발표된 후 급속도로 성능이 좋아졌습니다. 현재 챗GPT와 구글 '바드' 모두 트랜스포머 모델을 적용한 인공지능입니다.

■ 제보하기
▷ 카카오톡 : 'KBS제보' 검색, 채널 추가
▷ 전화 : 02-781-1234, 4444
▷ 이메일 : kbs1234@kbs.co.kr
▷ 유튜브, 네이버, 카카오에서도 KBS뉴스를 구독해주세요!


  • [AI의 습격]④ 구글 ‘바드’ 엉터리 답변에 망신…인공지능도 한계는 있다?
    • 입력 2023-02-09 13:46:35
    취재K

다윗(오픈AI)의 공격에 골리앗(구글)이 당황한 걸까.

미 인공지능 스타트업 오픈AI의 언어 인공지능 '챗GPT'에 맞서 구글이 야심 차게 발표한 언어 인공지능 '바드'가 엉터리 답변을 내놓은 점이 알려지며 주가가 급락했습니다.

■ 우주망원경 제임스웹 관련 엉터리 답변으로 주가 급락

8일(현지시간) 마감한 미 뉴욕 나스닥 시장에서 알파벳(구글 모회사)은 7.68% 급락한 99.37달러를 기록했습니다. 이날 구글은 유튜브 행사를 통해 자신들의 인공지능 사업들을 설명할 예정이라 화제를 모았던 터였습니다.

그러나 행사 몇 시간 전 알려진 오답 소식에 이날 주가는 크게 하락했습니다.

앞서 지난 6일(현지시간) 구글은 홈페이지를 통해 언어 인공지능 '바드' 출시 소식을 알렸습니다. 바드는 대화형 인공지능으로 챗GPT처럼 이용자와 문답을 주고받을 수 있습니다.

지난해 말 챗GPT가 공개된 후 전 세계서 화제를 모으자 다급한 구글이 반격에 나섰다는 평가가 나왔습니다. 챗GPT는 지난달 월간활성이용자수(MAU)가 1억 명을 돌파하며 인스타그램이나 틱톡보다도 빠른 성장 속도를 보이고 있습니다.

앞으로 점차 커질 인공지능 시장을 오픈AI가 선점하는 것을 우려한 구글은 지난해 말 사내 비상경계령 '코드 레드'까지 발령하며 인공지능 사업에 속도를 내왔습니다.

그런데 구글이 공개한 시연 영상에서 바드는 '우주망원경 제임스웹의 새로운 발견을 9살 아이에게 설명해 달라'는 질문에 '제임스웹은 태양계 밖의 행성을 처음으로 촬영했다'고 답변합니다.

구글 ‘바드’는 ‘제임스웹이 태양계 밖 행성을 처음 촬영했다’고 답했다.
이 답변은 '오답'입니다.

미 항공우주국(NASA)에 따르면 태양계 밖 행성에 대한 최초의 사진은 2004년 유럽남방천문대의 초거대망원경(VLT)이 촬영했습니다.

이를 두고 로이터는 "지난 몇 주 동안 구글은 (챗GPT 때문에) 다급하게 움직였고, 급하게 발표를 하느라 잘못된 답변을 게시했다"고 전했습니다.

■ 편견.오류 위험 여전..언어적 한계도

챗GPT가 전 세계서 폭발적 인기를 모으고 있지만 한 편에선 이런 언어 인공지능 모델의 여러 한계점도 지적되고 있습니다.

챗GPT는 거대한 언어 데이터를 자료로 사전학습한 뒤 이를 기반으로 이용자의 질문에 답변하는 식입니다. 이를 위해 챗GPT는 인터넷 문서와 책, 위키피디아 자료 등 3000억 개 이상 문서를 딥러닝 학습했습니다.

문제는 이들 데이터의 사실과 허구 구분이 어렵다는 점입니다. 인공지능은 그저 입력된 언어 데이터에 기반해 답변할 뿐이기 때문입니다. 앞서 구글 '바드'가 엉터리 답변을 내놓은 것도 그래섭니다.

출시 사흘 만에 종료된 MS 인공지능 ‘테이’
앞서 출시됐던 마이크로소프트의 인공지능 '테이', 국내 '이루다' 등도 모두 이런 문제점들이 논란되며 서비스를 조기 종료했습니다. 성차별이나 각종 오류, 편견 등이 섞인 답변을 마치 사실인 것처럼 이용자에게 제시할 수 있습니다.

챗GPT는 시기적 한계도 있습니다. 챗GPT가 채택한 트랜스포머 딥러닝 모델은 사전학습이 필요하기 때문에 챗GPT는 2021년까지 자료로만 학습했습니다. 챗GPT에게 '한국 대통령이 누구입니까?'라고 물으면 문재인 전 대통령이라고 답하는 이유입니다.

언어적 한계도 존재합니다. 챗GPT는 3,000억 개 이상 데이터를 학습했지만 92.6%는 영어 데이터입니다. 한글 데이터는 0.2%에도 미치지 못합니다. 챗GPT가 사전학습 모델인 점을 감안하면, 우리가 한글로 질문을 입력하면 챗GPT 성능의 0.2%도 사용하지 못하는 셈입니다.

다만, 인공지능 관련 기술이 발전하며 현재 존재하는 여러 한계점도 해결될 여지는 있습니다. 예컨대 2006년 딥러닝 알고리즘 발견 후에도 인공지능은 한동안 자연스러운 대화가 어려웠지만, 2017년 트랜스포머 모델이 발표된 후 급속도로 성능이 좋아졌습니다. 현재 챗GPT와 구글 '바드' 모두 트랜스포머 모델을 적용한 인공지능입니다.

이 기사가 좋으셨다면

오늘의 핫 클릭

실시간 뜨거운 관심을 받고 있는 뉴스

이 기사에 대한 의견을 남겨주세요.

수신료 수신료