[머니 시그널] 듣고 말하는 AI, 세상을 어떻게 바꿀까

입력 2024.05.23 (18:26) 수정 2024.05.23 (19:52)

읽어주기 기능은 크롬기반의
브라우저에서만 사용하실 수 있습니다.

당신에게 귀 기울여 주고 그리고 당신을 이해해주고 알아줄 존재.

인공지능 AI를 이렇게 표현한 영화 그녀.

기억하십니까?

[영화 '그녀' 중 일부 : "좋은 아침, 테어도르 (좋은 아침) 5분 후에 회의야, 벌떡 좀 일어나 보실래요? 일어나!"]

사람처럼 말하고 그림도 그리고 작곡까지 했던 인공지능 운영 체계 사만다.

남자 주인공은 사만다와 사랑에 빠지기도 합니다.

10년 전 이 영화가 다시 소환된 이유?

오픈AI의 GPT-4o 때문입니다.

4o에서 o는 옴니라는 단어의 앞글자로써 영화 속의 사만다로서 어디서나 존재한다는 뜻인데요.

핵심은 말, 음성입니다.

사람처럼 듣고 말합니다.

혹시 이미 그런 거 많잖아. 라고 생각하신다면 큰 착각이십니다.

이미 있는 아마존의 아이폰의 시리, 그리고 갤럭시의 빅스비도 음성 기반이죠.

다만 기존 인공지능은 음성형 텍스트로 바꿔서 음성을 텍스트로 바꿔서 인식하고 답변도 텍스트로 먼저 만든 다음 음성으로 합성하는 식이었습니다.

이제는 음성을 음성 그 자체로 인식합니다.

처리 과정이 그만큼 빨라졌다는 것이고요.

목소리에 담긴 감정이나 배경이 섞인 소리도 알아차릴 수 있습니다.

0.3초, 눈 깜빡이는 찰나의 시간에 GPT-4o가 바로 반영할 수 있는 겁니다.

실시간 대화가 가능하고 중간에 말을 끊어도 됩니다.

일단 AI 비서 시장이 큰 힘을 받을 수 있습니다.

지금까지 부진했지만, 앞으로는 차원이 다를 수 있습니다.

구글은 음성을 기반으로 기억력까지 갖춘 AI 비서 아스트라를 이미 선보였고 애플과 아마존도 시리, 알렉사를 업그레이드하겠다고 나섰습니다.

돈이 될 거라고 보고 너도나도 뛰어드는 분위기입니다.

듣고 말하는 AI가 가져올 변화, 가늠하긴 어렵습니다.

당장 80 넘으신 저희 부모님도 GPT-4o와 대화할 수 있습니다.

스마트폰을 켜서 무언가를 입력하고 읽고 또 입력하고 보통 어려운 일이 아니었습니다.

말로 다 가능해진다면 어르신들에게 또 하나의 혁명일 수 있습니다.

여러 분야의 산업에 지각 변동을 일으킬 수 있습니다.

이렇게 생성 AI 중심엔 분명 말, 음성이 있습니다.

그런데 이런 측면도 있을 수 있습니다.

영화 그녀의 인공지능 사만다와 GPT-4o의 목소리를 들어보실까요?

[영화 '그녀' 중 일부 : "안녕하세요, 저 여기 있어요. (안녕하세요.) 저는 사만다예요."]

[GPT-4o 삽입 목소리 : "안녕, 오늘 좋은데 당신은 어때요? 오픈AI 로고가 들어간 옷을 입고 있네요. 좋은 선택이에요."]

영화 속 사만다는 여러분도 잘 아시는 영화배우 스칼렛 요한슨의 연기였습니다.

GPT-4o의 음성의 허스키한 목소리와 많이 닮았죠?

배우가 목소리 사용을 허락한 거 아닙니다.

반대로 명확하게 거절했습니다.

그런데도 오픈AI가 비슷한 목소리를 사용해 논란이 커졌고 이 목소리 삭제됐습니다.

이 문제 표절이나 저작권에 그치지 않습니다.

한번 상상해 보시죠.

AI가 내 가족의 목소리를 뺏겨 보이스피싱을 해온다면 어떻겠습니까?

아이폰이 세상을 뒤집어 놓은 만큼 생성형 AI도 그만큼 세상을 바꿀 거다.

엔비디아의 젠슨 황의 말입니다.

다만 변화의 방향이 어느 쪽일지는 결국 우리가 쓰기 나름일 겁니다.

■ 제보하기
▷ 카카오톡 : 'KBS제보' 검색, 채널 추가
▷ 전화 : 02-781-1234, 4444
▷ 이메일 : kbs1234@kbs.co.kr
▷ 유튜브, 네이버, 카카오에서도 KBS뉴스를 구독해주세요!


  • [머니 시그널] 듣고 말하는 AI, 세상을 어떻게 바꿀까
    • 입력 2024-05-23 18:26:20
    • 수정2024-05-23 19:52:37
    경제콘서트
당신에게 귀 기울여 주고 그리고 당신을 이해해주고 알아줄 존재.

인공지능 AI를 이렇게 표현한 영화 그녀.

기억하십니까?

[영화 '그녀' 중 일부 : "좋은 아침, 테어도르 (좋은 아침) 5분 후에 회의야, 벌떡 좀 일어나 보실래요? 일어나!"]

사람처럼 말하고 그림도 그리고 작곡까지 했던 인공지능 운영 체계 사만다.

남자 주인공은 사만다와 사랑에 빠지기도 합니다.

10년 전 이 영화가 다시 소환된 이유?

오픈AI의 GPT-4o 때문입니다.

4o에서 o는 옴니라는 단어의 앞글자로써 영화 속의 사만다로서 어디서나 존재한다는 뜻인데요.

핵심은 말, 음성입니다.

사람처럼 듣고 말합니다.

혹시 이미 그런 거 많잖아. 라고 생각하신다면 큰 착각이십니다.

이미 있는 아마존의 아이폰의 시리, 그리고 갤럭시의 빅스비도 음성 기반이죠.

다만 기존 인공지능은 음성형 텍스트로 바꿔서 음성을 텍스트로 바꿔서 인식하고 답변도 텍스트로 먼저 만든 다음 음성으로 합성하는 식이었습니다.

이제는 음성을 음성 그 자체로 인식합니다.

처리 과정이 그만큼 빨라졌다는 것이고요.

목소리에 담긴 감정이나 배경이 섞인 소리도 알아차릴 수 있습니다.

0.3초, 눈 깜빡이는 찰나의 시간에 GPT-4o가 바로 반영할 수 있는 겁니다.

실시간 대화가 가능하고 중간에 말을 끊어도 됩니다.

일단 AI 비서 시장이 큰 힘을 받을 수 있습니다.

지금까지 부진했지만, 앞으로는 차원이 다를 수 있습니다.

구글은 음성을 기반으로 기억력까지 갖춘 AI 비서 아스트라를 이미 선보였고 애플과 아마존도 시리, 알렉사를 업그레이드하겠다고 나섰습니다.

돈이 될 거라고 보고 너도나도 뛰어드는 분위기입니다.

듣고 말하는 AI가 가져올 변화, 가늠하긴 어렵습니다.

당장 80 넘으신 저희 부모님도 GPT-4o와 대화할 수 있습니다.

스마트폰을 켜서 무언가를 입력하고 읽고 또 입력하고 보통 어려운 일이 아니었습니다.

말로 다 가능해진다면 어르신들에게 또 하나의 혁명일 수 있습니다.

여러 분야의 산업에 지각 변동을 일으킬 수 있습니다.

이렇게 생성 AI 중심엔 분명 말, 음성이 있습니다.

그런데 이런 측면도 있을 수 있습니다.

영화 그녀의 인공지능 사만다와 GPT-4o의 목소리를 들어보실까요?

[영화 '그녀' 중 일부 : "안녕하세요, 저 여기 있어요. (안녕하세요.) 저는 사만다예요."]

[GPT-4o 삽입 목소리 : "안녕, 오늘 좋은데 당신은 어때요? 오픈AI 로고가 들어간 옷을 입고 있네요. 좋은 선택이에요."]

영화 속 사만다는 여러분도 잘 아시는 영화배우 스칼렛 요한슨의 연기였습니다.

GPT-4o의 음성의 허스키한 목소리와 많이 닮았죠?

배우가 목소리 사용을 허락한 거 아닙니다.

반대로 명확하게 거절했습니다.

그런데도 오픈AI가 비슷한 목소리를 사용해 논란이 커졌고 이 목소리 삭제됐습니다.

이 문제 표절이나 저작권에 그치지 않습니다.

한번 상상해 보시죠.

AI가 내 가족의 목소리를 뺏겨 보이스피싱을 해온다면 어떻겠습니까?

아이폰이 세상을 뒤집어 놓은 만큼 생성형 AI도 그만큼 세상을 바꿀 거다.

엔비디아의 젠슨 황의 말입니다.

다만 변화의 방향이 어느 쪽일지는 결국 우리가 쓰기 나름일 겁니다.

이 기사가 좋으셨다면

오늘의 핫 클릭

실시간 뜨거운 관심을 받고 있는 뉴스

이 기사에 대한 의견을 남겨주세요.

2024 파리 올림픽 배너 이미지 수신료 수신료