“GPT-4보다 뛰어나”…카메라로 상호 소통 AI ‘제미나이’ 공개 [오늘 이슈]

입력 2023.12.07 (10:42)

읽어주기 기능은 크롬기반의
브라우저에서만 사용하실 수 있습니다.

구글이 현지시간으로 어제 인공지능 기반의 차세대 언어모델 '제미나이(Gemini)'를 공개했습니다.

제미나이는 이미지를 인식하고, 음성으로 말하고 들을 수 있으며 코딩까지 가능합니다.

시각, 청각 등을 활용해 텍스트뿐 아니라 이미지, 음성, 영상 등을 상호작용하는 다중모드, '멀티모달 AI'여서 훨씬 더 복잡한 추론도 가능합니다.

구글은 제미나이가 수학, 물리학, 역사, 윤리 등 50여 개 주제를 복합적으로 활용해 문제 해결 능력을 평가하는 테스트에서 90%의 정답률을 기록했다고 설명했습니다.

인간 전문가 점수인 89.8%를 뛰어넘은 최초의 모델이자 현재까지 가장 수준이 우수하다고 평가받는 GPT-4가 86.4%의 정답률을 받아 제미나이가 더 뛰어나다는 겁니다.

구글은 제미나이에게 시야 인식 능력이 있고, 사람과 같은 사물 인식과 판단력을 갖췄다고 설명했습니다.

AI가 카메라로 실제 사람의 행동을 보며 상호 소통하는 겁니다.

사람이 종이에 오리를 파란색으로 그리면 "흔치 않지만 파란 오리도 있다"고 대답하는가 하면, 총알을 피하는 듯한 모습을 보여주자 "영화 '매트릭스'의 유명한 장면"이라고 설명했습니다.

제미나이는 가장 규모가 큰 '울트라', 중간 규모의 '프로', 그리고 경량화한 '나노' 세 버전으로 출시됩니다.

범용으로 쓰이는 '제미나이 프로'는 바로 구글의 AI 챗봇 서비스인 '바드'에 탑재됩니다.

KBS 뉴스 이세중입니다.

■ 제보하기
▷ 카카오톡 : 'KBS제보' 검색, 채널 추가
▷ 전화 : 02-781-1234, 4444
▷ 이메일 : kbs1234@kbs.co.kr
▷ 유튜브, 네이버, 카카오에서도 KBS뉴스를 구독해주세요!


  • “GPT-4보다 뛰어나”…카메라로 상호 소통 AI ‘제미나이’ 공개 [오늘 이슈]
    • 입력 2023-12-07 10:42:09
    영상K
구글이 현지시간으로 어제 인공지능 기반의 차세대 언어모델 '제미나이(Gemini)'를 공개했습니다.

제미나이는 이미지를 인식하고, 음성으로 말하고 들을 수 있으며 코딩까지 가능합니다.

시각, 청각 등을 활용해 텍스트뿐 아니라 이미지, 음성, 영상 등을 상호작용하는 다중모드, '멀티모달 AI'여서 훨씬 더 복잡한 추론도 가능합니다.

구글은 제미나이가 수학, 물리학, 역사, 윤리 등 50여 개 주제를 복합적으로 활용해 문제 해결 능력을 평가하는 테스트에서 90%의 정답률을 기록했다고 설명했습니다.

인간 전문가 점수인 89.8%를 뛰어넘은 최초의 모델이자 현재까지 가장 수준이 우수하다고 평가받는 GPT-4가 86.4%의 정답률을 받아 제미나이가 더 뛰어나다는 겁니다.

구글은 제미나이에게 시야 인식 능력이 있고, 사람과 같은 사물 인식과 판단력을 갖췄다고 설명했습니다.

AI가 카메라로 실제 사람의 행동을 보며 상호 소통하는 겁니다.

사람이 종이에 오리를 파란색으로 그리면 "흔치 않지만 파란 오리도 있다"고 대답하는가 하면, 총알을 피하는 듯한 모습을 보여주자 "영화 '매트릭스'의 유명한 장면"이라고 설명했습니다.

제미나이는 가장 규모가 큰 '울트라', 중간 규모의 '프로', 그리고 경량화한 '나노' 세 버전으로 출시됩니다.

범용으로 쓰이는 '제미나이 프로'는 바로 구글의 AI 챗봇 서비스인 '바드'에 탑재됩니다.

KBS 뉴스 이세중입니다.

이 기사가 좋으셨다면

오늘의 핫 클릭

실시간 뜨거운 관심을 받고 있는 뉴스

이 기사에 대한 의견을 남겨주세요.

수신료 수신료