구글은 오늘 새로운 인공지능 도구인 Gemini을 출시했다고 밝혔다. 이 도구는 마이크로소프트와의 제휴인 OpenAI가 개발한 인기 있는 ChatGPT보다도 강력하다고 소개되고 있다. Gemini은 “다중 모드”를 강조하며, 텍스트, 이미지, 비디오, 오디오 및 코드 등을 통해 원활하게 추론할 수 있다고 한다. 이 기능은 MMLU 모델을 통해 가능한 것으로 알려졌다. 이 모델은 “다중 작업 언어 이해”의 영어 약어로 알려져 있다.
회사가 제공한 개요에 따르면, Gemini은 Nano, Pro 및 Ultra 세 가지 형식으로 출시될 예정이다. Ultra는 복잡한 작업에 가장 강력한 기능을 가진 버전으로 알려져 있다. Gemini은 시각적이거나 청각적인 정보를 받고 그 정보를 바탕으로 자체 콘텐츠를 생성할 수 있다. 또한, 이 콘텐츠는 다시 텍스트, 오디오 또는 이미지로 변환될 수 있다.
Gemini은 발표에서 복잡한 수학 문제의 오류를 감지하고 올바른 답을 도출하는 과정을 설명할 수 있다고 한다. 또한, 간단한 그림을 통해 오리에 대한 풍부한 정보를 제공하며 다섯 가지 언어로 번역할 수도 있다.
또한, Gemini은 사용자와 가위바위보나 세 컵 게임과 같은 인기 도전에서 놀 수 있다고 한다.
개발자들은 Gemini이 Java, Python, C++ 및 Go와 같은 가장 일반적인 코드 언어와 작업할 수 있다고 말한다. 그러나 일부 오류가 있을 수 있지만 Google은 90%의 경우 이를 해결할 수 있다고 밝혔다.
Gemini의 잠재력은 이미 다국어로 작동하는 기존 채팅 시스템인 Bard에도 적용될 예정이다.
회사는 이 새로운 도구를 어떻게 수익화할지 명확히 밝히지 않았다. 현재로서는 12월 13일부터 사용 가능하다고 발표된 것으로 알려졌다.
“Infuriatingly humble tv expert. Friendly student. Travel fanatic. Bacon fan. Unable to type with boxing gloves on.”