AI란? Artificial Intelligence의 약자로 인공지능을 말하며 인간의 학습능력, 추론능력, 지각능력을 컴퓨터 또는 기계에 학습시켜 사람과 유사하게 사고를 갖춘 시스템을 의미한다.
Google Bard라는 이름으로 출시된 AI의 단점을 보완하고자 Gemini라는 이름의 AI가 출시되었다.
Gemini 소개 및 특징
소개
구글에서 2023년 5월 15일 Bard라는 대화형 AI를 출시하였다. Bard는 대화에만 초점을 두고 만들어지다 보니 활용할 수 있는 범위가 크지 않고 한계성이 많았다. 이러한 문제점을 벗어나고자 기존 대화기능에서 이미지, 코드, 콘텐츠 제작 처리능력을 추가한 Gemini라는 이름으로 변경하게 되었다.
특징
✅ 구글 서치를 통한 최신정보를 기반으로 한 AI 모델이다.
✅ 텍스트, 시각, 오디오, 비디오 등의 다양한 입출력을 지원한다.
✅ 구글의 여러 플랫폼을 기반으로 다양한 확장성을 갖추고 있다.
✅ 폭력이나 부정적인 부분을 필터링해서 보다 윤리적이다.
버전
Gemini는 Pro와 Ultra 두 가지 버전을 가지고 있다.
Gemini 프로 버전은 무료버전이다.
✅ 일상적인 작업, 정보 검색, 창의적인 작업등에 적합한 모델이다.
✅ 복잡한 작업을 필요로 할 경우 구체적인 프롬프트가 필요하다.
Gemini Ultra 버전은 유료버전이다.
✅ 연구, 고급 데이터 분석 등의 대용량 처리 및 복잡한 처리등에 적합한 모델이다.
Gemini Ultra 무료 2개월 사용하기
![]() |
![]() |
![]() |
![]() |
![]() |
Gemini 활용 방법
Gemini는 여러 가지 활용 방법이 있다.
추론
✅ 추론이란? 이미 알고 있는 사실을 바탕으로 결과를 이끌어 내는 사고과정을 뜻한다.
예시를 통하여 AI가 주어진 사실을 바탕으로 결과를 어떻게 이끌어 내는지 살펴보자.
예시)
A와 B팀의 농구 경기가 끝이 났다. A팀이 80점을 획득하고 B팀은 70점을 득점하여 A팀이 승리를 하였다. A팀의 5명의 선수의 득점을 보면 Kim이 팀의 절반의 득점을 하였고 Park은 Kim의 절반의 득점을 하였다. Lee는 10점을 획득하였고 Yun은 Choi 보다 2점의 득점을 더하였다. Yun은 몇 점의 득점을 하였을까?
위와 같이 주어진 정보를 바탕으로 결과를 도출하였다. 생각보다 더 똑똑하다고 느껴진 것은 추론이란 과정을 수학적 연산을 통하여 정확하게 결괏값을 만들어 내는 과정에 놀랐다.
이미지 생성
텍스트로 이미지에 대한 상세설명을 부여하여 이미지를 생성해 보자.
예시)
사진은 카페 내부 사진으로 전면에 작은 십자 모양의 작은 창문이 있고, 창문 위에는 작은 꽃 그림의 액자가 걸려 있다. 창문 앞에는 둥근 테이블이 있고, 그 위에는 고양이가 잠을 자고 있다. 테이블 양쪽에는 푹신해 보이는 흰색 의자가 놓여있다.
위의 설명에 해당하는 이미지를 만들어줘.
생성된 이미지를 보면 완벽하지는 않지만 생각보다 설명에 가깝게 이미지가 만들어진 것을 볼 수 있다.
※ 이미지 자신이 원하는 대로 생성하고 싶다면 요청을 보다 구체적으로 묘사를 하면 좀 더 정확하게 만들어지는 걸 볼 수 있다.
이미지 분석
Gemini에서는 다양한 입출력을 제공하는 데 그중 하나는 이미지 Upload 방식이다.
이미지를 첨부하여 이미지에 대한 분석을 해보자.
예시)
첨부된 이미지에 대한 분석을 해줘.
위에서 생성된 이미지를 첨부해 보자
![]() |
![]() |
이미지에 대한 분석은 제법 정확하다는 걸 볼 수가 있다.
Google Drive PDF 요약
Gemini는 Google에서 만든 만큼 다양한 Google 플랫폼과도 연동이 가능하다.
먼저 구글 드라이브와 연동하기 위한 확장 프로그램 설정을 변경하도록 하자.
![]() |
![]() |
![]() |
구글 드라이브를 통한 PDF 정보를 읽어서 요약하는 것을 해보도록 하자.
✅ 파일을 읽기 위해서는 구글 드라이브에 test.pdf 파일을 공유 파일(편집모드)로 설정해야 한다.
예시)
@Google Drive 구글 드라이브에 있는 test.pdf 파일을 요약해 줘.
여러 번 수행을 하면서 PDF 파일에 접근이 되지 않는 경우가 많이 발생하였다. 아직까지는 완벽하게 연동되지 않는 듯하다.
구글 지도 활용
Gemini에서 구글 지도를 활용해 보도록 하자.
예시)
한국 서울의 롯데월드타워 지도에 표시해 줘
@Google 지도라는 확장 프로그램을 사용하지 않고 명령 프롬프트만으로 동일한 결과가 나왔다.
장소를 요청하는 명령 프롬프트로 인하여 자동으로 구글 지도로 표시가 된 듯 보인다.
URL을 통한 유튜브 정보 요약
온라인 강의나 동영상을 직접보기에는 시간이 부족한 경우가 많다. 보다 효율적으로 내용 요약하여 시간을 절약해 보자.
Gemini를 통한 유튜브 url을 이용하여 정상적으로 요약이 되는지 확인해 보도록 하자.
예시)
아래의 유튜브 url을 요약해 줘.
https://www.youtube.com/watch?v=jV1vkHv4zq8
![]() |
![]() |
위와 같이 유튜브의 내용이 요약이 된 것을 볼 수 있다. 테스트를 해보려면 영문 유튜브를 대상으로 하시기 바랍니다.
블로그 글 작성
주제만을 제시하여 블로그에 사용하기 가능한 글인지 확인해 보도록 하자.
예시)
비트코인에 대한 블로그를 작성해 줘.
![]() |
![]() |
![]() |
비트코인이라는 주제에 맞게 글이 완성되었다. GPT-3.5와 비슷한 수준으로 작성이 되었다.
✅ 구독 해지
![]() |
![]() |
Gemini 사용 후기
Gemini Pro와 Ultra 버전을 둘 다 사용해 본 결과 일상적으로 사용되는 기능들에서는 성능차이가 보이지 않았다. 굳이 Ultra 버전을 사용할 필요는 없어 보인다.
장점
✅ 하나의 시스템에 이미지, 코딩 등 여러 가지 기능이 있어서 사용하기 편리하다.
✅ 여러 플랫폼과 연동이 가능하여 추후 다양한 서비스가 가능할 것이다.
단점
✅ 문장 이해력이 CHAT GPT 보다 떨어지는 느낌을 받았다.
✅ 영어로만 대화가 가능하다.
✅ GPT 보다 구체적인 명령이 필요한 경우가 많았다.
'IT' 카테고리의 다른 글
단톡방 조용히 나가기 (0) | 2024.03.20 |
---|---|
알뜰폰 통신사 무제한 요금제 가격비교하기 (0) | 2024.03.19 |
vscode 설치 및 단축키 필수 플러그인 설치 설정 방법 (0) | 2024.03.12 |
java jdk 다운로드 설치 및 환경변수 설정 따라하기 (0) | 2024.03.10 |
챗gpt를 이용한 pdf 업로드 요약 및 유튜브 요약 활용 방법 (0) | 2024.03.09 |