Gemini에서 오디오 및 통화 내용을 효과적으로 텍스트로 변환하는 방법
Gemini의 Android, iOS 및 웹 앱용 새 기능인 오디오 및 비디오 텍스트 변환은 꽤 유용합니다.녹음된 콘텐츠를 텍스트로 변환하는 데 관심이 있다면 꼭 사용해 볼 만합니다.파일을 업로드하면 수동으로 메모를 적거나 특정 부분을 건너뛸 필요 없이 Gemini가 텍스트, 요약 또는 주요 내용을 출력해 줍니다.간단해 보이지만, 실제로 사용하려면 몇 가지 세부 사항, 즉 기능의 한계나 사용 방법을 숙지해야 합니다.
Gemini에서 오디오 및 비디오를 텍스트로 변환하는 방법
제미니에서 성적 증명서를 받는 것은 그리 어려운 일이 아니지만, 몇 가지 주의해야 할 점이 있습니다.다음 사항들을 염두에 두세요.
앱과 파일이 준비되었는지 확인하세요.
먼저, 최신 Gemini 버전으로 업데이트되었는지 확인하세요.새로운 기능들이 업데이트 후에 추가되는 경우가 있습니다.모바일 앱의 경우 앱 스토어에서, 웹 앱의 경우 로그인 후 최신 빌드인지 확인하세요.또한, 동영상이나 오디오 파일의 크기가 제한을 준수하고 지원되는 형식(MP3, MP4, MOV 등)인지 확인하세요.간혹 특정 형식이 아닌 파일은 업로드되지 않거나, 용량이 큰 파일은 Gemini에서 제대로 처리하지 못할 수 있습니다.
원하는 플랫폼에서 Gemini를 실행하세요.
안드로이드 또는 iOS 앱을 실행 하거나 웹사이트 로 이동하세요.눈에 잘 띄는 곳에 있는 작은 “+” 버튼을 찾아보세요.
파일을 선택하세요.올바른 파일을 선택하는 것을 잊지 마세요.
모바일에서는 “파일”을 탭하고, 웹에서는 “파일 보내기”를 클릭하세요.강의, 인터뷰, 회의 등 녹음 파일을 업로드하세요.오류를 방지하려면 파일 크기가 200MB 이하이고 오디오/비디오 품질이 좋은 파일을 사용하는 것이 좋습니다.2시간 분량의 대용량 영상은 요금제에 따라 전송 시간이 매우 오래 걸리거나 아예 전송되지 않을 수도 있습니다.
파일 옆에 “전사” 또는 이와 유사한 명령어를 입력하세요.
업로드가 완료되면 채팅창에 “Transcribe” 라고 입력 하세요.그러면 Gemini가 처리를 시작합니다.특히 파일 길이가 긴 경우 몇 초에서 몇 분 정도 소요될 수 있습니다.처리가 멈추면 인터넷 연결 상태를 확인하거나 다시 업로드해 보세요.이상하지만 채팅 기록을 삭제하면 문제가 해결되는 경우도 있습니다.
그 후 Gemini에서 전체 녹취록을 보내줄 겁니다.요금제에 따라 요약이나 주요 내용을 자동으로 강조 표시해주는 경우도 있는데, 대용량 녹음 파일을 빠르게 검토할 때 꽤 유용합니다.정확한 이유는 모르겠지만, 녹취록 작성이 멈춘 것처럼 보일 때 앱을 재시작하면 도움이 되는 경우가 있습니다.
전사 작업의 한계는 무엇인가요?
이 부분이 조금 헷갈릴 수 있는데, 제미니는 플랜에 따라 다른 한도를 제공하기 때문입니다.간단히 설명드리자면 다음과 같습니다.
- 오디오: 최대 100MB 또는 약 10분
- 동영상: 최대 2GB 또는 약 5분
- 오디오: 최대 3시간
- 영상: 최대 1시간
무료 플랜
프리미엄 플랜
추가적인 제한 사항도 유의할 필요가 있습니다.
- 메시지당 최대 10개의 파일을 보낼 수 있으므로 필요한 경우 일괄 업로드에 적합합니다.
- GitHub이나 유사한 폴더를 통해 업로드하는 경우 파일 수는 5, 000개, 총 용량은 100MB로 제한됩니다.대규모 프로젝트를 업로드하는 경우가 아니라면 이 제한에 도달하기는 어렵습니다.
Gemini는 오디오를 텍스트로 변환할 수 있나요?
이번 업데이트 이전까지 제미니는 주로 문서와 이미지 처리에 특화되어 있었기 때문에 음성 인식 기능은 비교적 새로 추가된 기능입니다.하지만 솔직히 말해서 꽤 괜찮습니다.녹음 내용을 텍스트로 변환하는 것뿐만 아니라 분석 및 요약 기능도 제공합니다.완벽하진 않지만 간단한 메모나 초안 작성에는 충분합니다.
Gemini에서 회의록을 작성하는 방법
회의 녹음 파일이 있고 메모를 확인하고 싶다면, 다음과 같은 팁을 활용해 보세요.
- 휴대폰이나 웹 브라우저에서 Gemini 앱을 엽니다.
- 파일 업로드 버튼을 사용하여 녹음 파일을 업로드하세요.
- 채팅창에 “이 회의록을 작성해 주세요” 와 같은 내용을 입력하세요.회의가 길 경우 “10분 동안 작성해 주세요”처럼 구체적으로 지정할 수도 있습니다.
파일 크기와 요금제 제한에 따라 처리 시간이 달라질 수 있습니다.수동 입력보다 빠를 때도 있고, 느릴 때도 있는데, 서버 부하에 따라 다릅니다.하지만 없는 것보다는 훨씬 낫죠.
전반적으로 제미니의 새로운 음성 인식 기능은 음성 파일을 읽기 쉬운 텍스트로 변환하는 데 훨씬 더 유용하게 만들어 줍니다.왜 진작 이 기능을 추가하지 않았는지 모르겠지만, 늦게라도 추가된 것은 다행입니다.이 팁들을 활용하면 기존의 문제점들을 피하고 더 깔끔한 결과물을 얻을 수 있을 것입니다.
요약
- Gemini가 최신 버전인지, 그리고 파일이 지원되는지 확인하세요.
- 올바른 크기와 형식의 파일을 업로드하세요.
- 업로드 후 “전사”를 입력하거나 요약을 요청하세요.
- 요금제별 제한 사항이 다르므로 구독 내용을 확인하세요.
마무리
이 정보가 누군가에게 도움이 되어 이상한 설정을 만지작거리거나 다시 업로드하는 데 시간을 낭비하지 않도록 해주길 바랍니다. Gemini의 음성 인식 기능은 마치 반전처럼 느껴집니다.완벽하진 않지만 생산성을 크게 향상시켜주는 건 분명합니다.용량 제한과 파일 크기를 잘 확인하고, 매번 완벽한 결과를 기대하지는 마세요.저는 잘 작동했는데, 여러분에게도 도움이 되길 바랍니다.
관련 기사
이 글이 도움이 되었나요?