자막 추출
파일
파일을 여기에 놓거나
허용 형식: MP3, AAC, WAV, OGG, FLAC, M4A, ALAC, AIFF, AMR, WMA, WEBM, OPUS
모든 처리는 브라우저에서 이루어지며, 파일이 서버로 업로드되지 않습니다.
이 도구는 OpenAI의 Whisper Tiny 모델을 기반으로 ONNX Runtime Web을 통해 브라우저 로컬에서 전적으로 연산됩니다.
도구 상세 안내
자막 추출 도구는 오디오 파일의 음성을 인식하여 텍스트 자막(SRT, WebVTT, TXT)으로 자동 추출하고, 싱크 조정 및 인라인 편집을 거쳐 파일로 내보낼 수 있게 해 줍니다. 최신 AI 모델(Whisper)을 브라우저 로컬 웹 워커(Web Worker)에서 직접 구동하여, 음원 파일을 외부 서버로 절대 전송하지 않고 100% 온디바이스에서 자막을 안전하고 빠르게 추출합니다.
100% 로컬 보안 연산 작동 중
이 도구는 WebAssembly 및 로컬 브라우저 캔버스를 통해 기기 내부에서 작동합니다. 업로드되는 파일은 어떠한 외부 서버로도 전송되지 않아 절대적으로 안전합니다.
사용 방법
자막을 추출할 오디오 파일(MP3, WAV, FLAC, WebM 등)을 로드합니다.
로컬 웹 워커가 AI 음성 인식(STT) 모델을 활성화하여 자동으로 자막을 생성할 때까지 대기합니다. 진행률(%)이 실시간 노출됩니다.
생성된 인터랙티브 자막 리스트에서 싱크를 조절하거나 텍스트를 인라인 편집한 뒤 SRT, WebVTT, 또는 TXT 포맷 단추를 눌러 다운로드합니다.
핵심 활용 시나리오
대외비 회의 녹취록 및 인터뷰 자막 제작
외부 클라우드로 전송하기 극히 곤란한 민감한 비즈니스 회의록, 개인 인터뷰, 학술 녹취 데이터를 서버 전송 리스크 없이 완벽한 로컬 환경에서 텍스트로 보존합니다.
동영상 콘텐츠 자막 파일 생성
유튜브나 강의 동영상에 올릴 SRT/WebVTT 표준 자막 파일을 음원에서 직접 추출하고, 오프셋 시프터를 이용해 전체 재생 시간을 한 번에 미세 동기화합니다.
외국어 대화 듣기 연습 및 섀도잉 학습
외국어 음성 파일을 올린 뒤 특정 자막 카드를 클릭해 원하는 위치로 즉시 찾아가고, 구간 반복 기능을 결합하여 완벽한 발음 청취 및 섀도잉 훈련을 진행합니다.
자주 묻는 질문
아닙니다. 음성 인식 AI 모델 로드가 완료된 이후부터는 오프라인 상태에서도 100% 로컬 컴퓨터 연산 능력만으로 완벽 가동됩니다.
자막 영역 상단에 있는 Sync Shift 단추(-0.5s, +0.1s 등)를 이용해 전체 자막 타임스탬프를 일괄 시프트 이동하거나, 각 자막 라인의 시작/종료 캡처 버튼을 눌러 개별 싱크를 맞출 수 있습니다.