스페인어 스크립트 1인 화자 녹음 데이터셋

558시간 분량의 스크립트 음성 데이터로 멕시코와 스페인의 원어민 화자들이 녹음한 데이터입니다. 은행, 보험, 리테일, 통신 등 다양한 도메인을 포함하며, 일반적인 대화와 특정한 주제의 대화를 모두 제공합니다.
활용 사례
- AI의 스페인어 처리 및 생성 향상
- 주요 스페인어 사용 국가의 방언적 변화 학습
- 음성 합성 품질 향상
- 문화적 인식이 있는 AI 애플리케이션 개발
- 스페인어 시장을 효과적으로 타겟팅
활용 분야
- 음성 인식 시스템
- 텍스트-음성 변환 도구
- 대화형 AI 및 음성 비서
- 자연어 처리(NLP) 애플리케이션
- 언어 학습 및 교육 소프트웨어
데이터셋 스펙
- 오디오 포맷: WAV (손실 없는 음질)
- 언어: 스페인어
- 샘플링 레이트: 16kHz (명확하고 세밀한 음성 뉘앙스를 포착하기에 이상적)
- 비트당 샘플: 16비트 (고충실도 음향 데이터 제공)
- 지리적 차이: 멕시코와 스페인에서 수집된 데이터로, 다양한 지역적 차이를 포함
- 녹음 장치: 다양한 장치를 사용하여 실제 사용 시나리오를 반영하여 모델 강화를 지원