스페인어 스크립트 1인 화자 녹음 데이터셋

558시간 분량의 스크립트 음성 데이터로  멕시코와 스페인의 원어민 화자들이 녹음한 데이터입니다. 은행, 보험, 리테일, 통신 등 다양한 도메인을 포함하며, 일반적인 대화와 특정한 주제의 대화를 모두 제공합니다.

활용 사례

  • AI의 스페인어 처리 및 생성 향상
  • 주요 스페인어 사용 국가의 방언적 변화 학습
  • 음성 합성 품질 향상
  • 문화적 인식이 있는 AI 애플리케이션 개발
  • 스페인어 시장을 효과적으로 타겟팅

활용 분야

  • 음성 인식 시스템
  • 텍스트-음성 변환 도구
  • 대화형 AI 및 음성 비서
  • 자연어 처리(NLP) 애플리케이션
  • 언어 학습 및 교육 소프트웨어

데이터셋 스펙

  • 오디오 포맷: WAV (손실 없는 음질)
  • 언어: 스페인어
  • 샘플링 레이트: 16kHz (명확하고 세밀한 음성 뉘앙스를 포착하기에 이상적)
  • 비트당 샘플: 16비트 (고충실도 음향 데이터 제공)
  • 지리적 차이: 멕시코와 스페인에서 수집된 데이터로, 다양한 지역적 차이를 포함  
  • 녹음 장치: 다양한 장치를 사용하여 실제 사용 시나리오를 반영하여 모델 강화를 지원 

샘플데이터 요청

샘플데이터 요청
개인정보 수집 및 이용 동의(필수)
개인정보 수집 및 이용 동의(선택)
광고성 정보 수신 동의(선택)