100시간 분량의 일본인 성우 스튜디오 녹음 데이터셋은 표준어와 일부 방언이 포함된 다양한 스크립트로 구성되어 있으며, 고품질 스튜디오 환경에서 44kHz로 녹음된 일본어 음성 데이터입니다.
일본어 대화 녹음 데이터셋
은행, 보험, 리테일, 통신 등 다양한 산업에서 수집된 422시간 분량의 자연스러운 일본어 대화 데이터입니다. 일본 모국어 화자들의 실제 대화를 기반으로 하며, 일상생활 속 다양한 상황을 담고 있습니다.
일본어 스크립트 1인 화자 녹음 데이터셋
일반 도메인 내 다양한 주제를 다룬 102시간 분량의 프리미엄 일본어 음성 데이터입니다. 일본어 대화의 다양한 측면을 반영하며, 다양한 장치에서 일본어 모국어 화자들이 스크립트에 맞춰 녹음한 대화입니다.
일본어 IVR 데이터셋
은행, 리테일, 통신, 보험 등 다양한 분야에서 수집된 326시간 분량의 일본어 음성 데이터입니다. 일본 모국어 화자들이 IVR 시스템과 상호작용하며, 실제 상황을 반영한 대화들을 포함하고 있습니다.
Aspect-Based Sentiment Analysis (ABSA) 데이터셋
Aspect-Based Sentiment Analysis (ABSA) 데이터셋은 제품 및 서비스 리뷰에 대한 단어 또는 구 단위의 세부 주석을 제공하여 감정 분석을 향상시키는 데 중점을 둔 포괄적인 데이터셋입니다. 이 데이터셋은 표준 문장 수준 감정 주석을 넘어, 텍스트 내에서 특정 주제나 요소, 의견 및 그 관계에 대한 통찰을 제공합니다. 일본어, 중국어, 스페인어, 독일어, 영어(미국) 등 다섯 가지 언어로 총 60,000개의 셋을 포함하고 있습니다.
일본어 팟캐스트 데이터셋 – 일반 주제
300시간 분량의 라이브 일본어 팟캐스트 데이터로, 일반적인 주제를 다룬 음성 데이터입니다.
일본어 감정 분석 텔레쇼핑 오디오 데이터셋
텔레쇼핑 방송의 감정 분석을 위한 42시간 분량의 일본어 오디오 데이터입니다.