10,800시간 분량의 고품질 독일어 팟캐스트 데이터로, 다양한 지역 억양과 구어체 표현을 포함하여 AI의 언어 이해 및 생성 능력을 향상시키는 데 최적화된 데이터셋입니다. 독일어권 지역의 라이브 팟캐스트를 기반으로 하며, 대화형 AI, 음성 인식, 감정 분석 등 다양한 AI 애플리케이션 개발에 활용할 수 있습니다.
독일어 IVR 데이터셋
독일어 IVR 데이터셋은 독일에서 수집된 501시간 분량의 고품질 음성 데이터로, 통신, 은행, 리테일 등 주요 산업 분야의 실제 고객과 IVR 시스템 간 상호작용을 기반으로 합니다. 자발적인 독일어 대화를 통해 AI 모델의 대화 처리 능력을 최적화하고, 자연스러운 사용자 경험을 제공하는 데 적합합니다.
독일어 스크립트 1인 화자 녹음 데이터셋
841시간 분량의 고품질 독일어 스크립트 대화 데이터셋으로, 원어민 독일어 화자들이 녹음한 음성 데이터입니다. 은행업, 고객 서비스, 통신, 보험, 리테일 등 다양한 산업 분야를 포괄하며, 음성 인식, 대화형 AI, 자연어 처리 모델 개발을 목표로 하는 연구자와 개발자에게 최적화된 리소스입니다.
Aspect-Based Sentiment Analysis (ABSA) 데이터셋
Aspect-Based Sentiment Analysis (ABSA) 데이터셋은 제품 및 서비스 리뷰에 대한 단어 또는 구 단위의 세부 주석을 제공하여 감정 분석을 향상시키는 데 중점을 둔 포괄적인 데이터셋입니다. 이 데이터셋은 표준 문장 수준 감정 주석을 넘어, 텍스트 내에서 특정 주제나 요소, 의견 및 그 관계에 대한 통찰을 제공합니다. 일본어, 중국어, 스페인어, 독일어, 영어(미국) 등 다섯 가지 언어로 총 60,000개의 셋을 포함하고 있습니다.