300시간 분량의 라이브 일본어 팟캐스트 데이터로, 일반적인 주제를 다룬 음성 데이터입니다.
영어 팟캐스트 데이터셋 – 스포츠 대화
메이저 리그 축구에 관한 54.2시간 분량의 라이브 영어 팟캐스트 데이터입니다.
영어 팟캐스트 데이터셋 – 일반 주제
2,000시간 분량의 라이브 영어 팟캐스트 데이터로, 일반적인 학습 주제를 다룬 음성 데이터입니다.
헬스케어 프롬프트 Q&A 데이터셋
프랑스, 스페인, 포르투갈, 이탈리아에서 수집된 실제 의사 프롬프트와 기계 응답으로 구성된 이 데이터셋은 고급 AI 훈련을 위한 맞춤화된 자료입니다. 이 데이터셋은 영어를 포함하여 160,000개 이상의 프롬프트와 응답 쌍을 제공하며, 모든 데이터는 개인 식별 정보를 제외하고 세심하게 선별되었습니다. 헬스케어 분야의 고도화된 AI 애플리케이션을 개발하는 데 필수적인 학습데이터 셋입니다.
영어 대화 녹음 데이터셋
은행, 헬스케어, 리테일, 보험, 통신 등 다양한 산업에서 수집된 3,345시간 분량의 자연스러운 영어 대화 데이터입니다. 영국, 미국, 아일랜드, 호주, 인도 등 다양한 영어권 국가의 모국어 화자들의 실제 대화를 기반으로 하며, 일상생활 속 다양한 상황을 담고 있습니다.
한국어 대화 녹음 데이터셋
은행, 보험, 리테일, 통신 등 다양한 산업에서 수집된 521시간 분량의 자연스러운 한국어 대화 데이터입니다. 한국어 모국어 화자들의 실제 대화를 기반으로 하며, 일상생활 속 다양한 상황을 담고 있습니다.