42,000개 이상의 고품질 MRI 스캔이 포함된 이 데이터셋은 원본 DICOM 형식으로 제공되며, 의료 애플리케이션에 최적의 학습 데이터 셋입니다.
영어 팟캐스트 데이터셋 – 일반 주제
2,000시간 분량의 라이브 영어 팟캐스트 데이터로, 일반적인 학습 주제를 다룬 음성 데이터입니다.
웰니스 및 라이프스타일 기사 데이터셋
1,200개 이상의 정성껏 선별된 기사가 포함된 이 데이터셋은 대학생들을 위한 정신 건강, 피트니스, 영양, 관계 등 중요한 분야를 다룹니다. 각 기사는 학생들의 관심사와 선호에 맞춰 작성되었습니다.
채팅 모더레이션 데이터셋
27M 메시지가 포함된 이 데이터셋은 콘텐츠 창작자와 팬들 간의 소통하는 내용을 다룹니다. 구독 기반 콘텐츠 창작 공간에서의 대화 데이터를 통해 콘텐츠 모더레이션의 역학을 탐구할 수 있습니다. 이 데이터셋은 개인 식별 정보(PII)가 제외된 실시간 영어 데이터를 제공하며, 다양한 대화 주제를 포함하고 있습니다.
일본어 팟캐스트 데이터셋 – 일반 주제
300시간 분량의 라이브 일본어 팟캐스트 데이터로, 일반적인 주제를 다룬 음성 데이터입니다.
영어 팟캐스트 데이터셋 – 동기 부여
스포츠 및 피트니스 활동에 관한 97.3시간 분량의 라이브 영어 팟캐스트 데이터입니다.
일본어 감정 분석 텔레쇼핑 오디오 데이터셋
텔레쇼핑 방송의 감정 분석을 위한 42시간 분량의 일본어 오디오 데이터입니다.
공격적 이미지 데이터셋
50,000개의 이미지를 포함한 이 데이터셋은 폭력적인 장면, 갈등, 공격적인 행동 등을 포함하는 도전적인 콘텐츠를 다룹니다. 안전 및 보안 문맥에 중점을 두고 있으며, 콘텐츠 모더레이션 AI 향상을 위한 중요한 리소스입니다. 이미지 인식 및 AI 기반 보안 발전을 위한 개발자와 연구자에게 필수적인 데이터셋입니다.
의사-환자 영어 대화 녹음 데이터셋
2,000시간 분량의 인간이 기록하고 태깅한 실시간 의료 대화입니다. 영어로 제공되며, 각 대화는 의료 분야에 맞게 분류 태그가 포함되어 있습니다.
상처 및 피부 이미지 데이터셋
100,800개의 의료 이미지 데이터셋으로, 상처, 피부 질환 등을 탐지하는 데 최적화된 이미지 데이터셋입니다. 이 데이터셋은 AI 모델 학습에 적합하며, 다양한 의료 조건을 정확하게 식별하고 진단하는 데 도움을 줍니다.










