42,000개 이상의 고품질 MRI 스캔이 포함된 이 데이터셋은 원본 DICOM 형식으로 제공되며, 의료 애플리케이션에 최적의 학습 데이터 셋입니다.
공격적 이미지 데이터셋
50,000개의 이미지를 포함한 이 데이터셋은 폭력적인 장면, 갈등, 공격적인 행동 등을 포함하는 도전적인 콘텐츠를 다룹니다. 안전 및 보안 문맥에 중점을 두고 있으며, 콘텐츠 모더레이션 AI 향상을 위한 중요한 리소스입니다. 이미지 인식 및 AI 기반 보안 발전을 위한 개발자와 연구자에게 필수적인 데이터셋입니다.
헬스케어 기사 데이터셋
19,000개 이상의 건강 관련 기사가 포함된 이 데이터셋은 40개 이상의 건강 카테고리에서 다양한 정보를 제공합니다. 중독에서 정신 건강, 여성 건강에서 피트니스까지, 각 기사는 관련된 의학적 조건으로 태깅되어 있어, 예를 들어 화학 요법 및 면역 요법과 같은 암 주제나 CAD 및 혈압과 같은 심장 및 순환기 건강을 다룬 내용을 탐구할 수 있습니다.
웰니스 및 라이프스타일 기사 데이터셋
1,200개 이상의 정성껏 선별된 기사가 포함된 이 데이터셋은 대학생들을 위한 정신 건강, 피트니스, 영양, 관계 등 중요한 분야를 다룹니다. 각 기사는 학생들의 관심사와 선호에 맞춰 작성되었습니다.
영어 팟캐스트 데이터셋 – 일반 주제
2,000시간 분량의 라이브 영어 팟캐스트 데이터로, 일반적인 학습 주제를 다룬 음성 데이터입니다.
한국어 대화 녹음 데이터셋
은행, 보험, 리테일, 통신 등 다양한 산업에서 수집된 521시간 분량의 자연스러운 한국어 대화 데이터입니다. 한국어 모국어 화자들의 실제 대화를 기반으로 하며, 일상생활 속 다양한 상황을 담고 있습니다.
영어 대화 녹음 데이터셋
은행, 헬스케어, 리테일, 보험, 통신 등 다양한 산업에서 수집된 3,345시간 분량의 자연스러운 영어 대화 데이터입니다. 영국, 미국, 아일랜드, 호주, 인도 등 다양한 영어권 국가의 모국어 화자들의 실제 대화를 기반으로 하며, 일상생활 속 다양한 상황을 담고 있습니다.
헬스케어 프롬프트 Q&A 데이터셋
프랑스, 스페인, 포르투갈, 이탈리아에서 수집된 실제 의사 프롬프트와 기계 응답으로 구성된 이 데이터셋은 고급 AI 훈련을 위한 맞춤화된 자료입니다. 이 데이터셋은 영어를 포함하여 160,000개 이상의 프롬프트와 응답 쌍을 제공하며, 모든 데이터는 개인 식별 정보를 제외하고 세심하게 선별되었습니다. 헬스케어 분야의 고도화된 AI 애플리케이션을 개발하는 데 필수적인 학습데이터 셋입니다.








