80개 이상의 전문 분야와 50,000개 이상의 대화가 포함된 이 데이터셋은 실제 사용자들로부터의 질문과 이를 검증된 의사, 치료사, 건강 전문가들이 답변한 내용을 제공합니다. 우울증, 불안 등 다양한 주제로 태깅되어 있으며, AI 기반 헬스케어 솔루션에 최적화된 자료입니다.
영어권 의사 모바일 앱 사용 데이터셋
117,000명의 영어 사용 의사의 모바일 앱 사용 데이터에 직접 접근할 수 있는 이 데이터셋은 헬스케어 분야 AI 개발을 위한 중요한 분석 자료를 제공합니다. 실시간으로 제공되는 데이터셋으로, 헬스케어 전문가들의 디지털 행동을 이해하고 AI 훈련에 활용하는 데 최적화되어 있습니다. 의료 분석, AI 기반 솔루션 또는 의료 분야의 자연어 처리(NLP) 연구에 집중하는 AI 개발자에게 필수적인 자료입니다.
헬스케어 기사 데이터셋
19,000개 이상의 건강 관련 기사가 포함된 이 데이터셋은 40개 이상의 건강 카테고리에서 다양한 정보를 제공합니다. 중독에서 정신 건강, 여성 건강에서 피트니스까지, 각 기사는 관련된 의학적 조건으로 태깅되어 있어, 예를 들어 화학 요법 및 면역 요법과 같은 암 주제나 CAD 및 혈압과 같은 심장 및 순환기 건강을 다룬 내용을 탐구할 수 있습니다.
웰니스 및 라이프스타일 기사 데이터셋
1,200개 이상의 정성껏 선별된 기사가 포함된 이 데이터셋은 대학생들을 위한 정신 건강, 피트니스, 영양, 관계 등 중요한 분야를 다룹니다. 각 기사는 학생들의 관심사와 선호에 맞춰 작성되었습니다.
학술 교과서 및 STEM Q&A 데이터셋
12,000권 이상의 영어 학술 교과서가 포함된 이 데이터셋은 다양한 과목을 다룹니다. 비즈니스 및 경영학, 환경 과학, 의학, 비선형 과학, 생명 과학, 수학, 아시아 연구, 경제학 및 금융학, 공학, 화학, 나노기술, 물리학, 사회 과학, 건축학, 컴퓨터 과학 등 다양한 분야에서 제공됩니다. 이 데이터 셋에는 STEM Q&A만을 포함하는 100권의 교과서가 있어 LLM 미세 조정을 위한 완벽한 자료입니다.
채팅 모더레이션 데이터셋
27M 메시지가 포함된 이 데이터셋은 콘텐츠 창작자와 팬들 간의 소통하는 내용을 다룹니다. 구독 기반 콘텐츠 창작 공간에서의 대화 데이터를 통해 콘텐츠 모더레이션의 역학을 탐구할 수 있습니다. 이 데이터셋은 개인 식별 정보(PII)가 제외된 실시간 영어 데이터를 제공하며, 다양한 대화 주제를 포함하고 있습니다.
멀티모달 수학 문항 데이터셋
수학 학습을 지원하는 고품질 문제들로 구성되어 있으며, 다양한 형식의 데이터를 제공하여 효과적인 학습과 AI 기반 분석을 지원하는 데이터셋입니다.
헬스케어 프롬프트 Q&A 데이터셋
프랑스, 스페인, 포르투갈, 이탈리아에서 수집된 실제 의사 프롬프트와 기계 응답으로 구성된 이 데이터셋은 고급 AI 훈련을 위한 맞춤화된 자료입니다. 이 데이터셋은 영어를 포함하여 160,000개 이상의 프롬프트와 응답 쌍을 제공하며, 모든 데이터는 개인 식별 정보를 제외하고 세심하게 선별되었습니다. 헬스케어 분야의 고도화된 AI 애플리케이션을 개발하는 데 필수적인 학습데이터 셋입니다.