12,000권 이상의 영어 학술 교과서가 포함된 이 데이터셋은 다양한 과목을 다룹니다. 비즈니스 및 경영학, 환경 과학, 의학, 비선형 과학, 생명 과학, 수학, 아시아 연구, 경제학 및 금융학, 공학, 화학, 나노기술, 물리학, 사회 과학, 건축학, 컴퓨터 과학 등 다양한 분야에서 제공됩니다. 이 데이터 셋에는 STEM Q&A만을 포함하는 100권의 교과서가 있어 LLM 미세 조정을 위한 완벽한 자료입니다.
웰니스 및 라이프스타일 기사 데이터셋
1,200개 이상의 정성껏 선별된 기사가 포함된 이 데이터셋은 대학생들을 위한 정신 건강, 피트니스, 영양, 관계 등 중요한 분야를 다룹니다. 각 기사는 학생들의 관심사와 선호에 맞춰 작성되었습니다.
헬스케어 기사 데이터셋
19,000개 이상의 건강 관련 기사가 포함된 이 데이터셋은 40개 이상의 건강 카테고리에서 다양한 정보를 제공합니다. 중독에서 정신 건강, 여성 건강에서 피트니스까지, 각 기사는 관련된 의학적 조건으로 태깅되어 있어, 예를 들어 화학 요법 및 면역 요법과 같은 암 주제나 CAD 및 혈압과 같은 심장 및 순환기 건강을 다룬 내용을 탐구할 수 있습니다.
영어권 의사 모바일 앱 사용 데이터셋
117,000명의 영어 사용 의사의 모바일 앱 사용 데이터에 직접 접근할 수 있는 이 데이터셋은 헬스케어 분야 AI 개발을 위한 중요한 분석 자료를 제공합니다. 실시간으로 제공되는 데이터셋으로, 헬스케어 전문가들의 디지털 행동을 이해하고 AI 훈련에 활용하는 데 최적화되어 있습니다. 의료 분석, AI 기반 솔루션 또는 의료 분야의 자연어 처리(NLP) 연구에 집중하는 AI 개발자에게 필수적인 자료입니다.
헬스케어 프롬프트 Q&A 데이터셋
프랑스, 스페인, 포르투갈, 이탈리아에서 수집된 실제 의사 프롬프트와 기계 응답으로 구성된 이 데이터셋은 고급 AI 훈련을 위한 맞춤화된 자료입니다. 이 데이터셋은 영어를 포함하여 160,000개 이상의 프롬프트와 응답 쌍을 제공하며, 모든 데이터는 개인 식별 정보를 제외하고 세심하게 선별되었습니다. 헬스케어 분야의 고도화된 AI 애플리케이션을 개발하는 데 필수적인 학습데이터 셋입니다.
한국어 대화 녹음 데이터셋
은행, 보험, 리테일, 통신 등 다양한 산업에서 수집된 521시간 분량의 자연스러운 한국어 대화 데이터입니다. 한국어 모국어 화자들의 실제 대화를 기반으로 하며, 일상생활 속 다양한 상황을 담고 있습니다.
영어 대화 녹음 데이터셋
은행, 헬스케어, 리테일, 보험, 통신 등 다양한 산업에서 수집된 3,345시간 분량의 자연스러운 영어 대화 데이터입니다. 영국, 미국, 아일랜드, 호주, 인도 등 다양한 영어권 국가의 모국어 화자들의 실제 대화를 기반으로 하며, 일상생활 속 다양한 상황을 담고 있습니다.







