2,000시간 분량의 인간이 기록하고 태깅한 실시간 의료 대화입니다. 영어로 제공되며, 각 대화는 의료 분야에 맞게 분류 태그가 포함되어 있습니다.
영어권 의사 모바일 앱 사용 데이터셋
117,000명의 영어 사용 의사의 모바일 앱 사용 데이터에 직접 접근할 수 있는 이 데이터셋은 헬스케어 분야 AI 개발을 위한 중요한 분석 자료를 제공합니다. 실시간으로 제공되는 데이터셋으로, 헬스케어 전문가들의 디지털 행동을 이해하고 AI 훈련에 활용하는 데 최적화되어 있습니다. 의료 분석, AI 기반 솔루션 또는 의료 분야의 자연어 처리(NLP) 연구에 집중하는 AI 개발자에게 필수적인 자료입니다.
헬스케어 기사 데이터셋
19,000개 이상의 건강 관련 기사가 포함된 이 데이터셋은 40개 이상의 건강 카테고리에서 다양한 정보를 제공합니다. 중독에서 정신 건강, 여성 건강에서 피트니스까지, 각 기사는 관련된 의학적 조건으로 태깅되어 있어, 예를 들어 화학 요법 및 면역 요법과 같은 암 주제나 CAD 및 혈압과 같은 심장 및 순환기 건강을 다룬 내용을 탐구할 수 있습니다.
웰니스 및 라이프스타일 기사 데이터셋
1,200개 이상의 정성껏 선별된 기사가 포함된 이 데이터셋은 대학생들을 위한 정신 건강, 피트니스, 영양, 관계 등 중요한 분야를 다룹니다. 각 기사는 학생들의 관심사와 선호에 맞춰 작성되었습니다.
학술 교과서 및 STEM Q&A 데이터셋
12,000권 이상의 영어 학술 교과서가 포함된 이 데이터셋은 다양한 과목을 다룹니다. 비즈니스 및 경영학, 환경 과학, 의학, 비선형 과학, 생명 과학, 수학, 아시아 연구, 경제학 및 금융학, 공학, 화학, 나노기술, 물리학, 사회 과학, 건축학, 컴퓨터 과학 등 다양한 분야에서 제공됩니다. 이 데이터 셋에는 STEM Q&A만을 포함하는 100권의 교과서가 있어 LLM 미세 조정을 위한 완벽한 자료입니다.
영어 팟캐스트 데이터셋 – 일반 주제
2,000시간 분량의 라이브 영어 팟캐스트 데이터로, 일반적인 학습 주제를 다룬 음성 데이터입니다.
영어 팟캐스트 데이터셋 – 스포츠 대화
메이저 리그 축구에 관한 54.2시간 분량의 라이브 영어 팟캐스트 데이터입니다.
영어 대화 녹음 데이터셋
은행, 헬스케어, 리테일, 보험, 통신 등 다양한 산업에서 수집된 3,345시간 분량의 자연스러운 영어 대화 데이터입니다. 영국, 미국, 아일랜드, 호주, 인도 등 다양한 영어권 국가의 모국어 화자들의 실제 대화를 기반으로 하며, 일상생활 속 다양한 상황을 담고 있습니다.