본 데이터셋은 실제 보건 전문가가 작성·편집한 영문 기반 의료 문서 및 임상 기록 텍스트로 구성된 고품질 의료 특화 데이터셋입니다.
국내외 도서 데이터셋
이 데이터셋은 국내 대학출판부, 학술 기관, 전문 협회 및 해외 출판 소스를 기반으로 구축된 고품질 도서 및 텍스트 자료로 구성되어 있습니다. 의료, 법률, 과학기술, 사회과학, 인문학 등 다양한 학문 분야를 포괄하며, 한글·영문·스페인어 등 다국어로 제공됩니다. 기초 학문부터 대학원 수준의 고급 전문서, 교육용 교재, 수험서, 문학작품, 자기개발서까지 포함되어 있으며, AI 언어 모델 학습 및 자연어 처리(NLP), 지능형 교육 시스템 구축 등에 활용 가능한 포괄적 텍스트 자원입니다.
의료 학술 데이터셋
약 40억 단어, 55만건의 의료 분야 연구 논문 및 저널, 679권의 학술 서적(참고 문헌 173건 포함) 데이터셋은 영어로 제공되며, 의학 연구 논문, 임상 사례 연구, 최신 저널, 시험 스타일의 Q&A, 전문 의료 서적을 포함합니다. 이 데이터셋은 의료 특화 LLM, 임상 의사결정 지원, 의료 교육용 AI, 논문 자동 요약 등 첨단 AI 기술 개발에 최적화된 고품질 학술 자료입니다.
심초음파 데이터셋
67,000개의 고품질 심초음파 이미지가 포함된 이 데이터셋은 원본 DICOM 형식으로 제공되며, 컴퓨터 비전 기반의 의료 AI 애플리케이션에 적합합니다.
유방촬영술 데이터셋
1,000개의 고품질 유방촬영술 이미지가 포함된 이 데이터셋은 DICOM 형식으로 제공되며, 컴퓨터 비전 기반의 의료 AI 애플리케이션에 적합합니다.
핵의학 스캔 데이터셋
6,000개 이상의 핵의학 스캔 시험 이미지가 포함된 이 데이터셋은 원본 DICOM 형식으로 제공되며, 컴퓨터 비전 기반의 의료 AI 개발에 적합합니다.
CT 스캔 데이터셋
20,000개 이상의 고품질 CT 스캔 이미지가 포함된 이 데이터셋은 원본 DICOM 형식으로 제공되며, 컴퓨터 비전 기반의 의료 AI 애플리케이션에 적합합니다.
의사-환자 대화문 데이터셋
80개 이상의 전문 분야와 50,000개 이상의 대화가 포함된 이 데이터셋은 실제 사용자들로부터의 질문과 이를 검증된 의사, 치료사, 건강 전문가들이 답변한 내용을 제공합니다. 우울증, 불안 등 다양한 주제로 태깅되어 있으며, AI 기반 헬스케어 솔루션에 최적화된 자료입니다.
초음파 데이터셋
40,000개의 고품질 초음파 이미지가 포함된 이 데이터셋은 DICOM 형식으로 제공되며, 컴퓨터 비전 기반의 의료 애플리케이션에 적합합니다.
의사-환자 영어 대화 녹음 데이터셋
2,000시간 분량의 인간이 기록하고 태깅한 실시간 의료 대화입니다. 영어로 제공되며, 각 대화는 의료 분야에 맞게 분류 태그가 포함되어 있습니다.