• About Us
  • Datasets
  • Text
  • Audio
  • Speech
  • Image
  • Video
데이터 구매문의
데이터 판매문의

데이터 판매 문의

데이터 판매 문의

콘텐츠 편집
[contact-form-7 id="10448"]

Datasets

크라우드웍스의 다양한 데이터셋을 확인해보세요.

  • Home
  • Datasets
  • Page 9
Text

멀티모달 수학 경시대회 문제 데이터셋

이 데이터셋은 수학 학습을 위한 고품질 문제들로 구성되어 있으며, 다양한 형식의 데이터를 제공하여 효과적인 학습과 AI 기반 분석을 지원합니다. 기본적인 연산부터 고급 문제 해결까지 다양한 수준의 수학 문제를 포함하며, 텍스트, 수식, 그래프, 이미지 등 멀티모달 요소를 활용하여 더욱 직관적이고 풍부한 학습 경험을 제공합니다.

또한  중·고등학교 수학 경시대회(올림피아드 등) 기출 및 변형 문제를 포함한 고급 수학 문제도 포함되어 있어, 수학적 사고력과 문제 해결 능력을 강화할 수 있습니다. 이 데이터셋은 AI 기반 튜터링 시스템, 대형 언어 모델(LLM) 및 비전 언어 모델(VLM) 훈련을 위한 최적의 학습 리소스로 활용될 수 있으며, 다양한 교육 AI 응용 분야에 적용 가능합니다.

Text

채팅 모더레이션 데이터셋

27M 메시지가 포함된 이 데이터셋은 콘텐츠 창작자와 팬들 간의 소통하는 내용을 다룹니다. 구독 기반 콘텐츠 창작 공간에서의 대화 데이터를 통해 콘텐츠 모더레이션의 역학을 탐구할 수 있습니다. 이 데이터셋은 개인 식별 정보(PII)가 제외된 실시간 영어 데이터를 제공하며, 다양한 대화 주제를 포함하고 있습니다.

Text

학술 교과서 및 STEM Q&A 데이터셋

12,000권 이상의 영어 학술 교과서가 포함된 이 데이터셋은 다양한 과목을 다룹니다. 비즈니스 및 경영학, 환경 과학, 의학, 비선형 과학, 생명 과학, 수학, 아시아 연구, 경제학 및 금융학, 공학, 화학, 나노기술, 물리학, 사회 과학, 건축학, 컴퓨터 과학 등 다양한 분야에서 제공됩니다. 이 데이터 셋에는 STEM Q&A만을 포함하는 100권의 교과서가 있어 LLM 미세 조정을 위한 완벽한 자료입니다.

Text

웰니스 및 라이프스타일 기사 데이터셋

1,200개 이상의 정성껏 선별된 기사가 포함된 이 데이터셋은 대학생들을 위한 정신 건강, 피트니스, 영양, 관계 등 중요한 분야를 다룹니다. 각 기사는 학생들의 관심사와 선호에 맞춰 작성되었습니다.

Text

헬스케어 기사 데이터셋

19,000개 이상의 건강 관련 기사가 포함된 이 데이터셋은 40개 이상의 건강 카테고리에서 다양한 정보를 제공합니다. 중독에서 정신 건강, 여성 건강에서 피트니스까지, 각 기사는 관련된 의학적 조건으로 태깅되어 있어, 예를 들어 화학 요법 및 면역 요법과 같은 암 주제나 CAD 및 혈압과 같은 심장 및 순환기 건강을 다룬 내용을 탐구할 수 있습니다.

Text

영어권 의사 모바일 앱 사용 데이터셋

117,000명의 영어 사용 의사의 모바일 앱 사용 데이터에 직접 접근할 수 있는 이 데이터셋은 헬스케어 분야 AI 개발을 위한 중요한 분석 자료를 제공합니다. 실시간으로 제공되는 데이터셋으로, 헬스케어 전문가들의 디지털 행동을 이해하고 AI 훈련에 활용하는 데 최적화되어 있습니다. 의료 분석, AI 기반 솔루션 또는 의료 분야의 자연어 처리(NLP) 연구에 집중하는 AI 개발자에게 필수적인 자료입니다.

Image

공격적 이미지 데이터셋

50,000개의 이미지를 포함한 이 데이터셋은 폭력적인 장면, 갈등, 공격적인 행동 등을 포함하는 도전적인 콘텐츠를 다룹니다. 안전 및 보안 문맥에 중점을 두고 있으며, 콘텐츠 모더레이션 AI 향상을 위한 중요한 리소스입니다. 이미지 인식 및 AI 기반 보안 발전을 위한 개발자와 연구자에게 필수적인 데이터셋입니다.

Image

상처 및 피부 이미지 데이터셋

100,800개의 의료 이미지 데이터셋으로, 상처, 피부 질환 등을 탐지하는 데 최적화된 이미지 데이터셋입니다. 이 데이터셋은 AI 모델 학습에 적합하며, 다양한 의료 조건을 정확하게 식별하고 진단하는 데 도움을 줍니다.

Image

MRI 데이터셋

42,000개 이상의 고품질 MRI 스캔이 포함된 이 데이터셋은 원본 DICOM 형식으로 제공되며, 의료 애플리케이션에 최적의 학습 데이터 셋입니다.

Speech

의사-환자 영어 대화 녹음 데이터셋

2,000시간 분량의 인간이 기록하고 태깅한 실시간 의료 대화입니다. 영어로 제공되며, 각 대화는 의료 분야에 맞게 분류 태그가 포함되어 있습니다.

글 페이지 매김

이전 1 … 8 9 10 다음

Search

Categories

  • Audio (3)
  • Image (14)
  • Speech (42)
  • Text (33)
  • Video (11)

Recent Datasets

  • 전국 가맹점 추정매출 데이터셋
  • 국내 신용·체크카드 소비 데이터셋
  • 국내 의료 문서·영상 대규모 데이터셋

Tags

1인화자 (9) ivr (6) OCR (2) Q&A (4) stem (3) 감정분석 (7) 강의 (3) 객체인식 (14) 과학 (6) 교육 (6) 국어 (2) 금융 (2) 기사 (4) 논문 (3) 뉴스 (4) 다국어 (3) 대화 (10) 독일어 (5) 멀티모달 (3) 문항 (3) 민감콘텐츠 (3) 브라질 (3) 상권 (5) 소비 (5) 수학 (4) 스크립트 (5) 스페인어 (6) 심초음파 (2) 영어 (22) 오디오분석 (3) 음성인식 (27) 음성제어 (18) 의료 (15) 이탈리아 (2) 인문학 (3) 일본어 (8) 저널 (3) 중국어 (6) 카드 (4) 팟캐스트 (14) 포르투갈어 (3) 프랑스 (3) 학술 (4) 한국어 (2) 헬스케어 (3)

(주)크라우드웍스 | 대표이사 : 김우승
사업자등록번호 : 223-81-18325
서울특별시 강남구 테헤란로 309 삼성제일빌딩 5F
사업제휴문의 : contact@crowdworks.ai
고객센터 : support@crowdworks.ai | 02-6954-2960
통신판매업 번호 : 제 2019-서울강남-05382호

Home
  • Crowdworks
  • About Us
  • Datasets
  • Contact
  • 데이터판매 문의
Resources
  • Blog
  • Documentation
  • 뉴스레터
Social
  • Behance
  • Dribbble
  • Facebook
  • Instagram

© Crowdworks. All Rights Reserved.

  • 이용약관
  • 개인정보 처리방침