• About Us
  • Datasets
  • Text
  • Audio
  • Speech
  • Image
  • Video
데이터 구매문의
데이터 판매문의

데이터 판매 문의

데이터 판매 문의

콘텐츠 편집
[contact-form-7 id="10448"]

교육

  • Home
  • Datasets
  • 교육
Video

STEM 분야 인터넷 강의 데이터셋

이 데이터셋은 자격증, 공무원 시험 대비, 대학 전공 과목, 프로그래밍 등 STEM(과학, 기술, 공학, 수학) 분야를 포괄하는 1,769종의 온라인 강의 데이터를 포함하고 있습니다. 각 강의는 평균 34편의 동영상으로 구성되어 있으며, 총 60,519편의 강의 영상으로 구성된 대규모 교육 콘텐츠입니다. 다양한 학습 목적(입시, 자격 취득, 실무 역량 강화 등)에 따라 세분화된 커리큘럼으로 구성되어 있어, 교육 AI 모델 개발, 콘텐츠 분석, 학습 추천 시스템 등 다양한 응용 분야에서 활용이 가능합니다.

Image

코딩 강의 자료 및 코드 데이터셋

이 데이터셋은 다양한 프로그래밍 언어와 주제를 기반으로 구성된 총 147종 코딩 강의에 대한 823개 문서로, 학습 수준(초급~고급), 분야(웹, 알고리즘, 데이터 처리 등), 학습 내용별로 세분화된 수업 자료와 실습용 소스코드를 포함하고 있습니다. 텍스트 기반 강의 자료와 함께 실습에 활용된 코드 파일 및 관련 이미지까지 포함된 멀티모달 구성으로, 수준별·단계별 프로그래밍 학습 및 교육 AI 모델 개발에 최적화된 고품질 교육 데이터입니다.

Text

과학 학술 데이터셋

약 43억 단어, 52만여 건의 과학 분야 연구 논문 및 저널, 60권의 학술 서적 데이터셋은 영어로 제공되며, 대학원 수준의 교과서, 고급 학술 연구 논문, 저널, 교수진이 직접 작성한 복잡한 Q&A 콘텐츠를 포함합니다. 이 데이터셋은 물리학, 화학, 생물학 등 과학 분야 특화 LLM, 자동 문제 생성, 지능형 튜터링 시스템, 과학적 추론 AI 등 첨단 AI 기술 개발에 최적화된 고품질 학술 자료입니다.

Text

수학 학술 데이터셋

8,752건의 수학 논문과 저널, 344권의 학술 서적(참고 문헌 1,638건 포함)으로 구성된 1억 6천만 단어 규모의 영어 데이터셋입니다. 대학원 및 수학 올림피아드 수준의 문제 세트, 고급 교과서, 교수진 Q&A 등 다양한 고급 수학 자료를 포함하여, 수학 특화 LLM 훈련, 자동 문제 생성, 지능형 튜터링 시스템 등 고차원 AI 기술 개발에 최적화된 고품질 학술 데이터셋입니다.

Text

의료 학술 데이터셋

약 40억 단어, 55만건의 의료 분야 연구 논문 및 저널, 679권의 학술 서적(참고 문헌 173건 포함) 데이터셋은 영어로 제공되며, 의학 연구 논문, 임상 사례 연구, 최신 저널, 시험 스타일의 Q&A, 전문 의료 서적을 포함합니다. 이 데이터셋은 의료 특화 LLM, 임상 의사결정 지원, 의료 교육용 AI, 논문 자동 요약 등 첨단 AI 기술 개발에 최적화된 고품질 학술 자료입니다.

Text

멀티모달 수학 경시대회 문제 데이터셋

이 데이터셋은 수학 학습을 위한 고품질 문제들로 구성되어 있으며, 다양한 형식의 데이터를 제공하여 효과적인 학습과 AI 기반 분석을 지원합니다. 기본적인 연산부터 고급 문제 해결까지 다양한 수준의 수학 문제를 포함하며, 텍스트, 수식, 그래프, 이미지 등 멀티모달 요소를 활용하여 더욱 직관적이고 풍부한 학습 경험을 제공합니다.

또한  중·고등학교 수학 경시대회(올림피아드 등) 기출 및 변형 문제를 포함한 고급 수학 문제도 포함되어 있어, 수학적 사고력과 문제 해결 능력을 강화할 수 있습니다. 이 데이터셋은 AI 기반 튜터링 시스템, 대형 언어 모델(LLM) 및 비전 언어 모델(VLM) 훈련을 위한 최적의 학습 리소스로 활용될 수 있으며, 다양한 교육 AI 응용 분야에 적용 가능합니다.

Search

Categories

  • Audio (3)
  • Image (14)
  • Speech (42)
  • Text (29)
  • Video (9)

Recent Datasets

  • 신문 지면 OCR 및 광고 영역 라벨링 데이터셋
  • 다국어 법률 문서 템플릿 데이터셋
  • 의료 문서 및 임상 노트 데이터셋

Tags

1인화자 (9) ivr (6) Q&A (4) 감정분석 (7) 강의 (3) 객체인식 (14) 건강 (2) 과학 (6) 교육 (6) 구매 (2) 기사 (4) 논문 (3) 뉴스 (4) 다국어 (3) 대화 (10) 독일어 (5) 러시아 (2) 만다린 (2) 멀티모달 (3) 문항 (3) 민감콘텐츠 (3) 브라질 (3) 상권 (3) 소비 (3) 수학 (4) 스크립트 (5) 스페인어 (6) 억양 (2) 영어 (22) 오디오분석 (3) 음성인식 (27) 음성제어 (18) 의료 (13) 이탈리아 (2) 인문학 (3) 일본어 (8) 저널 (3) 중국어 (6) 카드 (3) 팟캐스트 (14) 포르투갈어 (3) 프랑스 (3) 학술 (4) 한국어 (2) 헬스케어 (3)

(주)크라우드웍스 | 대표이사 : 김우승
사업자등록번호 : 223-81-18325
서울특별시 강남구 테헤란로 309 삼성제일빌딩 5F
사업제휴문의 : contact@crowdworks.ai
고객센터 : support@crowdworks.ai | 02-6954-2960
통신판매업 번호 : 제 2019-서울강남-05382호

Home
  • Crowdworks
  • About Us
  • Datasets
  • Contact
  • 데이터판매 문의
Resources
  • Blog
  • Documentation
  • 뉴스레터
Social
  • Behance
  • Dribbble
  • Facebook
  • Instagram

© Crowdworks. All Rights Reserved.

  • 이용약관
  • 개인정보 처리방침