• About Us
  • Datasets
  • Text
  • Audio
  • Speech
  • Image
  • Video
데이터 구매문의
데이터 판매문의

데이터 판매 문의

데이터 판매 문의

콘텐츠 편집
[contact-form-7 id="10448"]

Datasets

크라우드웍스의 다양한 데이터셋을 확인해보세요.

  • Home
  • Datasets
Text

국/영/수/사/과 문항·해설 데이터셋

이 데이터셋은 초·중·고등학교 내신 시험 대비를 위한 5개 주요 과목(국어, 영어, 수학, 사회, 과학)의 객관식 및 주관식 문항, 정답, 해설과 관련 삽화 이미지를 포함한 대규모 멀티모달 학습 자료입니다. 2,166,600개의 다양한 유형의 문제와 답안, 상세 해설을 제공하며, 텍스트와 JSON 포맷뿐만 아니라 수식(LaTeX), HTML, 이미지(PNG), PDF 등 다양한 파일 포맷을 지원합니다. 일부 문항에는 시각정보를 이해하고 학습하는 멀티모달 AI 시스템을 위한 VLM(Vision-Language Model)용 삽화 및 도표 이미지가 포함되어 있습니다. 본 데이터셋은 내신 평가 AI, 자동 문제 생성, 지능형 학습 튜터 및 멀티모달 학습모델 개발에 최적화된 고품질 학습 자료입니다.

Text

내신 시험 대비용 개념서/이론서

이 데이터셋은 중·고등학교 내신 시험 대비를 위한 다양한 교과목(국어, 영어, 수학, 사회, 과학) 문제들을 포함하고 있으며, 각 교과목의 이론서와 문제 풀이 자료를 체계적으로 정리하여 학생들이 효과적으로 시험에 대비할 수 있도록 돕는 자료입니다. 문제와 함께 개념 설명, 연습 문제, 실전 문제 등이 포함되어 있어 학생들이 다양한 학습 스타일에 맞춰 활용할 수 있습니다.

Text

한글 도서 데이터셋

이 데이터셋은 의료, 법률, 금융/경제, 과학, 기술, 인문학 등 여러 도메인에서 각 분야의 전문가 자문을 통해 엄선된 고급 한글 도서들을 포함하고 있습니다. 기초 학문부터 고급 전문 서적에 이르는 다양한 학술 서적, 교과서 등이 포함되어 있으며, AI 모델 학습 및 자연어 처리(NLP) 시스템 훈련을 위한 고품질 데이터셋을 제공합니다.

Speech

러시아어 팟캐스트 데이터셋

600시간 분량의 고품질 러시아어 팟캐스트 데이터로, 자연스러운 구어체 표현과 다양한 억양을 포함하여 AI의 언어 이해 및 생성 능력을 향상시키는 데 최적화된 데이터셋입니다. 라이브 팟캐스트 녹음을 기반으로 하며, 대화형 AI, 음성 인식, 감정 분석 등 다양한 AI 애플리케이션 개발에 활용할 수 있습니다.

Speech

중국어(광동어) 팟캐스트 데이터셋

500시간 분량의 고품질 광동어 팟캐스트 데이터로, 자연스러운 구어체 표현과 다양한 지역 억양을 포함하여 AI의 언어 이해 및 생성 능력을 향상시키는 데 최적화된 데이터셋입니다. 라이브 팟캐스트 녹음을 기반으로 하며, 대화형 AI, 음성 인식, 감정 분석 등 다양한 AI 애플리케이션 개발에 활용할 수 있습니다.

Speech

중국어(만다린) 팟캐스트 데이터셋

8,950시간 분량의 고품질 만다린어 팟캐스트 데이터로, 자연스러운 구어체 표현과 다양한 지역 억양을 포함하여 AI의 언어 이해 및 생성 능력을 향상시키는 데 최적화된 데이터셋입니다. 라이브 팟캐스트 녹음을 기반으로 하며, 대화형 AI, 음성 인식, 감정 분석 등 다양한 AI 애플리케이션 개발에 활용할 수 있습니다. 활용 사례 및 분야 데이터셋 스펙

Speech

스웨덴어 팟캐스트 데이터셋

14,340시간 분량의 고품질 스웨덴어 팟캐스트 데이터로, 다양한 구어체 표현과 지역 억양을 포함하여 AI의 언어 이해 및 생성 능력을 강화하는 데 최적화된 데이터셋입니다. 라이브 팟캐스트 녹음을 기반으로 하며, 대화형 AI, 음성 인식, 감정 분석 등 다양한 AI 애플리케이션 개발에 활용될 수 있습니다.

Speech

이탈리아어 팟캐스트 데이터셋

5,850시간 분량의 고품질 이탈리아어 팟캐스트 데이터로 구어체 표현을 포함하여 AI의 언어 이해 및 생성 능력을 향상시키는 데 최적화된 데이터셋입니다. 이탈리아 지역의 라이브 팟캐스트를 기반으로 하며, 대화형 AI, 음성 인식, 감정 분석 등 다양한 AI 애플리케이션 개발에 활용할 수 있습니다.

Speech

독일어 팟캐스트 데이터셋

10,800시간 분량의 고품질 독일어 팟캐스트 데이터로, 다양한 지역 억양과 구어체 표현을 포함하여 AI의 언어 이해 및 생성 능력을 향상시키는 데 최적화된 데이터셋입니다. 독일어권 지역의 라이브 팟캐스트를 기반으로 하며, 대화형 AI, 음성 인식, 감정 분석 등 다양한 AI 애플리케이션 개발에 활용할 수 있습니다.

Speech

프랑스어 팟캐스트 데이터셋

4,300시간 분량의 고품질 프랑스어 팟캐스트 데이터로, 프랑스, 캐나다 및 기타 프랑스어권 지역의 다양한 방언과 구어체를 포함하여 AI의 언어 이해 및 생성 능력을 향상시키는 데 최적화된 데이터셋입니다. 라이브 팟캐스트 녹음을 기반으로 하며, 대화형 AI, 음성 인식, 감정 분석 등 다양한 AI 애플리케이션 개발에 활용할 수 있습니다.

글 페이지 매김

1 2 … 9 다음

Search

Categories

  • Audio (3)
  • Image (11)
  • Speech (42)
  • Text (24)
  • Video (6)

Recent Datasets

  • 국/영/수/사/과 문항·해설 데이터셋
  • 내신 시험 대비용 개념서/이론서
  • 한글 도서 데이터셋

Tags

1인화자 (9) ivr (6) Q&A (4) 감정분석 (7) 객체인식 (14) 건강 (2) 과학 (5) 교육 (4) 구매 (2) 국어 (2) 금융 (3) 기사 (3) 논문 (3) 뉴스 (3) 대화 (10) 독일어 (4) 러시아 (2) 만다린 (2) 문항 (3) 민감콘텐츠 (3) 브라질 (3) 사회 (2) 상권 (3) 성우 (2) 소비 (3) 수학 (4) 스크립트 (5) 스페인어 (5) 영어 (22) 오디오분석 (3) 음성인식 (27) 음성제어 (18) 의료 (12) 이탈리아 (2) 인문학 (3) 일본어 (7) 저널 (3) 중국어 (6) 진료 (2) 카드 (3) 팟캐스트 (14) 포르투갈어 (2) 프랑스 (3) 학술 (4) 헬스케어 (2)

(주)크라우드웍스 | 대표이사 : 김우승
사업자등록번호 : 223-81-18325
서울특별시 강남구 테헤란로 309 삼성제일빌딩 5F
사업제휴문의 : contact@crowdworks.ai
고객센터 : support@crowdworks.ai | 02-6954-2960
통신판매업 번호 : 제 2019-서울강남-05382호

Home
  • Crowdworks
  • About Us
  • Datasets
  • Contact
  • 데이터판매 문의
Resources
  • Blog
  • Documentation
  • 뉴스레터
Social
  • Behance
  • Dribbble
  • Facebook
  • Instagram

© Crowdworks. All Rights Reserved.

  • 이용약관
  • 개인정보 처리방침