Skip to content
  • About Us
  • Datasets
  • Physical AI
  • Text
  • Audio
  • Speech
  • Image
  • Video
데이터 구매문의
데이터 판매문의

데이터 판매 문의

데이터 판매 문의

콘텐츠 편집
[contact-form-7 id="10448"]

멀티모달

  • Home
  • Datasets
  • 멀티모달
Uncategorized

시니어 생애 회고 인터뷰 녹화 데이터셋 (Senior Life Retrospective Interview Video Dataset)

본 데이터셋은 시니어를 대상으로 진행한 생애 회고 인터뷰를 직접 촬영·수집한 롱폼(Long-form) 영상 데이터셋입니다. 총 300건의 영상으로 구성되며, 누적 촬영 시간은 약 1,000시간에 달합니다. 각 영상에는 인터뷰이 1인이 단독으로 등장하며, 유년기·청년기 기억, 가족과의 감정 교류, 삶의 굴곡과 교훈 등 개인의 서사가 자연스럽게 담긴 비구조적 자유 발화 형식으로 진행되었습니다. 통제된 환경이 아닌 실생활 맥락에서 수집된 만큼, 시니어 […]

Text, Video

SERICEO 콘텐츠 라이브러리

SERICEO는 대한민국 주요 기업 리더 약 13,000명을 대상으로 비즈니스 의사 결정을 위한 경영 및 인문 지식 콘텐츠를 제공하는 프리미엄 서비스입니다. 관련 분야 전문가와 함께 온·오프라인 콘텐츠를 제작하며, 경영 환경 변화에 대응할 수 있는 전략적 인사이트를 제공합니다. 카테고리 내역 데이터 활용 분야 데이터 특성 데이터셋 스펙

Image, Text

신문 지면 OCR 및 광고 영역 라벨링 데이터셋

본 데이터셋은 국내외 언론사에서 발행한 실제 신문 지면 기반 뉴스·광고 이미지에 OCR 및 시각적 위치 정보를 결합한 멀티모달 학습용 데이터셋입니다.지면 뉴스 기사 4,000,000건 이상과 신문 지면 광고 이미지 100,000건으로 구성되어 있으며, 각 이미지에는 텍스트 위치, 기사/광고 영역, OCR 결과가 포함되어 있어, 문서 시각 이해, 기사 분리, 광고 탐지, OCR 기반 정보 추출 AI 모델에 최적화되어 있습니다.

Video

다장르 미디어 콘텐츠 영상 데이터셋

이 데이터셋은 총 63,928시간 분량의 고품질 영상으로 구성된 대규모 멀티도메인·다국어 미디어 학습 자료입니다.

Image

코딩 강의 자료 및 코드 데이터셋

이 데이터셋은 다양한 프로그래밍 언어와 주제를 기반으로 구성된 총 147종 코딩 강의에 대한 823개 문서로, 학습 수준(초급~고급), 분야(웹, 알고리즘, 데이터 처리 등), 학습 내용별로 세분화된 수업 자료와 실습용 소스코드를 포함하고 있습니다. 텍스트 기반 강의 자료와 함께 실습에 활용된 코드 파일 및 관련 이미지까지 포함된 멀티모달 구성으로, 수준별·단계별 프로그래밍 학습 및 교육 AI 모델 개발에 최적화된 고품질 교육 데이터입니다.

Search

Categories

  • Audio (3)
  • Image (17)
  • Physical AI (3)
  • Speech (42)
  • Text (40)
  • Uncategorized (1)
  • Video (17)

Recent Datasets

  • 한국 고건축 이미지 데이터베이스 (Korean Traditional Architecture Image Database)
  • 시니어 생애 회고 인터뷰 녹화 데이터셋 (Senior Life Retrospective Interview Video Dataset)
  • 한국어 금융결제(PG/결제대행) 도메인 Instruction Tuning 데이터셋

Tags

1인화자 (9) ivr (6) Q&A (4) stem (3) 감정분석 (7) 강의 (3) 객체인식 (13) 과학 (6) 교육 (7) 기사 (4) 논문 (3) 뉴스 (4) 다국어 (3) 대화 (10) 독일어 (5) 멀티모달 (5) 멀티모달데이터 (4) 문항 (3) 민감콘텐츠 (3) 브라질 (3) 비즈니스 (2) 사회 (2) 상권 (5) 소비 (5) 수학 (4) 스크립트 (6) 스페인어 (6) 영어 (22) 오디오분석 (3) 음성인식 (28) 음성제어 (18) 의료 (14) 이탈리아 (2) 인문학 (3) 일본어 (8) 저널 (3) 중국어 (6) 카드 (4) 팟캐스트 (14) 포르투갈어 (3) 프랑스 (3) 학술 (5) 한국어 (3) 핵의학 (2) 휴머노이드 (2)

(주)크라우드웍스 | 대표이사 : 김우승
사업자등록번호 : 223-81-18325
서울특별시 강남구 테헤란로 309 삼성제일빌딩 5F
사업제휴문의 : contact@crowdworks.ai
고객센터 : support@crowdworks.ai | 02-6954-2960
통신판매업 번호 : 제 2019-서울강남-05382호

Home
  • Crowdworks
  • About Us
  • Datasets
  • Contact
  • 데이터판매 문의
Resources
  • Blog
  • Documentation
  • 뉴스레터
Social
  • Behance
  • Dribbble
  • Facebook
  • Instagram

© Crowdworks. All Rights Reserved.

  • 이용약관
  • 개인정보 처리방침