이 데이터셋은 총 63,928시간 분량의 고품질 영상으로 구성된 대규모 멀티도메인·다국어 미디어 학습 자료입니다.
표정·자세 기반 생체정보 영상 데이터셋
이 데이터셋은 실제 인물 100명을 대상으로 수집된 전신 자세, 표정, 의상 등 생체 정보를 포함한 2,586개의 원본 비디오 데이터와, 다양한 얼굴 각도에서 촬영된 180도 셀피 영상 807개로 구성되어 있습니다. 모든 영상은 전처리 없이 자연스러운 환경에서 촬영되었으며, 감정 표현, 신체 움직임, 의상 및 배경의 다양성이 반영되어 있어, 얼굴·자세 인식, 행동 분석, 신원 확인 등 영상 기반 인식 AI 모델 개발에 최적화된 고품질 멀티모달 학습 자료입니다.
STEM 분야 인터넷 강의 데이터셋
이 데이터셋은 자격증, 공무원 시험 대비, 대학 전공 과목, 프로그래밍 등 STEM(과학, 기술, 공학, 수학) 분야를 포괄하는 1,769종의 온라인 강의 데이터를 포함하고 있습니다. 각 강의는 평균 34편의 동영상으로 구성되어 있으며, 총 60,519편의 강의 영상으로 구성된 대규모 교육 콘텐츠입니다. 다양한 학습 목적(입시, 자격 취득, 실무 역량 강화 등)에 따라 세분화된 커리큘럼으로 구성되어 있어, 교육 AI 모델 개발, 콘텐츠 분석, 학습 추천 시스템 등 다양한 응용 분야에서 활용이 가능합니다.
온라인 비즈니스 미팅 데이터셋
95,000시간 분량의 기업 미팅 데이터셋으로, 160,265개의 미팅이 포함되어 있으며, 주요 온라인 미팅 플랫폼 제공자 3곳에서 녹음된 비디오, 오디오, 전사본, 미팅 메타데이터, 실행 항목 및 요약을 제공합니다. 모든 데이터는 상업화에 동의된 자료로, AI 프로젝트에 유용하고 윤리적인 리소스를 제공합니다.
과학 강의 비디오 데이터셋
1,000개의 비디오로 구성된 이 데이터셋은 총 250시간 분량의 영어 강의를 제공합니다. 모든 비디오는 서명 동의를 기반으로하며, 자동 생성된 전사본이 제공됩니다. 각 비디오는 교육적이고 과학적인 주제를 다루며, 각 시뮬레이션에는 1명이 등장합니다.
마케팅 비디오 및 소비자 리뷰 데이터셋
550시간 분량의 마케팅 비디오 데이터셋으로, 다양한 제작자가 제공하는 제품 리뷰가 포함되어 있습니다. 물, 운동화, 맥주 브랜드 등 다양한 제품에 대한 소비자 리뷰를 다루고 있으며, 감정 분석과 시장 트렌드 분석에 적합합니다.
라이브 게임 스트리밍 녹화 데이터셋
200시간 분량의 다양한 인기 콘텐츠 제작자들의 영어 라이브 게임 스트리밍을 포함하며, 게이머 행동, 참여 전략, 시청자 상호작용에 대한 통찰을 제공합니다.
원격 근무 팟캐스트 비디오 데이터셋
10시간 분량의 원격 근무 관련 공동 작업 팟캐스트 비디오 데이터셋으로, 온라인 원격 환경에서 진행된 라이브 비디오 팟캐스트를 제공합니다. 이 데이터셋은 공동 작업과 원격 협업에 대한 논의와 전략을 다루고 있으며, 원격 근무 인사이트를 제공합니다.
온라인 그룹 수업 녹화 데이터셋
2,500시간 분량의 온라인 그룹 수업 녹화 데이터셋으로, 하나의 사람이 수업을 이끌고 다른 사람들이 적극적으로 참여하는 온라인 미팅 형식의 실시간 상호작용을 캡처한 가치있는 학습 데이터 셋입니다. 이 데이터셋은 교육 환경에서 AI의 잠재력을 열어줍니다.