1988년부터 약 30년간 전국을 직접 발로 누비며 촬영한 한국의 목조건축물 이미지 데이터베이스입니다. 수십 년에 걸친 현장 답사를 통해 전국 각지에 산재된 전통사찰, 고택, 서원, 향교, 누정 등 다양한 유형의 목조건축물을 체계적으로 기록하였으며, 총 4만 컷의 고해상도 이미지 파일로 구성되어 있습니다. 단순한 외관 촬영에 그치지 않고 건축물의 세부 구조, 단청, 공포, 기단, 처마 등 건축사적으로 중요한 […]
시니어 생애 회고 인터뷰 녹화 데이터셋 (Senior Life Retrospective Interview Video Dataset)
본 데이터셋은 시니어를 대상으로 진행한 생애 회고 인터뷰를 직접 촬영·수집한 롱폼(Long-form) 영상 데이터셋입니다. 총 300건의 영상으로 구성되며, 누적 촬영 시간은 약 1,000시간에 달합니다. 각 영상에는 인터뷰이 1인이 단독으로 등장하며, 유년기·청년기 기억, 가족과의 감정 교류, 삶의 굴곡과 교훈 등 개인의 서사가 자연스럽게 담긴 비구조적 자유 발화 형식으로 진행되었습니다. 통제된 환경이 아닌 실생활 맥락에서 수집된 만큼, 시니어 […]
한국어 금융결제(PG/결제대행) 도메인 Instruction Tuning 데이터셋
한국 PG/결제대행 업계의 CS·운영·리스크 대응 시나리오를 다루는 sLLM Fine-tuning용 Instruction-Output 페어 데이터셋입니다. 8개 핵심 라우트 카테고리인 결제승인 / 환불정산 / 본인인증 / 이상거래탐지 / 분쟁대응 / API연동 / 규제대응 / 시스템장애 계열로 구조화되어 있으며, 각 샘플은 INPUT_BRIEF(상황 브리프)와 OUTPUT_PROMPT(라우팅 결과 + 우선순위 + 컴플라이언스) 쌍으로 구성됩니다. 표면 키워드만으로 라우팅하지 않고, 금액·민감도·감독기관 노출 여부 등 다중 […]
SERICEO 콘텐츠 라이브러리
SERICEO는 대한민국 주요 기업 리더 약 13,000명을 대상으로 비즈니스 의사 결정을 위한 경영 및 인문 지식 콘텐츠를 제공하는 프리미엄 서비스입니다. 관련 분야 전문가와 함께 온·오프라인 콘텐츠를 제작하며, 경영 환경 변화에 대응할 수 있는 전략적 인사이트를 제공합니다. 카테고리 내역 데이터 활용 분야 데이터 특성 데이터셋 스펙
아동 그림 표현 기반 정서·행동 추론 데이터셋 (KHTP 포함 · 혼합 주제 · Ages 7–9)
본 데이터셋은 아동의 발달 상태를 부모의 심리적 환경 변수와 결합하여 분석할 수 있는 국내 유일의 상관관계 학습용 데이터입니다. 7~9세(초등 저학년)아동이 그린 KHTP(집-나무-사람) 그림 이미지와 그림에 대한 맥락 정보(PDI 1:1질의응답), 부모 스트레스 정량 지표, 임상심리 전문가의 해석 텍스트(근거 포함)를 결합한 멀티모달 AI 학습용 데이터셋입니다. 본 데이터는, 자녀의 정서·양육에 관심이 있는 부모의 자발적 참여로 수집된 사례로 구성되어, […]
피지컬 AI 데이터셋 (센서 글로브 기반 수집, Manipulation Task)
본 데이터셋은 500명 이상의 전문 인력이 고정밀 센서 글러브를 착용하고 수집한 300만 건 이상의 조작(Manipulation) 궤적과 100TB급 규모를 자랑하는 대규모 멀티모달 데이터셋입니다. RGB-D 멀티뷰 비전, 다차원 촉각, 오디오, 텍스트가 완벽하게 동기화된 이 데이터는 특정 하드웨어에 종속되지 않는 ‘Robot-Agnostic’ 특성을 지녀, 수집된 5지(finger) 모션을 4지 로봇 등 다양한 형태의 엔드 이펙터(End-effector)로 유연하게 리타겟팅할 수 있습니다. 이미 […]
피지컬 AI 데이터셋 (손가락 타입 양손, 양팔, 휴머노이드 로봇, manipulation task)
본 데이터셋은 인간의 손과 유사한 다관절 핸드(Multi-fingered Hand)가 장착된 양팔 휴머노이드를 활용하여 수집된 고난도 매니퓰레이션 데이터입니다. 단순 파지(Grasping)를 넘어, 도구 사용(Tool Use), 손안 조작(In-hand Manipulation), 비정형 물체 조작 등 높은 자유도(High-DoF)가 요구되는 정교한 태스크를 포함하고 있습니다. 인간의 섬세한 손기술을 로봇에 전이(Sim2Real / Human2Real)하고자 하는 연구에 최적화된 데이터셋입니다. 활용 사례 및 분야 본 데이터셋은 단순한 동작 […]
피지컬 AI 데이터셋 (그리퍼 타입 양손, 양팔, 휴머노이드 로봇, manipulation task)
본 데이터셋은 양팔 휴머노이드 로봇(Gripper 타입)을 활용한 다양한 조작(Manipulation) 작업을 고정밀 텔레오퍼레이션으로 수행하여 수집한 데이터입니다. 물체의 파지(Pick), 이동(Place), 정렬(Align) 등 정교한 조작이 필요한 시나리오를 포함하고 있으며, 영상, 로봇 관절값(Joint Position), 제어 명령(Control Command) 등 학습에 필요한 모든 멀티모달 데이터가 동기화되어 있습니다. 본 데이터셋은 로봇의 모방 학습(Imitation Learning) 및 행동 지능 개발을 위한 Ground Truth로 활용하기에 […]
소셜 트렌드 인덱스 데이터셋
본 데이터셋은 뉴스뿐만 아니라 X(구 트위터), 네이버/다음 카페 및 국내 300여 개 이상의 커뮤니티에서 매일 생성되는 방대한 문서를 수집하고, 자체 TOPIC AI 모델을 통해 9개 대주제와 42개 소주제로 정밀하게 분류하여 각 주제의 비중과 소셜 관심사 동향을 제공합니다. 이를 통해 금융, 정치, 경제, 사회 등 다양한 분야에서 소비자의 데일리 관심사 변화를 파악하여 트렌드 분석 시스템을 개발하거나, […]
백과사전 멀티미디어 데이터셋
국내 유일 & 최대 규모의 온라인 종합백과사전 콘텐츠로 76만 개 표제어와 다양한 멀티미디어 자료(사진 152만 장, 일러스트 8천 장, 영상 1.4만 건 등)를 보유하고 있습니다. 역사·인문·사회·과학·지리·문화 등 다양한 주제를 망라한 지식 콘텐츠로, 콘텐츠 제작에 각 분야의 전문 집필진이 참여하여 전문성과 정확성을 갖추고 있습니다. 초중고 교과 과정과 연계된 학습 콘텐츠를 각 연령의 문해력과 학습 목적에 맞게 […]










