Datasets - A1 Data Marketplace

Image, Text

아동 그림 표현 기반 정서·행동 추론 데이터셋 (KHTP 포함 · 혼합 주제 · Ages 7–9)

본 데이터셋은 아동의 발달 상태를 부모의 심리적 환경 변수와 결합하여 분석할 수 있는 국내 유일의 상관관계 학습용 데이터입니다. 7~9세(초등 저학년)아동이 그린 KHTP(집-나무-사람) 그림 이미지와 그림에 대한 맥락 정보(PDI 1:1질의응답), 부모 스트레스 정량 지표, 임상심리 전문가의 해석 텍스트(근거 포함)를 결합한 멀티모달 AI 학습용 데이터셋입니다. 본 데이터는, 자녀의 정서·양육에 관심이 있는 부모의 자발적 참여로 수집된 사례로 구성되어, […]

Physical AI, Text, Video

피지컬 AI 데이터셋 (센서 글로브 기반 수집, Manipulation Task)

본 데이터셋은 500명 이상의 전문 인력이 고정밀 센서 글러브를 착용하고 수집한 300만 건 이상의 조작(Manipulation) 궤적과 100TB급 규모를 자랑하는 대규모 멀티모달 데이터셋입니다. RGB-D 멀티뷰 비전, 다차원 촉각, 오디오, 텍스트가 완벽하게 동기화된 이 데이터는 특정 하드웨어에 종속되지 않는 ‘Robot-Agnostic’ 특성을 지녀, 수집된 5지(finger) 모션을 4지 로봇 등 다양한 형태의 엔드 이펙터(End-effector)로 유연하게 리타겟팅할 수 있습니다. 이미 […]

Physical AI, Text, Video

피지컬 AI 데이터셋 (손가락 타입 양손, 양팔, 휴머노이드 로봇, manipulation task)

본 데이터셋은 인간의 손과 유사한 다관절 핸드(Multi-fingered Hand)가 장착된 양팔 휴머노이드를 활용하여 수집된 고난도 매니퓰레이션 데이터입니다. 단순 파지(Grasping)를 넘어, 도구 사용(Tool Use), 손안 조작(In-hand Manipulation), 비정형 물체 조작 등 높은 자유도(High-DoF)가 요구되는 정교한 태스크를 포함하고 있습니다. 인간의 섬세한 손기술을 로봇에 전이(Sim2Real / Human2Real)하고자 하는 연구에 최적화된 데이터셋입니다. 활용 사례 및 분야 본 데이터셋은 단순한 동작 […]

Physical AI, Text, Video

피지컬 AI 데이터셋 (그리퍼 타입 양손, 양팔, 휴머노이드 로봇, manipulation task)

본 데이터셋은 양팔 휴머노이드 로봇(Gripper 타입)을 활용한 다양한 조작(Manipulation) 작업을 고정밀 텔레오퍼레이션으로 수행하여 수집한 데이터입니다. 물체의 파지(Pick), 이동(Place), 정렬(Align) 등 정교한 조작이 필요한 시나리오를 포함하고 있으며, 영상, 로봇 관절값(Joint Position), 제어 명령(Control Command) 등 학습에 필요한 모든 멀티모달 데이터가 동기화되어 있습니다. 본 데이터셋은 로봇의 모방 학습(Imitation Learning) 및 행동 지능 개발을 위한 Ground Truth로 활용하기에 […]

Text

소셜 트렌드 인덱스 데이터셋

본 데이터셋은 뉴스뿐만 아니라 X(구 트위터), 네이버/다음 카페 및 국내 300여 개 이상의 커뮤니티에서 매일 생성되는 방대한 문서를 수집하고, 자체 TOPIC AI 모델을 통해 9개 대주제와 42개 소주제로 정밀하게 분류하여 각 주제의 비중과 소셜 관심사 동향을 제공합니다. 이를 통해 금융, 정치, 경제, 사회 등 다양한 분야에서 소비자의 데일리 관심사 변화를 파악하여 트렌드 분석 시스템을 개발하거나, […]

Image, Text, Video

백과사전 멀티미디어 데이터셋

국내 유일 & 최대 규모의 온라인 종합백과사전 콘텐츠로 76만 개 표제어와 다양한 멀티미디어 자료(사진 152만 장, 일러스트 8천 장, 영상 1.4만 건 등)를 보유하고 있습니다. 역사·인문·사회·과학·지리·문화 등 다양한 주제를 망라한 지식 콘텐츠로, 콘텐츠 제작에 각 분야의 전문 집필진이 참여하여 전문성과 정확성을 갖추고 있습니다. 초중고 교과 과정과 연계된 학습 콘텐츠를 각 연령의 문해력과 학습 목적에 맞게 […]

Text

전국 가맹점 추정매출 데이터셋

전국 가맹점 추정매출 데이터셋은 국내 주요 카드사에서 수집된 결제 데이터를 기반으로 한 고품질 데이터셋입니다. 전국 카드 가맹점의 결제 데이터를 통해 추정된 매출 정보를 제공하며, 지역별 상권 트렌드 분석, 신규 가맹점 매출 예측, AI 모델 학습 등 다양한 용도로 활용할 수 있습니다. 데이터는 구조화된 테이블 형태로 제공되며, 매출월, 지역, 가맹점 업종, 가맹점명, 추정매출액 등의 메타데이터를 포함합니다. 이 데이터셋은 상업적 분석 및 AI 기반 예측 모델 개발에 최적화되어 있습니다.

Text

국내 신용·체크카드 소비 데이터셋

이 데이터셋은 전국 주요 카드 가맹점에서 발생한 신용·체크카드 결제 데이터를 기반으로 구축된 고품질 소비 데이터셋입니다. 소비자의 연령, 성별, 거주 지역, 라이프 스테이지 등 다양한 속성과 함께 업종·지역·시간대별 소비 내역을 포함하고 있어 상권 분석, 소비 트렌드 파악, AI 모델 학습 등 다양한 활용이 가능합니다.

특히 개인정보 보호와 관련 법규 준수를 위해 나이는 10살 단위, 사용 시간은 6시간 단위로 구분하여 제공되며, 고객에게는 난수 ID가 부여되어 개별 식별이 불가능하도록 처리되었습니다. 이러한 조치를 통해 안전하게 활용 가능한 동시에, 대규모 데이터 기반 분석 및 AI 연구에 최적화된 환경을 제공합니다.

Text, Video

국내 의료 문서·영상 대규모 데이터셋

이 데이터셋은 진단서, 소견서, 검사결과지, 판독지 등 다양한 형태의 의료 문서 데이터와 MRI, X-ray 등의 의료 영상 데이터로 구성된 고품질 의료 AI 학습용 데이터셋입니다. 총 약 20,000건 이상의 의료 데이터와 5,000건 규모의 영상 데이터(DICOM 포맷)를 포함하고 있으며, 성별·연령대·질환별로 폭넓게 분포되어 있어, 질환 예측, 환자 상태 추적, 영상 기반 진단 AI 모델 개발 등에 최적화되어 있습니다. 또한, 특정 개인 단위로 기록이 정리되어 있어 동일 환자의 질환 진행 추적 및 장기적 의료 기록 분석이 가능합니다. 매월 약 1,000건의 신규 데이터가 지속적으로 추가되어, 확장 가능한 의료 데이터셋을 제공합니다.

Text, Video

AI 모델 성능 향상을 위한 전문지식 데이터(STEM/도서/의료)

AI 모델은 학습 데이터에 담긴 정보를 바탕으로 예측하고 판단합니다. 전문 데이터는 해당 분야의 깊이 있는 지식과 패턴을 포함하고 있어, 모델이 더 정확하고 신뢰성 있는 결과를 내도록 돕습니다. 예를 들어, 의료 AI 모델은 수많은 일반 이미지보다 암 조직 슬라이드 같은 전문 데이터를 통해 질병을 더 정확하게 진단할 수 있습니다. 그러나 전문 데이터는 그 자체로 희소하기도 하며, […]

아동 그림 표현 기반 정서·행동 추론 데이터셋 (KHTP 포함 · 혼합 주제 · Ages 7–9)

피지컬 AI 데이터셋 (센서 글로브 기반 수집, Manipulation Task)

피지컬 AI 데이터셋 (손가락 타입 양손, 양팔, 휴머노이드 로봇, manipulation task)

피지컬 AI 데이터셋 (그리퍼 타입 양손, 양팔, 휴머노이드 로봇, manipulation task)

소셜 트렌드 인덱스 데이터셋

백과사전 멀티미디어 데이터셋

전국 가맹점 추정매출 데이터셋

국내 신용·체크카드 소비 데이터셋

국내 의료 문서·영상 대규모 데이터셋

AI 모델 성능 향상을 위한 전문지식 데이터(STEM/도서/의료)

Home

Resources

Social

데이터 판매 문의

Resources

Social