이 데이터셋은 중·고등학교 내신 시험 대비를 위한 다양한 교과목(국어, 영어, 수학, 사회, 과학) 문제들을 포함하고 있으며, 각 교과목의 이론서와 문제 풀이 자료를 체계적으로 정리하여 학생들이 효과적으로 시험에 대비할 수 있도록 돕는 자료입니다. 문제와 함께 개념 설명, 연습 문제, 실전 문제 등이 포함되어 있어 학생들이 다양한 학습 스타일에 맞춰 활용할 수 있습니다.
국내외 도서 데이터셋
이 데이터셋은 국내 대학출판부, 학술 기관, 전문 협회 및 해외 출판 소스를 기반으로 구축된 고품질 도서 및 텍스트 자료로 구성되어 있습니다. 의료, 법률, 과학기술, 사회과학, 인문학 등 다양한 학문 분야를 포괄하며, 한글·영문·스페인어 등 다국어로 제공됩니다. 기초 학문부터 대학원 수준의 고급 전문서, 교육용 교재, 수험서, 문학작품, 자기개발서까지 포함되어 있으며, AI 언어 모델 학습 및 자연어 처리(NLP), 지능형 교육 시스템 구축 등에 활용 가능한 포괄적 텍스트 자원입니다.
전국 카드 가맹점 및 상권 정보 데이터셋
가맹점 상세 및 상권정보 데이터는 전국에 분포한 XX카드 가맹점 360만 개와 해당 가맹점이 위치한 배후지 상권 분석 정보를 통합한 고품질 데이터셋입니다. 이 데이터셋은 가맹점의 위치, 업종, 매출 패턴, 상권 특성, 소비자 행동 데이터를 포함하며, 상권 분석, 입지 선정, 소비 트렌드 분석, AI 모델 학습 등 다양한 용도로 활용 가능합니다. 모든 데이터는 개인정보 보호법 및 관련 규정을 준수하여 처리되었으며, 구조화된 형태로 제공됩니다.
외국인 국내 소비 이력 데이터셋
외국인 국내 소비 이력 데이터는 해외 글로벌 카드를 국내 카드 가맹점에서 사용한 소비 데이터를 기반으로 구축된 고품질 데이터셋입니다. 이 데이터셋은 외국인의 국내 소비 패턴, 이동 경로, 고객 유형별 소비 비교 분석에 활용 가능하며, 모든 데이터는 개인정보 보호법 및 관련 규정을 준수하여 처리되었습니다.
온라인 카드 구매 이력 데이터셋
온라인 카드 구매 이력 데이터셋은 주요 신용카드 및 온라인 결제 수단을 통해 국내 주요 온라인 채널에서 발생한 구매데이터를 기반으로 구축된 고품질 데이터셋입니다. 이 데이터셋은 소비자 행동, 구매 패턴, 시장 트렌드 분석에 활용 가능한 구매기록을 포함하며, 모든 데이터는 개인정보 보호법 및 관련 규정을 준수하여 처리되었습니다.
국내/해외 뉴스 빅데이터
뉴스 빅데이터는 20년간 600여 매체에서 수집된 약 7억 건의 데이터를 기반으로 구성된 대규모 데이터셋입니다. 이 데이터셋은 인터넷 신문, 지방일간지, 경제일간지, 종합일간지 등 다양한 매체에서 수집된 고품질 뉴스 콘텐츠로 구성되어 있으며, 원권리자(언론사)로부터 데이터 판매 등에 필요한 모든 권리를 합법적으로 취득한 데이터만을 포함하고 있습니다.
비즈니스 및 금융 분야 학술 데이터셋
약 2억 3천만 단어, 2만 6천여 건의 비즈니스 및 금융 분야 연구 논문 및 저널, 5천 7백만 단어, 279권의 학술 서적 데이터셋은 영어로 제공되며, 전문 저널, 비즈니스 사례 연구, 재무 연구 논문, 고급 Q&A 자료를 포함합니다. 이 데이터셋은 비즈니스·금융 특화 LLM, 자동 사례 분석, 고도화된 재무 AI, 경영 의사결정 지원 시스템 등 다양한 AI 기술 개발에 최적화된 고품질 학술 자료입니다.
과학 학술 데이터셋
약 43억 단어, 52만여 건의 과학 분야 연구 논문 및 저널, 60권의 학술 서적 데이터셋은 영어로 제공되며, 대학원 수준의 교과서, 고급 학술 연구 논문, 저널, 교수진이 직접 작성한 복잡한 Q&A 콘텐츠를 포함합니다. 이 데이터셋은 물리학, 화학, 생물학 등 과학 분야 특화 LLM, 자동 문제 생성, 지능형 튜터링 시스템, 과학적 추론 AI 등 첨단 AI 기술 개발에 최적화된 고품질 학술 자료입니다.
수학 학술 데이터셋
8,752건의 수학 논문과 저널, 344권의 학술 서적(참고 문헌 1,638건 포함)으로 구성된 1억 6천만 단어 규모의 영어 데이터셋입니다. 대학원 및 수학 올림피아드 수준의 문제 세트, 고급 교과서, 교수진 Q&A 등 다양한 고급 수학 자료를 포함하여, 수학 특화 LLM 훈련, 자동 문제 생성, 지능형 튜터링 시스템 등 고차원 AI 기술 개발에 최적화된 고품질 학술 데이터셋입니다.
의료 학술 데이터셋
약 40억 단어, 55만건의 의료 분야 연구 논문 및 저널, 679권의 학술 서적(참고 문헌 173건 포함) 데이터셋은 영어로 제공되며, 의학 연구 논문, 임상 사례 연구, 최신 저널, 시험 스타일의 Q&A, 전문 의료 서적을 포함합니다. 이 데이터셋은 의료 특화 LLM, 임상 의사결정 지원, 의료 교육용 AI, 논문 자동 요약 등 첨단 AI 기술 개발에 최적화된 고품질 학술 자료입니다.