이 데이터셋은 초·중·고등학교 내신 시험 대비를 위한 5개 주요 과목(국어, 영어, 수학, 사회, 과학)의 객관식 및 주관식 문항, 정답, 해설과 관련 삽화 이미지를 포함한 대규모 멀티모달 학습 자료입니다. 2,166,600개의 다양한 유형의 문제와 답안, 상세 해설을 제공하며, 텍스트와 JSON 포맷뿐만 아니라 수식(LaTeX), HTML, 이미지(PNG), PDF 등 다양한 파일 포맷을 지원합니다. 일부 문항에는 시각정보를 이해하고 학습하는 멀티모달 AI 시스템을 위한 VLM(Vision-Language Model)용 삽화 및 도표 이미지가 포함되어 있습니다. 본 데이터셋은 내신 평가 AI, 자동 문제 생성, 지능형 학습 튜터 및 멀티모달 학습모델 개발에 최적화된 고품질 학습 자료입니다.
내신 시험 대비용 개념서/이론서
이 데이터셋은 중·고등학교 내신 시험 대비를 위한 다양한 교과목(국어, 영어, 수학, 사회, 과학) 문제들을 포함하고 있으며, 각 교과목의 이론서와 문제 풀이 자료를 체계적으로 정리하여 학생들이 효과적으로 시험에 대비할 수 있도록 돕는 자료입니다. 문제와 함께 개념 설명, 연습 문제, 실전 문제 등이 포함되어 있어 학생들이 다양한 학습 스타일에 맞춰 활용할 수 있습니다.
멀티모달 수학 경시대회 문제 데이터셋
이 데이터셋은 수학 학습을 위한 고품질 문제들로 구성되어 있으며, 다양한 형식의 데이터를 제공하여 효과적인 학습과 AI 기반 분석을 지원합니다. 기본적인 연산부터 고급 문제 해결까지 다양한 수준의 수학 문제를 포함하며, 텍스트, 수식, 그래프, 이미지 등 멀티모달 요소를 활용하여 더욱 직관적이고 풍부한 학습 경험을 제공합니다.
또한 중·고등학교 수학 경시대회(올림피아드 등) 기출 및 변형 문제를 포함한 고급 수학 문제도 포함되어 있어, 수학적 사고력과 문제 해결 능력을 강화할 수 있습니다. 이 데이터셋은 AI 기반 튜터링 시스템, 대형 언어 모델(LLM) 및 비전 언어 모델(VLM) 훈련을 위한 최적의 학습 리소스로 활용될 수 있으며, 다양한 교육 AI 응용 분야에 적용 가능합니다.