약 43억 단어, 52만여 건의 과학 분야 연구 논문 및 저널, 60권의 학술 서적 데이터셋은 영어로 제공되며, 대학원 수준의 교과서, 고급 학술 연구 논문, 저널, 교수진이 직접 작성한 복잡한 Q&A 콘텐츠를 포함합니다. 이 데이터셋은 물리학, 화학, 생물학 등 과학 분야 특화 LLM, 자동 문제 생성, 지능형 튜터링 시스템, 과학적 추론 AI 등 첨단 AI 기술 개발에 최적화된 고품질 학술 자료입니다.
과학 강의 비디오 데이터셋
1,000개의 비디오로 구성된 이 데이터셋은 총 250시간 분량의 영어 강의를 제공합니다. 모든 비디오는 서명 동의를 기반으로하며, 자동 생성된 전사본이 제공됩니다. 각 비디오는 교육적이고 과학적인 주제를 다루며, 각 시뮬레이션에는 1명이 등장합니다.