이 데이터셋은 국내 대학출판부, 학술 기관, 전문 협회 및 해외 출판 소스를 기반으로 구축된 고품질 도서 및 텍스트 자료로 구성되어 있습니다. 의료, 법률, 과학기술, 사회과학, 인문학 등 다양한 학문 분야를 포괄하며, 한글·영문·스페인어 등 다국어로 제공됩니다. 기초 학문부터 대학원 수준의 고급 전문서, 교육용 교재, 수험서, 문학작품, 자기개발서까지 포함되어 있으며, AI 언어 모델 학습 및 자연어 처리(NLP), 지능형 교육 시스템 구축 등에 활용 가능한 포괄적 텍스트 자원입니다.
영어 팟캐스트 데이터셋 – 동기 부여
스포츠 및 피트니스 활동에 관한 97.3시간 분량의 라이브 영어 팟캐스트 데이터입니다.
영어 팟캐스트 데이터셋 – 자기 계발
라이프스타일에 관한 41.5시간 분량의 라이브 영어 팟캐스트 데이터입니다.