12,000권 이상의 영어 학술 교과서가 포함된 이 데이터셋은 다양한 과목을 다룹니다. 비즈니스 및 경영학, 환경 과학, 의학, 비선형 과학, 생명 과학, 수학, 아시아 연구, 경제학 및 금융학, 공학, 화학, 나노기술, 물리학, 사회 과학, 건축학, 컴퓨터 과학 등 다양한 분야에서 제공됩니다. 이 데이터 셋에는 STEM Q&A만을 포함하는 100권의 교과서가 있어 LLM 미세 조정을 위한 완벽한 자료입니다.
영어 대화 녹음 데이터셋
은행, 헬스케어, 리테일, 보험, 통신 등 다양한 산업에서 수집된 3,345시간 분량의 자연스러운 영어 대화 데이터입니다. 영국, 미국, 아일랜드, 호주, 인도 등 다양한 영어권 국가의 모국어 화자들의 실제 대화를 기반으로 하며, 일상생활 속 다양한 상황을 담고 있습니다.