이 데이터셋은 의료, 법률, 금융/경제, 과학, 기술, 인문학 등 여러 도메인에서 각 분야의 전문가 자문을 통해 엄선된 고급 한글 도서들을 포함하고 있습니다. 기초 학문부터 고급 전문 서적에 이르는 다양한 학술 서적, 교과서 등이 포함되어 있으며, AI 모델 학습 및 자연어 처리(NLP) 시스템 훈련을 위한 고품질 데이터셋을 제공합니다.
비즈니스 및 금융 분야 학술 데이터셋
약 2억 3천만 단어, 2만 6천여 건의 비즈니스 및 금융 분야 연구 논문 및 저널, 5천 7백만 단어, 279권의 학술 서적 데이터셋은 영어로 제공되며, 전문 저널, 비즈니스 사례 연구, 재무 연구 논문, 고급 Q&A 자료를 포함합니다. 이 데이터셋은 비즈니스·금융 특화 LLM, 자동 사례 분석, 고도화된 재무 AI, 경영 의사결정 지원 시스템 등 다양한 AI 기술 개발에 최적화된 고품질 학술 자료입니다.
금융 거래서 이미지 데이터셋
10,000개의 고해상도 금융 거래서 이미지 데이터셋으로, 청구서 및 송장 이미지를 포함하고 있습니다. 이 데이터셋은 문서 인식 및 금융 자동화를 위한 AI 모델 학습에 최적화되어 있습니다. 헬스케어, 통신, 전자상거래 등 다양한 도메인을 포함하며, 경계 상자 주석과 풍부한 메타데이터가 포함되어 있습니다.