이 데이터셋은 독일어, 스페인어, 프랑스어, 일본어, 브라질 포르투갈어로 작성된 계약서, 합의서, 정책 문서 등 다양한 형식의 법률 문서 템플릿 1,950개로 구성되어 있습니다. 각 문서는 실제 문서 작성에 기반하여 구조화된 양식을 따르고 있으며, 다국어 법률 문서 생성, 분석, 분류 등 법률 특화 AI 모델 학습에 최적화되어 있습니다.
프랑스어 팟캐스트 데이터셋
4,300시간 분량의 고품질 프랑스어 팟캐스트 데이터로, 프랑스, 캐나다 및 기타 프랑스어권 지역의 다양한 방언과 구어체를 포함하여 AI의 언어 이해 및 생성 능력을 향상시키는 데 최적화된 데이터셋입니다. 라이브 팟캐스트 녹음을 기반으로 하며, 대화형 AI, 음성 인식, 감정 분석 등 다양한 AI 애플리케이션 개발에 활용할 수 있습니다.