영어(다양한 억양) 스크립트 1인 화자 녹음 데이터셋은 434시간 분량의 고품질 독백 음성 데이터로, 프랑스어, 아랍어, 스페인어 등 다양한 언어를 사용하는 원어민들이 발음한 영어 음성을 포함합니다. 이 데이터셋은 다국어 억양과 발음 패턴을 포착하여 음성 인식, 음성 제어 애플리케이션, AI 언어 처리 모델 개발을 목표로 하는 연구자와 개발자에게 필수적인 리소스입니다.
프랑스어 대화 녹음 데이터셋
프랑스어 대화 녹음 데이터셋은 프랑스와 캐나다 원어민 화자들로부터 수집된 809시간 분량의 고품질 자발적 음성 데이터입니다. 이 데이터셋은 은행, 보험, 리테일, 통신 등 다양한 분야를 포괄하며, 프랑스어의 언어적·문화적 뉘앙스를 반영한 실제 대화를 제공합니다. 음성 인식, 대화형 AI, 자연어 처리(NLP) 모델 개발을 목표로 하는 AI 연구자와 개발자에게 이상적인 데이터셋입니다.
포르투갈어(브라질) 대화 녹음 데이터셋
포르투갈어(브라질) 대화 녹음 데이터셋은 브라질 전역에서 수집된 312시간 분량의 고품질 음성 데이터입니다. 이 데이터셋은 은행, 보험, 리테일, 통신 등 중요한 분야를 포함하고 있으며, 포르투갈어의 뉘앙스를 잘 포착한 authentic 대화를 제공합니다. 이 데이터셋은 음성 인식, 대화형 AI, 자연어처리(NLP) 모델 개발을 목표로 하는 AI 연구자와 개발자에게 필수적인 고품질 데이터셋입니다.
영어(필리핀 억양) 대화 녹음 데이터셋
필리핀 억양이 특징인 249시간 분량의 고품질 영어 대화 데이터셋입니다. 은행, 보험, 리테일 등 주요 산업 분야에서 수집된 이 데이터셋은 필리핀 억양의 영어를 정확히 인식하고 처리하는 음성 인식 시스템 및 대화형 AI 개발을 위해 설계되었습니다. 자발적이고 자연스러운 대화를 포함하여 AI 모델의 성능을 향상시키는 데 최적화된 데이터셋입니다.
전국 카드 가맹점 및 상권 정보 데이터셋
가맹점 상세 및 상권정보 데이터는 전국에 분포한 XX카드 가맹점 360만 개와 해당 가맹점이 위치한 배후지 상권 분석 정보를 통합한 고품질 데이터셋입니다. 이 데이터셋은 가맹점의 위치, 업종, 매출 패턴, 상권 특성, 소비자 행동 데이터를 포함하며, 상권 분석, 입지 선정, 소비 트렌드 분석, AI 모델 학습 등 다양한 용도로 활용 가능합니다. 모든 데이터는 개인정보 보호법 및 관련 규정을 준수하여 처리되었으며, 구조화된 형태로 제공됩니다.
외국인 국내 소비 이력 데이터셋
외국인 국내 소비 이력 데이터는 해외 글로벌 카드를 국내 카드 가맹점에서 사용한 소비 데이터를 기반으로 구축된 고품질 데이터셋입니다. 이 데이터셋은 외국인의 국내 소비 패턴, 이동 경로, 고객 유형별 소비 비교 분석에 활용 가능하며, 모든 데이터는 개인정보 보호법 및 관련 규정을 준수하여 처리되었습니다.
온라인 카드 구매 이력 데이터셋
온라인 카드 구매 이력 데이터셋은 주요 신용카드 및 온라인 결제 수단을 통해 국내 주요 온라인 채널에서 발생한 구매데이터를 기반으로 구축된 고품질 데이터셋입니다. 이 데이터셋은 소비자 행동, 구매 패턴, 시장 트렌드 분석에 활용 가능한 구매기록을 포함하며, 모든 데이터는 개인정보 보호법 및 관련 규정을 준수하여 처리되었습니다.
뉴스 빅데이터
뉴스 빅데이터는 20년간 600여 매체에서 수집된 약 7억 건의 데이터를 기반으로 구성된 대규모 데이터셋입니다. 이 데이터셋은 인터넷 신문, 지방일간지, 경제일간지, 종합일간지 등 다양한 매체에서 수집된 고품질 뉴스 콘텐츠로 구성되어 있으며, 원권리자(언론사)로부터 데이터 판매 등에 필요한 모든 권리를 합법적으로 취득한 데이터만을 포함하고 있습니다.
일본어 성우 음성 데이터
100시간 분량의 일본인 성우 스튜디오 녹음 데이터셋은 표준어와 일부 방언이 포함된 다양한 스크립트로 구성되어 있으며, 고품질 스튜디오 환경에서 44kHz로 녹음된 일본어 음성 데이터입니다.
비즈니스 및 금융 분야 학술 데이터셋
약 2억 3천만 단어, 2만 6천여 건의 비즈니스 및 금융 분야 연구 논문 및 저널, 5천 7백만 단어, 279권의 학술 서적 데이터셋은 영어로 제공되며, 전문 저널, 비즈니스 사례 연구, 재무 연구 논문, 고급 Q&A 자료를 포함합니다. 이 데이터셋은 비즈니스·금융 특화 LLM, 자동 사례 분석, 고도화된 재무 AI, 경영 의사결정 지원 시스템 등 다양한 AI 기술 개발에 최적화된 고품질 학술 자료입니다.