• About Us
  • Datasets
  • Text
  • Audio
  • Speech
  • Image
  • Video
데이터 구매문의
데이터 판매문의

데이터 판매 문의

데이터 판매 문의

콘텐츠 편집
[contact-form-7 id="10448"]

Text

  • Home
  • Datasets
  • Text
  • Page 2
Text

온라인 카드 구매 이력 데이터셋

온라인 카드 구매 이력 데이터셋은 주요 신용카드 및 온라인 결제 수단을 통해 국내 주요 온라인 채널에서 발생한 구매데이터를 기반으로 구축된 고품질 데이터셋입니다. 이 데이터셋은 소비자 행동, 구매 패턴, 시장 트렌드 분석에 활용 가능한 구매기록을 포함하며, 모든 데이터는 개인정보 보호법 및 관련 규정을 준수하여 처리되었습니다.

Text

국내/해외 뉴스 빅데이터

뉴스 빅데이터는 20년간 600여 매체에서 수집된 약 7억 건의 데이터를 기반으로 구성된 대규모 데이터셋입니다. 이 데이터셋은 인터넷 신문, 지방일간지, 경제일간지, 종합일간지 등 다양한 매체에서 수집된 고품질 뉴스 콘텐츠로 구성되어 있으며, 원권리자(언론사)로부터 데이터 판매 등에 필요한 모든 권리를 합법적으로 취득한 데이터만을 포함하고 있습니다.

Text

비즈니스 및 금융 분야 학술 데이터셋

약 2억 3천만 단어, 2만 6천여 건의 비즈니스 및 금융 분야 연구 논문 및 저널, 5천 7백만 단어, 279권의 학술 서적 데이터셋은 영어로 제공되며, 전문 저널, 비즈니스 사례 연구, 재무 연구 논문, 고급 Q&A 자료를 포함합니다. 이 데이터셋은 비즈니스·금융 특화 LLM, 자동 사례 분석, 고도화된 재무 AI, 경영 의사결정 지원 시스템 등 다양한 AI 기술 개발에 최적화된 고품질 학술 자료입니다.

Text

과학 학술 데이터셋

약 43억 단어, 52만여 건의 과학 분야 연구 논문 및 저널, 60권의 학술 서적 데이터셋은 영어로 제공되며, 대학원 수준의 교과서, 고급 학술 연구 논문, 저널, 교수진이 직접 작성한 복잡한 Q&A 콘텐츠를 포함합니다. 이 데이터셋은 물리학, 화학, 생물학 등 과학 분야 특화 LLM, 자동 문제 생성, 지능형 튜터링 시스템, 과학적 추론 AI 등 첨단 AI 기술 개발에 최적화된 고품질 학술 자료입니다.

Text

수학 학술 데이터셋

8,752건의 수학 논문과 저널, 344권의 학술 서적(참고 문헌 1,638건 포함)으로 구성된 1억 6천만 단어 규모의 영어 데이터셋입니다. 대학원 및 수학 올림피아드 수준의 문제 세트, 고급 교과서, 교수진 Q&A 등 다양한 고급 수학 자료를 포함하여, 수학 특화 LLM 훈련, 자동 문제 생성, 지능형 튜터링 시스템 등 고차원 AI 기술 개발에 최적화된 고품질 학술 데이터셋입니다.

Text

의료 학술 데이터셋

약 40억 단어, 55만건의 의료 분야 연구 논문 및 저널, 679권의 학술 서적(참고 문헌 173건 포함) 데이터셋은 영어로 제공되며, 의학 연구 논문, 임상 사례 연구, 최신 저널, 시험 스타일의 Q&A, 전문 의료 서적을 포함합니다. 이 데이터셋은 의료 특화 LLM, 임상 의사결정 지원, 의료 교육용 AI, 논문 자동 요약 등 첨단 AI 기술 개발에 최적화된 고품질 학술 자료입니다.

Text

WorksOne 데이터셋 : SLM Fine Tuning Dataset

크라우드웍스의 자체 SLM 학습을 위해 설계된 이 데이터셋은 기업들이 실제 업무 환경에서 선호하는 표현과 어투를 반영하여 다양한 비즈니스 상황에 적합한 20가지 답변 유형을 체계적으로 담고 있습니다.

Text

전문 지식 Q&A 한국어 데이터셋

법률, 세금·세무, 인사·노무, 의료, 약료, 반려동물, 치과, 한방, 무역, 보험, 재무설계, 과학, 부동산, 교통사고, 영양・식단, 육아·아동, 경제·금융, 인문·예술 등 총 17개 분야에 걸친 전문 지식 기반의 한국어 질의응답(Q&A) 데이터로 구성되어 있습니다.

Text

Aspect-Based Sentiment Analysis (ABSA) 데이터셋

Aspect-Based Sentiment Analysis (ABSA) 데이터셋은 제품 및 서비스 리뷰에 대한 단어 또는 구 단위의 세부 주석을 제공하여 감정 분석을 향상시키는 데 중점을 둔 포괄적인 데이터셋입니다. 이 데이터셋은 표준 문장 수준 감정 주석을 넘어, 텍스트 내에서 특정 주제나 요소, 의견 및 그 관계에 대한 통찰을 제공합니다. 일본어, 중국어, 스페인어, 독일어, 영어(미국) 등 다섯 가지 언어로 총 60,000개의 셋을 포함하고 있습니다.

Text

개체명 인식(NER) 데이터셋

150,000개의 문장이 포함된 이 데이터셋은 10개의 언어에서 24개의 개체명 인식 범주로 주석이 달려 있습니다. 이 데이터셋은 사람 이름, 위치, 회사 이름, 날짜, 시간, 기간 등 다양한 엔티티를 식별하는 AI 모델 훈련을 돕기 위해 정교하게 준비되었습니다.

글 페이지 매김

이전 1 2 3 다음

Search

Categories

  • Audio (3)
  • Image (14)
  • Speech (42)
  • Text (29)
  • Video (9)

Recent Datasets

  • 신문 지면 OCR 및 광고 영역 라벨링 데이터셋
  • 다국어 법률 문서 템플릿 데이터셋
  • 의료 문서 및 임상 노트 데이터셋

Tags

1인화자 (9) ivr (6) Q&A (4) 감정분석 (7) 강의 (3) 객체인식 (14) 건강 (2) 과학 (6) 교육 (6) 구매 (2) 기사 (4) 논문 (3) 뉴스 (4) 다국어 (3) 대화 (10) 독일어 (5) 러시아 (2) 만다린 (2) 멀티모달 (3) 문항 (3) 민감콘텐츠 (3) 브라질 (3) 상권 (3) 소비 (3) 수학 (4) 스크립트 (5) 스페인어 (6) 억양 (2) 영어 (22) 오디오분석 (3) 음성인식 (27) 음성제어 (18) 의료 (13) 이탈리아 (2) 인문학 (3) 일본어 (8) 저널 (3) 중국어 (6) 카드 (3) 팟캐스트 (14) 포르투갈어 (3) 프랑스 (3) 학술 (4) 한국어 (2) 헬스케어 (3)

(주)크라우드웍스 | 대표이사 : 김우승
사업자등록번호 : 223-81-18325
서울특별시 강남구 테헤란로 309 삼성제일빌딩 5F
사업제휴문의 : contact@crowdworks.ai
고객센터 : support@crowdworks.ai | 02-6954-2960
통신판매업 번호 : 제 2019-서울강남-05382호

Home
  • Crowdworks
  • About Us
  • Datasets
  • Contact
  • 데이터판매 문의
Resources
  • Blog
  • Documentation
  • 뉴스레터
Social
  • Behance
  • Dribbble
  • Facebook
  • Instagram

© Crowdworks. All Rights Reserved.

  • 이용약관
  • 개인정보 처리방침