소셜 트렌드 인덱스 데이터셋
본 데이터셋은 뉴스뿐만 아니라 X(구 트위터), 네이버/다음 카페 및 국내 300여 개 이상의 커뮤니티에서 매일 생성되는 방대한 문서를 수집하고, 자체 TOPIC AI 모델을 통해 9개 대주제와 42개 소주제로 정밀하게 분류하여 각 주제의 비중과 소셜 관심사 동향을 제공합니다. 이를 통해 금융, 정치, 경제, 사회 등 다양한 분야에서 소비자의 데일리 관심사 변화를 파악하여 트렌드 분석 시스템을 개발하거나, 기존 정량 지표에 소셜 반응 추이를 결합해 더욱 설명력 높은 모델을 설계하고 사회 현상을 분석하는 등 다각적인 연구와 비즈니스 모델링에 활용할 수 있습니다.
활용 사례 및 분야
1. 다분야 데일리 트렌드 모니터링
- 활용 사례: 뉴스와 소비자들의 데일리 관심사 변화를 파악하여 금융, 정치, 경제, 사회 등 다양한 분야의 트렌드를 살펴보거나 트렌드 파악을 위한 시스템 개발 등에 사용할 수 있습니다.
2. 고도화된 예측 지표 설계
- 활용 사례: 지수나 지표 개발 시 소셜 상의 관심사 변화 추이를 활용하여 더욱더 설명력 높은 지표를 설계할 수 있습니다.
3. 사회 현상 심층 연구 및 분석
- 활용 사례: 각종 연구과제나 사회현상을 분석하고자 할 때 활용할 수 있습니다.
데이터셋 스펙
- 데이터 수량 : 뉴스, X, 네이버/다음 카페, 커뮤니티에서 생성되는 국문 텍스트 문서 일평균 140~150만건 분량
- 데이터 타입: 텍스트
- 데이터 소스: 직접 수집한 텍스트 데이터 기반
- 언어: 한국어
- 파일 포맷: csv, json
- 업데이트 주기: 월간/주간 (협의가능)
- 메타데이터 :
| 통계값 데이터 | |
| 구분값 | 뉴스, 소비자(X, 네이버/다음카페, 커뮤니티) |
| 1Depth | 9가지 유형 |
| 2Depth | 42개 유형 |
| 정보량 | 발현량 건수 |
| 비중 | 전체 소분류 기준 비중 |
| 증감율 | 비교기간 대비 증감율(일/주/월) |
| 연관어 데이터 ▶ 정보량 및 증감율 기준 TOP5(총 10건) 기준 | |
| 구분 | 정보량 기준/증감율 기준 |
| 순위 | 키워드 순위 |
| 카테고리명 | 2Depth기준 유형값 |
| 키워드 | AI추천키워드 50위 키워드(발현량 높은 상위 50개, 증가율 높은 상위 50개) |
| 정보량 | 발현량 건수 |
