시니어 생애 회고 인터뷰 녹화 데이터셋 (Senior Life Retrospective Interview Video Dataset)

본 데이터셋은 시니어를 대상으로 진행한 생애 회고 인터뷰를 직접 촬영·수집한 롱폼(Long-form) 영상 데이터셋입니다. 총 300건의 영상으로 구성되며, 누적 촬영 시간은 약 1,000시간에 달합니다.

각 영상에는 인터뷰이 1인이 단독으로 등장하며, 유년기·청년기 기억, 가족과의 감정 교류, 삶의 굴곡과 교훈 등 개인의 서사가 자연스럽게 담긴 비구조적 자유 발화 형식으로 진행되었습니다. 통제된 환경이 아닌 실생활 맥락에서 수집된 만큼, 시니어 계층 특유의 발화 패턴—느린 속도, 방언, 감정 기복이 반영된 억양 변화—이 풍부하게 포함되어 있습니다.

영상 데이터와 함께 AI 전사(Transcription) 텍스트가 제공되며, 비밀유지계약(NDA) 체결 시 얼굴 노출 원본 영상의 제공도 별도 협의 가능합니다.

데이터 활용 사례 및 분야

본 데이터셋은 고령층의 실제 발화 데이터와 풍부한 감정 표현이 포함된 고품질 멀티모달 영상 데이터로, 다음과 같은 인공지능 기술 개발 및 서비스 분야에 폭넓게 활용될 수 있습니다.

① 노인 특화 음성 인식(STT) 및 자연어 처리(NLP) 모델 학습

  • 조음 능력 저하, 방언, 세대 특유의 어휘·표현 등 시니어 계층의 발화 특성을 반영한 특화 음성 인식(STT) 모델 고도화에 활용 가능합니다.
  • 생애 회고라는 정서적 맥락이 담긴 장문 발화 데이터를 통해, 고령층 사용자를 위한 공감형 AI 챗봇 및 대화형 에이전트의 응답 생성 모델 학습에 적합합니다.
  • 시니어의 비선형적 서술 방식(시간적 순서 없이 기억을 연상하는 화법)은 복잡한 담화 구조 처리 능력이 필요한 NLP 모델의 고도화 데이터로도 유효합니다.

② 멀티모달 감정 인식 기술 개발

  • 영상 내 표정 변화, 목소리의 떨림과 억양, 손짓·몸짓(제스처)을 동시에 분석하여 우울감, 외로움, 회한, 기쁨 등 미묘한 감정 상태를 식별하는 멀티모달(Multimodal) 감정 인식 모델 학습에 활용할 수 있습니다.
  • 단순 텍스트 기반 감정 분류를 넘어, 비언어적 신호와 언어적 표현이 통합된 복합 감정 레이블링 연구에도 적합합니다.

③ 디지털 휴먼(Digital Human) 및 시니어 라이프케어 서비스 개발

  • 개인별 인터뷰 데이터를 기반으로 고령층 페르소나를 구현한 디지털 휴먼 생성, 추모·기록용 인터랙티브 서비스(예: AI 유언 영상, 가족 기억 보존 플랫폼) 개발에 활용 가능합니다.
  • 장기 대화 패턴 분석을 통한 인지 장애(치매, 경도 인지 저하 등) 조기 예측 모델, 또는 시니어 맞춤형 라이프스타일 제안 솔루션의 학습 데이터로 사용될 수 있습니다.
  • 실버 케어 로봇, 스마트 홈 디바이스 등 고령 친화형 AI 서비스의 감성 인터랙션 모듈 학습에도 적용 가능합니다.

데이터셋 스펙

구분상세 내용
데이터 수롱폼 영상 300건 / 총 약 1,000시간
데이터 타입동영상 (인터뷰 촬영본, 비밀유지계약 체결 시 얼굴 노출 원본 협의 가능)
텍스트 전사 (AI)
수집 방식직접 수집 (영상 + 전사본)
언어한국어
파일 포맷MP4 / FHD / 48kHz
메타데이터표정·상반신 생체 데이터, 성별, 생년, 지역, 전사본
통계 정보연령: 70대 이상 70%, 60대 이하 30% / 성별: 남성·여성 약 5:5
업데이트 주기협의 가능

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다