'MBTI 성향별 청자의 공감 반응 패턴 데이터' 샘플 신청
안녕하세요! 국내 유일 텍스트 전문 데이터 설계/구축 서비스 TEXTNET입니다. 

TEXTNET은 AI 학습 데이터 구축, 데이터 평가 및 정제, Prompt Engineering, 데이터 자산화 등 다양한 도메인과 기술에 맞는 서비스를 제공하고 있습니다. TEXTNET은  챗봇/콜봇 등 대화형AI 품질 고도화 서비스 경험을 바탕으로 LLM 시대에 부합하는 사업 영역 확장을 추진 중입니다.

🏠TEXTNET 홈페이지: https://textnet.kr
💁‍♀️데이터 구축 사례: https://textnet.kr/casestudy

TEXTNET은 판매용으로 구축한 학습용 데이터의 샘플을 원하는 분들께 제공하고 있습니다. 이 데이터는 '성향별 청자의 공감적 반응 패턴 연구 - MBTI 심리 기능에 주목하여'라는 제목의 논문으로 정리되어 국제한국언어학회(ICKL 2023) 채택, 한글 및 한국어 정보처리 학술대회(HCLT 2023) 채택 및 우수논문으로 선정된 바 있습니다.

아래 데이터 정보를 보시고 샘플을 받아보기 원하신다면, 간단한 설문 참여와 함께 성함과 소속, 이메일 주소를 남겨주세요!

※ 데이터 샘플 및 서비스 관련 문의: cs@textnet.kr

Sign in to Google to save your progress. Learn more
샘플 데이터 정보
  • 데이터명: MBTI 성향별 청자의 공감 반응 패턴 데이터

  • 구축 목적: 음성 전사 데이터를 통해 대화 참여자 사이의 성격별 '공감' 포인트를 찾고자 하는 것이 목표, 따라서 대화 참여자들 사이의 공감, 호응 포인트를 살려서 전사한 후 MBTI 유형에 따른 대화 특성과 공감 반응의 차이를 확인하여 레이블링함. 현실의 대화를 전사한 후 후처리하였으므로, 표현 반복, 웃음, 서로의 대화가 겹치거나 상대방의 말을 끊고 이야기하는 등의 자연스러운 발화표현들이 드러날 수 있도록 함.

  • 데이터 특이점
    1) 끼어드는 발화에 표시: 청자가 주발화자의 말 중간에 끼어든 경우 텍스트 앞에 '#' 표시
    2) 호응 발화 및 감탄사 작성: 어, 그, 저, 뭐, 막 등의 간투사를 최대한 살려서 전사하되, 화자가 단순히 말을 더듬는 것과는 구분하여 표시
    3) 개인정보 비식별화: 음절 수에 맞춰 개인정보 비식별화
    ex. 지윤이가 → ○
    ○이가 / 강지윤 님 → ○○○ 님

  • 데이터 세부 명세와 규격
    1) 데이터 수량: 53개 SET, 약 5만여 문장
         * 샘플은 총 수량의 일부만 제공됩니다.
    2) 대화 시나리오 구성
        가) 입력 텍스트의 발화 상황과 의도를 구분하기 위한 메타정보
            - 화자와 화자 간의 관계
            - 화자 정보
            - 성격유형별 대화 전략
        나) 해당 메타정보가 부착된 유저발화 학습데이터 
Next
Clear form
Never submit passwords through Google Forms.
This form was created inside of TEXTNET. Report Abuse