JavaScript isn't enabled in your browser, so this file can't be opened. Enable and reload.
'MBTI 성향별 청자의 공감 반응 패턴 데이터' 샘플 신청
안녕하세요!
국내 유일 텍스트 전문 데이터 설계/구축 서비스 TEXTNET
입니다.
TEXTNET은
AI 학습 데이터 구축, 데이터 평가 및 정제, Prompt Engineering, 데이터 자산화
등 다양한 도메인과 기술에 맞는 서비스를 제공하고 있습니다. TEXTNET은 챗봇/콜봇 등
대화형AI 품질 고도화 서비스 경험
을 바탕으로 LLM 시대에 부합하는 사업 영역 확장을 추진 중입니다.
🏠TEXTNET 홈페이지:
https://textnet.kr
💁♀️데이터 구축 사례:
https://textnet.kr/casestudy
TEXTNET은 판매용으로 구축한 학습용 데이터의 샘플을 원하는 분들께 제공하고 있습니다. 이 데이터는
'성향별 청자의 공감적 반응 패턴 연구 - MBTI 심리 기능에 주목하여'
라는 제목의 논문으로 정리되어
국제한국언어학회(ICKL 2023) 채택, 한글 및 한국어 정보처리 학술대회(HCLT 2023) 채택 및 우수논문으로 선정
된 바 있습니다.
아래 데이터 정보를 보시고 샘플을 받아보기 원하신다면, 간단한 설문 참여와 함께 성함과 소속, 이메일 주소를 남겨주세요!
※ 데이터 샘플 및 서비스 관련 문의: cs@textnet.kr
Sign in to Google
to save your progress.
Learn more
샘플 데이터 정보
데이터명:
MBTI 성향별 청자의 공감 반응 패턴 데이터
구축 목적:
음성 전사 데이터를 통해 대화 참여자 사이의 성격별 '공감' 포인트를 찾고자 하는 것이 목표, 따라서 대화 참여자들 사이의 공감, 호응 포인트를 살려서 전사한 후 MBTI 유형에 따른 대화 특성과 공감 반응의 차이를 확인하여 레이블링함. 현실의 대화를 전사한 후 후처리하였으므로, 표현 반복, 웃음, 서로의 대화가 겹치거나 상대방의 말을 끊고 이야기하는 등의 자연스러운 발화표현들이 드러날 수 있도록 함.
데이터
특이점
1) 끼어드는 발화에 표시:
청자가 주발화자의 말 중간에 끼어든 경우 텍스트 앞에 '#' 표시
2) 호응 발화 및 감탄사 작성:
어, 그, 저, 뭐, 막 등의 간투사를 최대한 살려서 전사하되, 화자가 단순히 말을 더듬는 것과는 구분하여 표시
3) 개인정보 비식별화:
음절 수에 맞춰 개인정보 비식별화
ex. 지윤이가 → ○
○이가 / 강지윤 님 → ○○○ 님
데이터 세부 명세와 규격
1) 데이터 수량:
53개 SET, 약 5만여 문장
* 샘플은 총 수량의 일부만 제공됩니다.
2) 대화 시나리오 구성
가) 입력 텍스트의 발화 상황과 의도를 구분하기 위한 메타정보
- 화자와 화자 간의 관계
- 화자 정보
- 성격유형별 대화 전략
나) 해당 메타정보가 부착된 유저발화 학습데이터
Next
Page 1 of 5
Clear form
Never submit passwords through Google Forms.
This form was created inside of TEXTNET.
Report Abuse
Forms