西安电子科技大学学报 ›› 2019, Vol. 46 ›› Issue (2): 119-123.doi: 10.19665/j.issn1001-2400.2019.02.020

• • 上一篇    下一篇

社交问答网站中的用户兴趣能力分析方法

黄影1,何婷2,裴庆祺2   

  1. 1. 西安文理学院 信息工程学院,陕西 西安 710065
    2. 西安电子科技大学 通信工程学院,陕西 西安 710071
  • 收稿日期:2018-09-18 出版日期:2019-04-20 发布日期:2019-04-20
  • 作者简介:黄影(1977-),女,工程师,西安文理学院硕士研究生,E-mail:244027323@qq.com.
  • 基金资助:
    国家自然科学基金通用联合基金(U1636209)

Method for user interest and capability analysis in social Q&A websites

HUANG Ying1,HE Ting2,PEI Qingqi2   

  1. 1. School of Information Engineering, Xi’an Univ. of Arts and Science, Xi’an 710067, China
    2. School of Telecommunications Engineering, Xidian Univ., Xi’an 710071, China
  • Received:2018-09-18 Online:2019-04-20 Published:2019-04-20

摘要:

针对现有的社交问答网站存在回答质量不够高、用户接受信息过载、问答周期过长等问题,提出了一种基于自然语言处理的用户兴趣能力分析方法。该方法能够针对文本分析中可能存在的短文本和垃圾回复的情况,增加数据预处理模块,按照给定规则过滤回答和合并问答数据;结合程度值计算方法提取出用户短期兴趣、长期兴趣和能力3个方面的特征;最终能够更准确地将提问推荐至既有兴趣回答又有专业知识提供高质量回答的用户。仿真实验结果表明,所提出的方法能够准确地判断社交问答网站中用户的关注点和能力擅长的领域,将提问与回答用户进行更准确的匹配,进而验证了所提出方法的有效性。

关键词: 社交问答网站, 用户兴趣度提取, 用户能力分析, 自然语言处理

Abstract:

To deal with the problems of the existing Social Question Answering(SQA) websites such as insufficient quality of answers, users receiving excessive information, and long Q&A cycles, a method for NLP-based (Natural Language Processing) user interest and capacity analysis is proposed. The algorithm for calculating the degree of feature words of different benchmarks is proposed. Through the user data of the social question and answer website, the accuracy of the results of the algorithm itself is evaluated by using its own labels of the question as the verification standard, including the coincidence degree of the classification tree and the accuracy of the label item vectors.

Key words: social Q&A website, user interest extraction, user capability analysis, natural language processing

中图分类号: 

  • TN82
Baidu
map