00.导论
NLP 通用技术
文本生成
文本生成是使用计算机模拟人来生成文本的技术,可以分为 text-to-text,image-to-text,以及 data-to-text 等。文本生成的应用领域包括机器翻译、QA、文本摘要、文字改写、新闻报道(体育、气象、财经、医疗等)、报告的自动生成等。
随着深度学习等技术在文本生成领域的应用,近年来文本生成技术发展比较快,特别是源于机器翻译的 seq2seq 结构,广泛应用到了文本生成的各个领域。但是应用中还是存在很多诸如创新度不够、不流畅、语句之间相关性不强等问题。文本生成的难度在于,由于人类的语言表达是多种多样的,因此文本生成的结果的质量没有确定的标准,难以评估模型效果,同时对于结果质量和多样性的的平衡也很难把握。
情感分析
文本情感分析(Sentiment Analysis),又称意见挖掘(Opinion Mining),是自然语言处理领域的一个重要研究方向,在工业界和学术界都有广泛的研究和应用,在每年的国际顶会中(例如:ACL、EMNLP、IJCAI、AAAI、WWW 等)都有大量的论文。
简单而言,它是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。相对于客观文本,主观文本包含了用户个人的想法或态度,是用户群体对某产品或事件,从不同角度、不同需求和自身体验去分析评价的结果,这些评价具有主观能动性和多样性,具有情感分析的意义和价值。