python snownlp中文拼音分词摘要情感分析示例代码
代码语言:python
所属分类:其他
代码描述:python snownlp中文拼音分词摘要情感分析示例代码,可以自己添加文本数据进行训练生成模型。
代码标签: python snownlp 中文 拼音 分词 摘要 情感 分析 示例 代码
下面为部分代码预览,完整代码请点击下载或在bfwstudio webide中打开
#!/usr/local/python3/bin/python3 # -*- coding: utf-8 -* from snownlp import SnowNLP s = SnowNLP(u'一次满意的购物') print(s.words)# 中文分词 print(s.sentiments)#positive的概率 print(s.pinyin)#中文转拼音 s = SnowNLP(u'「繁體字」「繁體中文」的叫法在臺灣亦很常見。') print(s.han)#繁体字转简体 text = u''' 自然语言处理(NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。因此,自然语言处理是与人机交互的领域有关的。在自然语言处理面临很多挑战,包括自然语言理解,因此,自然语言处理涉及人机交互的面积。在NLP诸多挑战涉及自然语言理解,即计算机源于人为或自然语言输入的意思,和其他涉及到自然语言生成。 现代NLP算法是基于机器学习,特别是统计机器学习。机器学习范式是不同于一般之前的尝试语言处理。语言处理任务的实现,通常涉及直接用手的大套规则编码。 许多不同类的机器学习算法已应用于自然语言处理任务。这些算法的输入是一大组从输入数据生成的"特征"。一些最早使用的算法,如决策树,产生硬的if-then规则类似于手写的规则,是再普通的系统体系。然而,越来越多的研究集中于统计模型,这使得基于附加实数值的权重,每个输入要素柔软,概率的决策。此类模型具有能够表达许多不同的可能的答案,而不是只有一个相对的确定性,产生更可靠的结果时,这种模型被包括作为较大系统的一个组成部分的优点。 自然语言处理研究逐渐从词汇语义成分的语义转移,进一步的,叙事的理解。然而人类水平的自然语言处理,是一个人工智能完全问题。它是相当于解决中央的人工智能问题使计算机和人一样聪明,或强大的AI。自然语言处理的未来一般也因此密切结合人工智能发展。 ''' s = SnowNLP(text) print(s.keywords(4))#提取关键词 print(s.summary(3))#w文字摘要 print(s.sentences)#切分为句子 # from snownlp import seg # seg.train('data.txt') # seg.save('seg.marshal') # 词性标注训练库 #from snownlp import tag # tag.train('199801.txt') # tag.save('tag.marshal') #情感分析训练库 # from snownlp import sentiment # sentiment.train('neg.txt', 'pos.txt.........完整代码请登录后点击上方下载按钮下载查看
网友评论0