python Simhash获取两篇文章文本相似度效果代码

代码语言:python

所属分类:其他

代码描述:python Simhash获取两篇文章文本相似度效果代码

代码标签: python Simhash 获取 两篇 文章 文本 相似度 代码

下面为部分代码预览,完整代码请点击下载或在bfwstudio webide中打开

#!/usr/local/python3/bin/python3
# -*- coding: utf-8 -*

 
from simhash import Simhash
 
 
def simhash_similarity(text1, text2):
    """
    :param text1: 文本1
    :param text2: 文本2
    :return: 返回两篇文章的相似度
    """
    aa_simhash = Simhash(text1)
    bb_simhash = Simhash(text2)
    max_hashbit = max(len(bin(aa_simhash.value)), .........完整代码请登录后点击上方下载按钮下载查看

网友评论0