微信小程序换肤功能实现方法详细步骤与探讨
918
2022-11-15
jieba 细粒度分词 / add_word无效 / 强制分词
def fenci(one_string): for _ in range(len(one_string)): # 去掉所有空格 try: one_string=one_string.replace(" ","") except: break def isAllZh(s): # 判断是否全是中文 for c in s: if not ('\u4e00' <= c <= '\u9fa5'): return False return True final_result = [] temp_list = jieba.lcut(one_string) for word in temp_list: if isAllZh(word)==False: continue # if jieba.get_FREQ(word)==1: # print(word) if (len(word)>1 and (jieba.get_FREQ(word)==None or jieba.get_FREQ(word)==0)) or len(word)>3: jieba.del_word(word) # 强制 final_result.extend(jieba.lcut(word)) else: final_result.append(word) return
事实上和HMM=False的结果貌似差不多
print(jieba.lcut('丰田太省了', HMM=False))print(jieba.lcut('我们中出了一个叛徒', HMM=False))print(jieba.lcut('丰田太省了', HMM=True))print(jieba.lcut('我们中出了一个叛徒', HMM=True))
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~