内置的字符串函数
icode编码中的范围是0x4e00-0x9fa5,大家可以利用这个范围进行计数。
“`统计汉字频数,’t = 0 text
if ‘\u4e00′<= char<= '\u9fa5't += 1tt)
第三方库jieba
jieba是一个中文分词库,可以帮助大家将中文文本分成一个一个的词语,方便进行汉字计数。
“`port jieba
统计汉字频数,’
words = jieba.lcut(text)t = 0 words
if ‘\u4e00′<= word<= '\u9fa5't += 1tt)
icode编码范围,可以方便地进行汉字计数。
“`port
统计汉字频数,’t = 0 text.zht += 1tt)