这个涉及到NLP的处理(自然语言处理)
1、简单的处理方式,通过TF-IDF算法,提取文章关键词,这种方法可以很快拿到文章的主题词,但这种方法相对比较粗燥,会存在误提取的情况,将无意义的关键词提取出来
2、textrank算法提取,经典的文本摘要提取方法,相对靠谱点,在文章语料少的情况下,主旨不清晰时,这个算法提取的效果也一般
3、LDA主题算法,经典的文章主题算法,实现也比较容易,提取关键词效果还行,需要控制以下提取关键词的数量,选择最合适的数量范围,多尝试一下就好了
首页 >
这个涉及到NLP的处理(自然语言处理)
1、简单的处理方式,通过TF-IDF算法,提取文章关键词,这种方法可以很快拿到文章的主题词,但这种方法相对比较粗燥,会存在误提取的情况,将无意义的关键词提取出来
2、textrank算法提取,经典的文本摘要提取方法,相对靠谱点,在文章语料少的情况下,主旨不清晰时,这个算法提取的效果也一般
3、LDA主题算法,经典的文章主题算法,实现也比较容易,提取关键词效果还行,需要控制以下提取关键词的数量,选择最合适的数量范围,多尝试一下就好了