关键词(短语)提取(Keyphrase Extraction)神器

lequ1年前 ⋅ 4029 阅读

精准提取句子,文本的关键词或者关键短语,是很多人都会遇到的重要需求,目前有很多的算法都能做到提取,但是能持续更新维护迭代的工具少之又少,一些云厂商也提供了类似的收费功能,本人经过体验后发现也不咋样,还不如那些少数开源且长期维护的工具好用,这个工具是其中优秀者之一。

https://hanlp.hankcs.com/demos/keyphrase.html

同样的代码,为什么我跑出来的是这样的:

[自然语言处理, HanLP, 入门, 理论, 书, 掌握, 发挥, 出, 学科, 助]

@loghub  你的结果明显提取的是关键词,官方那个是短语把

最好贴下代码

@def  我代码直接从这里找的  https://github.com/hankcs/pyhanlp ,不过确实好像没有extractionKeyphrase这个方法啊

from pyhanlp import *

document = "自然语言处理是一门博大精深的学科,掌握理论才能发挥出HanLP的全部性能。《自然语言处理入门》是一本配套HanLP的NLP入门书,助你零起点上手自然语言处理。"
print(HanLP.extractKeyword(document, 10))

https://github.com/hankcs/pyhanlp/search?q=Keyphrase

@loghub  hanlp的python库没有提供extractionKeyphrase或keyphrase相关的方法

jcseg 关键词提取也不错

可以试试这个库

http://www.jionlp.com/jionlp_online/extract_keyphrase

全部评论: 0

    相关推荐