自然语言处理 - 用来处理人类语言的Python库

分类 - 设置更多关注

排序

按热度排序
57 927 139

P Python编写的Facebook AI Research Sequence-to-Sequence工具包
 
3.7 10.0
  10天前
37 960 120

M markovify-Pythonic 的可扩展的 马尔可夫链发生器. 主要用以构建 Markov 模式的大型语料库, 生成随机的句子, 当然,理论上,可以用以其它应用
 
3.0 2.7
  16天前
50 936 166

L langid.py:独立的语言识别系统
 
2.8000000000000003 0.0
  5月前
53 769 60

D 对齐78种语言FastText向量,FastText是Facebook开发的一款快速文本分类器,提供简单而高效的文本分类和表征学习的方法,性能比肩深度学习而且速度更快。
 
2.6 0.0
  3月前
20 722 31

B Bounter:Python高性能大规模数据集(词频)计数
 
2.6 1.3
154 1.6k 237

Z 自然语言处理(NLP)任务与参考资源精选
 
2.3000000000000003 0.8
  1月前
43 633 82

NLI的句子嵌入(InferSent)和训练代码
 
2.2 0.7000000000000001
  13天前
70 672 319

T TextRank4ZH可以从文章中提取摘要和关键字, TextRank4ZH 则是能用 TextRank 的算法处理中文文章
 
2.1 0.0
  1年前
52 471 116

J 我们将机器之心在编译技术文章和论文过程中所遇到的专业术语记录下来,希望有助于大家查阅和翻译。同时也希望大家能积极指出我们编译的不当之处,共同推进知识更高效和客观地传播。
 
1.7000000000000002 1.7999999999999998
  10天前
43 499 168

T TextGrocery:一简单高效的短文本分类工具,基于 LibLinear 和 Jieba
 
1.6 0.0
18 384 190

M 基于某 1w 词敏感词库,用 Python 实现几种不同的过滤方式。用于过滤敏感词的实用模块
 
1.2 0.0
  3年前
20 363 39

M Makes famous people speak whatever you wish by linking their words
 
1.2 0.0
  10月前
41 168 59

中文文本标注工具
 
1.1 10.0
  前天
13 134 10

SumEval一个Python实现文本摘要评估框架
 
1.1 1.7999999999999998
  12天前
15 268 39

W WikiData上的一个自然语言查询引擎
 
0.8999999999999999 0.0
  1年前
31 252 103

T ToolGood.Words是一款高性能非法词(敏感词)检测组件,附带繁体简体互换,支持全角半角互换,获取拼音首字母,获取拼音字母等功能。
 
0.8 0.0
21 240 46

R rake-nltk:Python实现使用NLTK的快速自动关键字提取算法
 
0.8 0.0
  3月前
27 180 41

S spark-nlp:面向Spark的自然语言处理(NLP)库
 
0.8 10.0
  前天