自然语言处理 - 用来处理人类语言的Python库

分类 - 设置更多关注

排序

按热度排序

A Automatic Korean word spacing with Python
 
0.3 0.0
  11月前

B BERT句法表示能力实验评测:各项测试均表现出色
 
0.3 0.0
  7月前

N NLPre - 用于自然语言预处理的Python库
 
0.3 0.0
250 6k 1.3k

Z 中华新华字典数据库和API。收录包括 14032 条歇后语,16142 个汉字,31648 个成语。 对性能没需求的话,可以用我的新华字典API。所有的数据放在 data/ 目录。
 
0.2 0.0
  7月前
1.3k 19.8k 5.1k

J jieba:“结巴”中文分词:做最好的 Python 中文分词组件
 
0.1 0.3
472 9.7k 3.5k

G Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。
 
0.1 3.7
348 8.5k 1.4k

N Newspaper可以用来提取新闻、文章和内容分析。使用多线程,支持10多种语言等。 作者从requests库的简洁与强大得到灵感,使用python开发的可用于提取文章内容的程序。
 
0.1 0.0
238 5.5k 1.3k

1 100+ Chinese Word Vectors 上百种预训练中文词向量
 
0.1 0.0
  4月前
156 3.8k 569

P python版本:高准确度中文分词工具,简单易用,跟现有开源工具相比大幅提高了分词的准确率。
 
0.1 0.8
233 2.6k 490

Z 自然语言处理(NLP)任务与参考资源精选
 
0.1 0.0
  11月前
109 1.9k 375

D 自然语言十项全能挑战(decaNLP),涉及十个任务:问答,机器翻译,摘要,自然语言推理,情感分析,词性标注,关系抽取,目标导向对话,数据库查询生成和代词解析
 
0.1 0.0
  6月前

B 百度知道问答语料库,包括超过580万的问题,938万的答案,5800个分类标签。基于该问答语料库,可支持多种应用,如闲聊问答,逻辑挖掘。
 
0.1 1.5
  15天前

J Easy-to-use Wrapper for GPT-2 117M and 345M Transformer Models
 
0.1 9.0