自然语言处理 - 用来处理人类语言的Python库

分类 - 设置更多关注

排序

按热度排序
396 9.5k 2.6k

Z 手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库等
 
10.0 2.3
  6天前
Popular
471 9.4k 3.4k

G Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。
 
10.0 6.7
535 8.5k 1.5k

Z 专门针对自然语言处理(NLP)的精选资源列表
 
10.0 4.8
  14天前
Popular
487 7.9k 2.2k

N NLTK 一套开源Python模块,数据集和教程,支持自然语言处理的研究和开发
 
10.0 9.7
  13天前
Popular
179 5.1k 543

P PyText 是一个工业级的开源 NLP 工具包,可用于在 PyTorch 中开发 NLP 模型,并通过 ONNX 部署。其预训练模型包括文本分类、序列标注等。」
 
10.0 10.0
Popular
174 4k 902

P Python编写的Facebook AI Research Sequence-to-Sequence工具包
 
10.0 10.0
148 3.7k 540

P python版本:高准确度中文分词工具,简单易用,跟现有开源工具相比大幅提高了分词的准确率。
 
10.0 0.3
Popular
947 10.9k 1.8k

Z Repository to track the progress in Natural Language Processing (NLP), including the datasets and the current state-of-the-art for the most common NLP tasks.
 
9.0 7.0
  前天
65 2k 224

M markovify-Pythonic 的可扩展的 马尔可夫链发生器. 主要用以构建 Markov 模式的大型语料库, 生成随机的句子, 当然,理论上,可以用以其它应用
 
8.2 4.0
  昨天
33 939 117

搜狗机器阅读理解工具包
 
3.0 2.5
  9天前
57 968 96

D 对齐78种语言FastText向量,FastText是Facebook开发的一款快速文本分类器,提供简单而高效的文本分类和表征学习的方法,性能比肩深度学习而且速度更快。
 
2.9 0.0
  1年前
46 933 204

Z HanLP的Python接口,支持自动下载与升级HanLP,兼容py2、py3。
 
2.8 0.2
34 867 398

M 基于某 1w 词敏感词库,用 Python 实现几种不同的过滤方式。用于过滤敏感词的实用模块
 
2.6 0.0
  4年前
22 853 45

B Bounter:Python高性能大规模数据集(词频)计数
 
2.6 1.8
51 812 113

N NLP研究入门之道
 
2.6 5.7
  昨天
66 836 252

T ToolGood.Words是一款高性能非法词(敏感词)检测组件,附带繁体简体互换,支持全角半角互换,获取拼音首字母,获取拼音字母等功能。
 
2.5 0.8
74 803 202

J 我们将机器之心在编译技术文章和论文过程中所遇到的专业术语记录下来,希望有助于大家查阅和翻译。同时也希望大家能积极指出我们编译的不当之处,共同推进知识更高效和客观地传播。
 
2.4 0.0
  9月前