自然语言处理 - 用来处理人类语言的Python库

分类 - 设置更多关注

排序

按热度排序
Popular
350 9.7k 3k

R Rasa 是一个开源的机器学习框架,用于自动化基于文本和语音的对话。开源的机器学习框架,用于自动化基于文本和语音的对话。NLU,对话管理,连接到Slack,Facebook等 - 创建聊天机器人和语音助手
 
10.0 10.0
505 9.2k 2.4k

N NLTK 一套开源Python模块,数据集和教程,支持自然语言处理的研究和开发
 
10.0 3.8
  16天前
283 7.8k 1.8k

1 100+ Chinese Word Vectors 上百种预训练中文词向量
 
10.0 0.2
  27天前
Popular
170 6k 749

P PyText 是一个工业级的开源 NLP 工具包,可用于在 PyTorch 中开发 NLP 模型,并通过 ONNX 部署。其预训练模型包括文本分类、序列标注等。」
 
10.0 10.0
161 3.2k 669

S synonyms可以用于自然语言理解的很多任务:文本对齐,推荐算法,相似度计算,语义偏移,关键字提取,概念提取,自动摘要,搜索引擎等。
 
10.0 0.8
Popular
85 2.9k 553

S Sentence Transformers: 使用BERT / XLNet进行句子嵌入
 
10.0 10.0
Popular
93 2.8k 372

T T5: Text-To-Text Transfer Transformer
 
10.0 9.3
118 2.4k 430

Y 一个简单的库和命令行实用程序,用以从HTML页面或者明文中抽取摘要。该包也包含用于文本摘要的简单评价框架。
 
9.5 0.3
Popular
661 33.8k 8.1k

T Transformers:支持TensorFlow 2.0 和 PyTorch 的自然语言处理预训练语言模型(BERT, GPT-2, RoBERTa, XLM, DistilBert, XLNet…) 8种架构/33种预训练模型/102种语言
 
9.0 10.0
Popular
661 33.8k 8.1k

P Pytorch-Transformers - 👾用于自然语言处理(NLP)的最先进的预训练模型库
 
9.0 10.0
1.3k 16.7k 2.9k

Z Repository to track the progress in Natural Language Processing (NLP), including the datasets and the current state-of-the-art for the most common NLP tasks.
 
9.0 5.2
Popular
448 11.2k 3.8k

G Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。
 
9.0 10.0
375 10.2k 1.7k

N Newspaper可以用来提取新闻、文章和内容分析。使用多线程,支持10多种语言等。 作者从requests库的简洁与强大得到灵感,使用python开发的可用于提取文章内容的程序。
 
9.0 0.2