Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索

Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。
热门度(没变化) 10.0 活跃度(没变化) 1.2
Watchers:585
Star:9917
Fork:1830
创建时间: 2015-12-01 19:11:33
最后Commits: 13天前
专门针对自然语言处理(NLP)的精选资源列表
访问GitHub主页

VS

热门度(没变化) 9.0 活跃度(没变化) 2.7
Watchers:453
Star:10458
Fork:3699
创建时间: 2011-02-10 15:43:04
最后Commits: 18天前
Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。
访问GitHub主页
热门度(没变化) 10.0 活跃度(没变化) 2.7
Watchers:499
Star:8654
Fork:2304
创建时间: 2009-09-07 18:53:58
最后Commits: 11天前
NLTK 一套开源Python模块,数据集和教程,支持自然语言处理的研究和开发
访问GitHub主页

VS

热门度(没变化) 9.0 活跃度(没变化) 2.7
Watchers:453
Star:10458
Fork:3699
创建时间: 2011-02-10 15:43:04
最后Commits: 18天前
Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。
访问GitHub主页
热门度(没变化) 10.0 活跃度(没变化) 10.0
Watchers:206
Star:8149
Fork:1022
创建时间: 2018-06-11 19:04:18
最后Commits: 4天前
Flair 一个非常简单最先进的NLP框架
访问GitHub主页

VS

热门度(没变化) 9.0 活跃度(没变化) 2.7
Watchers:453
Star:10458
Fork:3699
创建时间: 2011-02-10 15:43:04
最后Commits: 18天前
Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。
访问GitHub主页
热门度(没变化) 10.0 活跃度(没变化) 10.0
Watchers:176
Star:5690
Fork:689
创建时间: 2018-08-01 07:40:46
最后Commits: 昨天
PyText 是一个工业级的开源 NLP 工具包,可用于在 PyTorch 中开发 NLP 模型,并通过 ONNX 部署。其预训练模型包括文本分类、序列标注等。」
访问GitHub主页

VS

热门度(没变化) 9.0 活跃度(没变化) 2.7
Watchers:453
Star:10458
Fork:3699
创建时间: 2011-02-10 15:43:04
最后Commits: 18天前
Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。
访问GitHub主页
热门度(没变化) 10.0 活跃度(没变化) 0.2
Watchers:355
Star:4529
Fork:1139
创建时间: 2013-11-26 19:46:56
最后Commits: 29天前
SnowNLP是一个python写的类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的。
访问GitHub主页

VS

热门度(没变化) 9.0 活跃度(没变化) 2.7
Watchers:453
Star:10458
Fork:3699
创建时间: 2011-02-10 15:43:04
最后Commits: 18天前
Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。
访问GitHub主页
热门度(没变化) 10.0 活跃度(没变化) 0.2
Watchers:188
Star:3713
Fork:1117
创建时间: 2019-07-05 20:49:53
最后Commits: 13天前
此项目是机器学习、NLP面试中常考到的知识点和代码实现,也是作为一个算法工程师必会的理论基础知识。
访问GitHub主页 访问主页

VS

热门度(没变化) 9.0 活跃度(没变化) 2.7
Watchers:453
Star:10458
Fork:3699
创建时间: 2011-02-10 15:43:04
最后Commits: 18天前
Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。
访问GitHub主页
热门度(没变化) 10.0 活跃度(没变化) 10.0
Watchers:125
Star:3672
Fork:383
创建时间: 2019-04-06 01:42:41
最后Commits: 昨天
Natural Language Processing Best Practices & Examples
访问GitHub主页

VS

热门度(没变化) 9.0 活跃度(没变化) 2.7
Watchers:453
Star:10458
Fork:3699
创建时间: 2011-02-10 15:43:04
最后Commits: 18天前
Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。
访问GitHub主页
热门度(没变化) 10.0 活跃度(没变化) 10.0
Watchers:124
Star:3666
Fork:383
创建时间: 2019-04-06 01:42:41
最后Commits: 23天前
自然语言处理(NLP) 最佳实践和示例
访问GitHub主页

VS

热门度(没变化) 9.0 活跃度(没变化) 2.7
Watchers:453
Star:10458
Fork:3699
创建时间: 2011-02-10 15:43:04
最后Commits: 18天前
Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。
访问GitHub主页
热门度(没变化) 10.0 活跃度(没变化) 2.7
Watchers:166
Star:2936
Fork:678
创建时间: 2019-03-03 15:31:29
最后Commits: 14天前
ERNIE 2.0 是基于持续学习的语义理解预训练框架,使用多任务学习增量式构建预训练任务
访问GitHub主页

VS

热门度(没变化) 9.0 活跃度(没变化) 2.7
Watchers:453
Star:10458
Fork:3699
创建时间: 2011-02-10 15:43:04
最后Commits: 18天前
Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。
访问GitHub主页
热门度(没变化) 9.7 活跃度(没变化) 0.2
Watchers:75
Star:2407
Fork:755
创建时间: 2018-11-25 14:22:06
最后Commits: 11天前
Tensorflow solution of NER task Using BiLSTM-CRF model with Google BERT Fine-tuning
访问GitHub主页

VS

热门度(没变化) 9.0 活跃度(没变化) 2.7
Watchers:453
Star:10458
Fork:3699
创建时间: 2011-02-10 15:43:04
最后Commits: 18天前
Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。
访问GitHub主页
热门度(没变化) 9.7 活跃度(上升) 8.7
Watchers:86
Star:2403
Fork:514
创建时间: 2018-05-09 14:10:05
最后Commits: 3天前
doccano:基于网页的开源协同多语言文本标注工具
访问GitHub主页

VS

热门度(没变化) 9.0 活跃度(没变化) 2.7
Watchers:453
Star:10458
Fork:3699
创建时间: 2011-02-10 15:43:04
最后Commits: 18天前
Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。
访问GitHub主页
热门度(没变化) 9.6 活跃度(没变化) 1.0
Watchers:81
Star:2402
Fork:403
创建时间: 2013-09-14 22:01:40
最后Commits: 8天前
将汉字转为拼音。可以用于汉字注音、排序、检索
访问GitHub主页

VS

热门度(没变化) 9.0 活跃度(没变化) 2.7
Watchers:453
Star:10458
Fork:3699
创建时间: 2011-02-10 15:43:04
最后Commits: 18天前
Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。
访问GitHub主页
热门度(没变化) 9.4 活跃度(下降) 1.3
Watchers:88
Star:2315
Fork:421
创建时间: 2019-06-20 06:55:01
最后Commits: 27天前
中文全词覆盖(Whole Word Masking)BERT的预训练模型
访问GitHub主页

VS

热门度(没变化) 9.0 活跃度(没变化) 2.7
Watchers:453
Star:10458
Fork:3699
创建时间: 2011-02-10 15:43:04
最后Commits: 18天前
Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。
访问GitHub主页
热门度(没变化) 9.0 活跃度(没变化) 10.0
Watchers:502
Star:22183
Fork:4945
创建时间: 2018-10-29 21:56:00
最后Commits: 昨天
Pytorch-Transformers - 👾用于自然语言处理(NLP)的最先进的预训练模型库
访问GitHub主页

VS

热门度(没变化) 9.0 活跃度(没变化) 2.7
Watchers:453
Star:10458
Fork:3699
创建时间: 2011-02-10 15:43:04
最后Commits: 18天前
Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。
访问GitHub主页
热门度(没变化) 9.0 活跃度(没变化) 10.0
Watchers:500
Star:22107
Fork:4922
创建时间: 2018-10-29 21:56:00
最后Commits: 前天
Transformers:支持TensorFlow 2.0 和 PyTorch 的自然语言处理预训练语言模型(BERT, GPT-2, RoBERTa, XLM, DistilBert, XLNet…) 8种架构/33种预训练模型/102种语言
访问GitHub主页

VS

热门度(没变化) 9.0 活跃度(没变化) 2.7
Watchers:453
Star:10458
Fork:3699
创建时间: 2011-02-10 15:43:04
最后Commits: 18天前
Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。
访问GitHub主页
热门度(没变化) 9.0 活跃度(上升) 6.8
Watchers:1290
Star:21836
Fork:5473
创建时间: 2012-09-29 15:52:01
最后Commits: 前天
jieba:“结巴”中文分词:做最好的 Python 中文分词组件
访问GitHub主页

VS

热门度(没变化) 9.0 活跃度(没变化) 2.7
Watchers:453
Star:10458
Fork:3699
创建时间: 2011-02-10 15:43:04
最后Commits: 18天前
Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。
访问GitHub主页
热门度(没变化) 9.0 活跃度(没变化) 2.8
Watchers:756
Star:16834
Fork:5036
创建时间: 2018-08-21 19:20:39
最后Commits: 12天前
手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库等
访问GitHub主页

VS

热门度(没变化) 9.0 活跃度(没变化) 2.7
Watchers:453
Star:10458
Fork:3699
创建时间: 2011-02-10 15:43:04
最后Commits: 18天前
Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。
访问GitHub主页
热门度(没变化) 9.0 活跃度(没变化) 3.5
Watchers:1178
Star:14507
Fork:2471
创建时间: 2018-06-23 01:43:55
最后Commits: 15天前
Repository to track the progress in Natural Language Processing (NLP), including the datasets and the current state-of-the-art for the most common NLP tasks.
访问GitHub主页

VS

热门度(没变化) 9.0 活跃度(没变化) 2.7
Watchers:453
Star:10458
Fork:3699
创建时间: 2011-02-10 15:43:04
最后Commits: 18天前
Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。
访问GitHub主页
热门度(没变化) 8.7 活跃度(下降) 1.0
Watchers:108
Star:2180
Fork:389
创建时间: 2013-02-20 20:56:48
最后Commits: 5天前
一个简单的库和命令行实用程序,用以从HTML页面或者明文中抽取摘要。该包也包含用于文本摘要的简单评价框架。
访问GitHub主页 访问主页

VS

热门度(没变化) 9.0 活跃度(没变化) 2.7
Watchers:453
Star:10458
Fork:3699
创建时间: 2011-02-10 15:43:04
最后Commits: 18天前
Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。
访问GitHub主页
热门度(没变化) 3.0 活跃度(没变化) 10.0
Watchers:79
Star:991
Fork:239
创建时间: 2017-09-25 03:36:44
最后Commits: 4天前
spark-nlp:面向Spark的自然语言处理(NLP)库
访问GitHub主页

VS

热门度(没变化) 9.0 活跃度(没变化) 2.7
Watchers:453
Star:10458
Fork:3699
创建时间: 2011-02-10 15:43:04
最后Commits: 18天前
Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。
访问GitHub主页