自然语言处理 - 用来处理人类语言的Python库

分类 - 设置更多关注

排序

按热度排序
106 2.1k 384

Y 一个简单的库和命令行实用程序,用以从HTML页面或者明文中抽取摘要。该包也包含用于文本摘要的简单评价框架。
 
8.5 4.7
54 999 105

D 对齐78种语言FastText向量,FastText是Facebook开发的一款快速文本分类器,提供简单而高效的文本分类和表征学习的方法,性能比肩深度学习而且速度更快。
 
3.0 0.0
  1年前
75 920 213

S spark-nlp:面向Spark的自然语言处理(NLP)库
 
2.8 10.0
43 919 227

Z 中文自然语言处理数据集
 
2.8 0.0
  5月前
104 909 225

中文文本标注工具
 
2.7 0.2
  1月前
41 891 341

G 该系统实现了基于深度框架的语音识别中的声学模型和语言模型建模,其中声学模型包括CNN-CTC、GRU-CTC、CNN-RNN-CTC,语言模型包含transformer、CBHG,数据集包含stc、primewords、Aishell、thchs30四个数据集。
 
2.7 0.0
65 881 319

中文自然语言理解
 
2.7 0.0
  1年前
34 865 146

Z 中文预训练RoBERTa模型
 
2.7 0.0
  2月前
63 866 75

N a curated collection of papers for the nlp practitioner
 
2.6 0.3
  15天前
24 861 47

B Bounter:Python高性能大规模数据集(词频)计数
 
2.6 0.0
75 856 218

J 我们将机器之心在编译技术文章和论文过程中所遇到的专业术语记录下来,希望有助于大家查阅和翻译。同时也希望大家能积极指出我们编译的不当之处,共同推进知识更高效和客观地传播。
 
2.6 0.2
  1月前
42 849 294

P 中文错别字纠正工具。音似、形似错字(或变体字)纠正,可用于中文拼音、笔画输入法的错误纠正。python3开发。pycorrector依据语言模型检测错别字位置,通过拼音音似特征、笔画五笔编辑距离特征及语言模型困惑度特征纠正错别字。
 
2.6 7.0
  3天前
41 784 229

N nlp相关的一些代码, 包括词向量(Word Embedding)、命名实体识别(NER)、文本分类(Text Classificatin)、文本生成、文本相似性(Text Similarity)计算等,基于keras和tensorflow
 
2.4 10.0
48 755 227

H 汇集了古代文献 txt 大全集,包含佛藏、医藏、史藏等文献
 
2.3 0.0
  1年前
24 752 204

S 用于在Python 3中进行文本摘要和关键字提取的TextRank实现,并对相似性函数进行了优化。
 
2.3 0.0
31 737 118

S Sentence Transformers: 使用BERT / XLNet进行句子嵌入
 
2.3 7.5
22 701 117

P 本项目提供了面向中文的XLNet预训练模型,旨在丰富中文自然语言处理资源,提供多元化的中文预训练模型选择。 我们欢迎各位专家学者下载使用,并共同促进和发展中文资源建设。
 
2.1 0.3
  1月前