自然语言处理 - 用来处理人类语言的Python库

分类 - 设置更多关注

排序

按热度排序
12 139 28

D DaCiDian是一个开源的中文普通话词汇,用于自动语音识别(ASR)
 
0.4 0.0
  9月前

Z 中文ULMFiT 情感分析 文本分类
 
0.4 0.0
  7月前

C 主要实现使用了基于字向量的四层双向LSTM与CRF模型的网络.该项目提供了原始训练数据样本(一般醒目,出院情况,病史情况,病史特点,诊疗经过)与转换版本,训练脚本,预训练模型,可用于序列标注研究.把玩和PK使用
 
0.4 0.0
  8月前
18 135 11

T Textpipe:文本清洗与元数据提取
 
0.4 6.3
  15天前
11 133 41

G gAnswer能够将自然语言问题转化成包含语义信息的查询图,然后,将查询图转化成标准的SPARQL查询,并将这些查询在图数据库中执行,最终得到用户的答案。
 
0.4 2.2
14 132 25

M Unsupervised Statistical Machine Translation
 
0.4 0.0
  9月前

G 基于京东网站的1300种商品上下级概念,约10万商品品牌,约65万品牌销售关系,商品描述维度等知识库,基于该知识库可以支持商品属性库构建,商品销售问答,品牌物品生产等知识查询服务,也可用于情感分析等下游应用.
 
0.4 0.0
  4月前
21 124 19

S Sentence Transformers: 使用BERT / XLNet进行句子嵌入
 
0.4 10.0
15 120 38

S 用基于bert的微调和特征提取方法来进行知识图谱百度百科人物词条属性抽取。
 
0.4 0.0
  4月前

Y 这是使用BERT进行序列注释和文本分类的模板代码,方便大家将BERT用于更多任务。欢迎使用这个BERT模板解决更多NLP任务,然后在这里分享你的结果和代码。
 
0.4 0.0
  2月前

O 本项目存放HowNet核心数据和THUNLP开发的OpenHowNet API,提供方便的HowNet信息查询、义原树展示、基于义原的词相似度计算等功能。
 
0.4 0.0
  3月前

S 使用word2vector,doc2vector,lstm和其他方法进行语义分析。 主要用于文本相似度分析。
 
0.4 0.0
  1年前
13 115 13

M MONPA 罔拍是一個提供正體中文分詞及 POS, NE 標註的模型
 
0.4 5.8
  5天前
11 109 32

C 此项目是机器学习、NLP面试中常考到的知识点和代码实现,也是作为一个算法工程师必会的理论基础知识。
 
0.4 10.0
  4天前

S Using pre trained word embeddings (Fasttext, Word2Vec)
 
0.3 0.0
  1年前