使用 Python 实现的新闻网页正文通用抽取器 Alpha 版.

使用 Python 根据论文实现了这个抽取器。并分别使用今日头条、网易新闻、游民星空、观察者网、凤凰网、腾讯新闻、ReadHub、新浪新闻做了测试,发现提取效果非常出色,几乎能够达到100%的准确率。

相关的项目 - 更多比较

Popular
3.1k 61.6k 18.6k

所有算法在Python中实现(用于教育)
 
9.0 10.0
  昨天
39 851 130

S 使用 Python 根据论文实现了这个抽取器。并分别使用今日头条、网易新闻、游民星空、观察者网、凤凰网、腾讯新闻、ReadHub、新浪新闻做了测试,发现提取效果非常出色,几乎能够达到100%的准确率。
 
3.6 3.2
  1月前