使用 Python 实现的新闻网页正文通用抽取器 Alpha 版.

使用 Python 根据论文实现了这个抽取器。并分别使用今日头条、网易新闻、游民星空、观察者网、凤凰网、腾讯新闻、ReadHub、新浪新闻做了测试,发现提取效果非常出色,几乎能够达到100%的准确率。

相关的项目 - 更多比较

159 4k 477

P Pygorithm一个用于学习所有主要算法的Python模块
 
10.0 4.7
  3天前
Popular
4.7k 85.9k 25.1k

所有算法在Python中实现(用于教育)
 
9.0 10.0
  昨天