Github上的5个高赞机器学习项目

RoyCheryl 发布于1年前

对于程序员而言,Github无疑是一个巨大的宝库,其全球注册用户超过3100万,仓库数量突破一个亿。(2018年年底统计数据)

但我们也要认识到,拥有如此庞杂的项目和用户,泥沙俱下,垃圾项目也不少,要从中找到找到优质的项目,不亚于从沙里淘金。好在Github对每个项目都设有一个星级,如果用户对项目感兴趣,可以为库加注星标,这就如同社交领域的点赞功能,一般来说,获得高赞的项目,都是用户普遍比较关注的觉得还不错的项目。另外辅助以 watch 数和 fork 数,基本上可以判断出项目的好坏。

机器学习作为一个快速发展的领域,越来越多的优秀程序员参与其中,将高质量的代码发布到Github。个人精力有限,显然不可能跟踪机器学习领域中发生的所有事情。我会定期看看Github和新闻,了解一下最新的项目,下面简单介绍一下Github上的5个高赞机器学习项目。

face-recognition

项目地址:

https://github.com/ageitgey/face_recognition

星标数:27428

该项目是世界上最简洁的人脸识别库。它为Python和命令行提供了一个应用程序编程接口(API),用于提取、识别、操作人脸。它采用了业内领先的C++开源库 dlib中的深度学习模型,在Wild数据集中的Labeled Faces上具有99.38%的准确度。它还提供了一个简单的 face_recognition 命令行工具,对整个图像文件夹进行人脸识别!

face-recognition 的主要用途有:

  • 定位图片中的所有人脸:

Github上的5个高赞机器学习项目

  • 识别人脸关键点,包括眼睛、鼻子、嘴和下巴。

Github上的5个高赞机器学习项目

  • 识别图片中的人是谁

Github上的5个高赞机器学习项目

此外,该库采用了高效的算法,可以处理实时人脸识别:

Github上的5个高赞机器学习项目

fastText

项目地址:

https://github.com/facebookresearch/fastText/

星标数:19365

fastText是出自Facebook团队的一个开源和免费库,主要用于文本表示和文本分类。它是轻量级的,适用于标准的通用硬件。模型可以缩减尺寸,甚至可用于移动设备中。

文本分类是许多应用程序的核心问题,如垃圾邮件检测、情绪分析或智能回复。文本分类的目标是将文档(例如电子邮件、帖子、文本消息、产品评论等)归类到多个类别上。

Github上的5个高赞机器学习项目

单词分类的例子| 资料来源:Alterra.ai

对于NLP爱好者来说,这是一个非常有用的资源。

Github上的5个高赞机器学习项目

awesome-tensorflow

项目地址:

https://github.com/jtoy/awesome-tensorflow

星标数:14919

这个库并不包含代码,而是一组资源集合。

对于机器学习开发人员来说,TensorFlow应该不陌生,它是Google设计的端到端机器学习开源平台,然而TensorFlow相当复杂,学习起来并不容易。我一直在网络上收集各种资料,但不如这个库收集的全面,里面包含了精彩的TensorFlow教程、库和项目的链接。一个资源收集项目能得到这么多赞,作者也是相当用心了。

另外Github上还有一个中文的机器学习资源收集项目,里面有一些中文资源,但其受欢迎程度远远不如上面的项目,中国的朋友可以看看:

https://github.com/fendouai/Awesome-TensorFlow-Chinese

PredictionIO

项目地址:

https://github.com/apache/predictionio

星标数:12035

Apache PredictionIO是面向开发人员、数据科学家和最终用户的开源机器学习平台。与TensorFlow这样的机器学习框架不同,该框架关注于服务器部署、应用集成,用户可以使用此框架构建真实的ML应用程序,部署和测试它们。它可以让你:

  • 使用可自定义的模板快速构建和部署引擎作为生产中的Web服务;

  • 作为Web服务部署后,实时响应动态查询;

  • 系统地评估和调整多个引擎变量;

  • 统一来自多个平台的数据,实现全面的预测分析;

  • 通过系统化流程和预先建立的评估措施加快机器学习建模;

  • 支持机器学习和数据处理库,如Spark MLLib和OpenNLP;

  • 实现您自己的机器学习模型,并将它们无缝地整合到引擎中;

  • 简化数据基础架构管理

Apache PredictionIO 可作为完整的机器学习栈安装,与Apache Spark、MLlib、HBase、Akka HTTP和Elasticsearch捆绑在一起,可简化和加速可扩展的机器学习基础架构管理。

Style2Paints

项目地址:

https://github.com/lllyasviel/style2paints

星标数:11,084

这是一个偏向应用的机器学习项目,其用途也非常有趣,就是给图像进行着色。非常遗憾的是,由于缺乏资金,该项目已经关闭!但代码已经开源,只是将定格在V4版本,后续如果有Bug,需要开发人员自己解决。

他们声称Style2paints V4是当前最好的AI驱动的Line-Art着色工具,它与以前的端到端图像到图像转换方法不同,因为它是第一个按照现实生活中的人类工作流程对线条艺术进行着色的系统。大多数人类艺术家都熟悉这个工作流程:

草绘 -> 颜色填充 -> 渐变/细节添加 -> 阴影

Style2Paints是根据此流程设计的。这样的流程仅通过2次点击就可以从最左边的图像生成中间图像。

Github上的5个高赞机器学习项目

只需再点击4次,这就是你得到的:

Github上的5个高赞机器学习项目

好了,关于Github上的5个高赞机器学习项目就介绍到这儿。自从投入精力进行机器学习方面的研究,越来越发现这是一个巨大的坑,太多的知识需要掌握,技术发展太快,我们能做的只能是咬牙坚持,不知道你是否也有这样的感觉?

Github上的5个高赞机器学习项目

查看原文: Github上的5个高赞机器学习项目

  • whiteduck
  • purplewolf
  • yellowrabbit
  • silverswan