量化投资与机器学习 发布于 2020-07-16 16:01:03
全网TOP量化自媒体作者:Tran 编译:酸的馒头
1前言在Github上搜索关键字“机器学习”时,我们发现了246632个机器学习代码仓库。由于这些是机器学习中的TOP代码仓库,我们希望这些存代码仓库的所有者和贡献者能够成为机器学习方面的专家或胜任者。因此,我们决定提取这些用户的个人资料,以获得对他们的背景以及统计数据的一些有趣的见解。
2获取方式工具
我们使用三种工具:
1、Beautiful Soup,用于提取机器学习标签下所有代码仓库的URL。 Beautiful Soup是一个Python库,可以非常轻松地从网站中抓取数据。
https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/
2、PyGithub提取有关用户的信息。 P (
点击阅读全文 )
→
免费下载App,立即成为ETF达人