提高效率,拒绝重复!7个Pandas数据分析高级技巧

量化投资与机器学习 发布于 2020-04-14 12:19:31

标星★置顶公众号 爱你们♥ 作者:Revert 编译:1+1=6
1用df.groupby ().iter ()分析数据样本与Excel相比,在Jupyter Notebook中逐行或逐组地查看数据集通常比较困难。一个有用的技巧是使用生成器并使用Ctrl + Enter而不是Shift + Enter来迭代地查看同一个单元格中的不同样本。
首先,使用 .groupby()(或 .iterrows())生成器创建一个单元格,并添加 ._ iter__():
generator = df.groupby(['identifier']).__iter__()

然后,使用键盘快捷键Ctrl + Enter,尽可能多地运行以下单元格,以观察对你来说最重要的数据:
group_id, gro ( 点击阅读全文 )

免费下载App,立即成为ETF达人
2 收藏

Datatable:Python数据分析提速高手,飞一般的感觉!

  • 量化投资与机器学习 2020-03-13 18:57:40
标星★置顶公众号 爱你们♥ 作者:Parul Pandey 编译:1+1=61前言Datatable是一个Python库:详细介绍大家可以去官网查看:https://datatable.re...
2 收藏

从VBA到Python,Excel工作效率如何提高?

  • 量化投资与机器学习 2020-01-28 17:26:18
标星★置顶公众号 爱你们♥ 作者:Costas 编译:1+1=61前言如果有一种方法可以将Excel与Python集成起来,该多好啊!现在有了:xlwings库允许我们通过VBA调用Python脚...
1 收藏

NumExpr:加速Numpy、Pandas数学运算新利器!

  • 量化投资与机器学习 2020-06-23 13:39:13
作者:Sarkar 编译:1+1=61前言Numpy 和 Pandas 可能是用于数据科学(DS)和机器学习(ML)任务的两个最广泛使用的核心Python库。毋庸置疑,计算数值表达式的速度对于这些...
0 收藏

VBA

  • 量化投资与机器学习 2020-06-18 16:24:55
标星★置顶公众号 爱你们♥ —— 仅此纪念那些年使用VBA的日子!——2020进度:▓▓▓▓▓▓▓░░░░░░░░ 46% 今天正好在看StackOverflow的最新报告:https://in...
14 收藏

如何简单计算相关系数

  • 宜昌白云飞 2019-07-27 11:53:56
在股债轮动这样的相对动量类型的策略中,我们经常需要计算轮动组合之间的相关性。相关系数取值在正负1之间,数值越接近正1表示相关性越大,容易同涨同跌,任何品种与自己的相关性都是正1,表示走势完全相同。数值越接近负...
3 收藏

数据分析:基金赚了20%该赎回吗?

  • 望京博格 2019-04-04 08:31:09
在大家半信半疑中上证指数突破3200,就连股王:腾讯控股最近一天都涨了3.28%,并带动港股开始走强。从市场底部上证2500到目前上证3200市场涨幅约为28%,其实大多数投资者去年时亏损的,例如有一个段子:...
11 收藏

量化投资:花开五朵各表一枝

  • 二鸟说 2019-06-10 11:00:00
被动指数、指数增强、主动量化、SMART BETA、绝对收益题图 / 沧桑作者 / 一石二鸟标签 / 投教量化投资,说通俗一点就是用电脑代替人脑,按照事先设定的量化模型来处理大量信息并执行交易。量化投资起源于...

发布
问题