华侨网,有态度的华人新闻网站!

帮助中心 广告联系

華僑時報 | 華僑網

热门关键词:  央行  发顺丰  蓝狐  詩詞  习近平
热门TAG标签:

CICC科普栏目|Python环境下的8种简单线性回归算法(3)

来源:网络整理 作者:华侨时报 发布时间:2018-01-03
摘要:作为一个数据科学家,他的工作经常要求他又快又精确地完成数据建模。如果使用的方法本来就很慢,那么在面对大型数据集的时候便会出现执行的瓶颈问

作为一个数据科学家,他的工作经常要求他又快又精确地完成数据建模。如果使用的方法本来就很慢,那么在面对大型数据集的时候便会出现执行的瓶颈问题。

一个判断算法能力可扩展性的好办法,是用不断扩大的数据集来测试数据,然后提取所有试验的执行时间,画出趋势图。

可以在 GitHub查看这个方法的代码。下方给出了最终的结果。由于模型的简单性,stats.linregress和简单矩阵求逆乘法的速度最快,甚至达到了 1千万个数据点。

CICC科普栏目|Python环境下的8种简单线性回归算法

总结

作为一个数据科学家,你必须要经常进行研究,去发现多种处理相同的分析或建模任务的方法,然后针对不同问题对症下药。

在本文中,我们讨论了 8种进行简单线性回归的方法。其中大部分方法都可以延伸到更一般的多变量和多项式回归问题上。我们没有列出这些方法的 R²系数拟合,因为它们都非常接近 1。

对于(有百万人工生成的数据点的)单变量回归,回归系数的估计结果非常不错。

这篇文章首要目标是讨论上述 8种方法相关的速度/计算复杂度。我们通过在一个合成的规模逐渐增大的数据集(最大到 1千万个样本)上进行实验,我们测出了每种方法的计算复杂度。令人惊讶的是,简单矩阵求逆乘法的解析解竟然比常用的 scikit-learn线性模型要快得多。C2

如何加入学会

学会近期活动:

1. 2018.1.20上午,召开"空天大数据与人工智能专委会成立大会“。

2. 2018.1.20下午,举办“空天大数据与军事智能化研讨会暨院士专家新春茶话会“。

注册学会会员:

个人会员:

(c2_china),回复“个人会员”获取入会申请表,按要求填写申请表即可,如有问题,可在公众号内进行留言。通过学会审核后方可在线进行支付宝缴纳会费。

单位会员:

(c2_china),回复“单位会员”获取入会申请表,按要求填写申请表即可,如有问题,可在公众号内进行留言。通过学会审核后方可缴纳会费。

长按下方学会二维码,关注学会微信

责任编辑:华侨时报