数据清洗技术是提高数据质量的有效方法。这项技术是一个较新的研究领域,对大数据集的清洗工作需要花费很长的时间。由于不同的应用领域对数据清洗有不同的解释,因此数据清洗直到现在都没有一个公认、统一的定义。数据清洗主要应用于3个领域,即数据仓库领域、数据挖掘领域以及数据质量管理领域。查看全文>>
矢量场流线图可以表现矢量场的流态,常见于科学和自然学科中的磁场、万有引力和流体运动等场景。例如,某磁场的流线图如图8-3所示。查看全文>>
大数据迎合国家战略,薪资可观,这个行业在当今市场的人才缺口还是比较大的,只要在培训班足够努力,勤于思考,把技术掌握的扎实,就业是没有问题的。查看全文>>
Linux操作系统有多个版本,如Ubuntu、CentOS、Red Hat等,其中Ubuntu比较适合个人使用,类似于Windows系统,CentOS、Red Hat都是用于服务器,并且CentOS是基于Red Hat再编译的,这两个版本都很稳定,但由于Red Hat的技术支持和更新都是收费的,因此,本节以CentOS版本为例来讲解如何在Linux平台下安装MySQL。查看全文>>
相信很多人都听过这首《小星星》。下面绘制包含若干个五角星的3D散点图,并在不同的坐标范围内显示不同颜色的五角星,具体代码如下。查看全文>>
mplot3d是matplotlib中专门绘制3D图表的工具包,它主要包含一个继承自Axes的子类Axes3D,使用Axes3D类可以构建一个三维坐标系的绘图区域。matpl otlib可以通过两种方式创建Axes3D类的对象:一种方式是Axes3D()方法,另一种方式是add_subplot()方法,具体介绍如下查看全文>>