二叉查找树的作用是提高检索数据的性能, 小的存左边,大的存右边,一样的不存。但出现瘸子现象,导致查询的性能与单链表一样,拉低查询速度。查看全文>>
EM算法也称期望最大化(Expectation-Maximum,简称EM)算法。 它是一个基础算法,是很多机器学习领域算法的基础,比如隐式马尔科夫算法(HMM)等等。 EM算法是一种迭代优化策略,由于它的计算方法中每一次迭代都分两步, 其中一个为期望步(E步), 另一个为极大步(M步), 所以算法被称为EM算法(Expectation-Maximization Algorithm)。查看全文>>
数据集中的数据类型有很多种,除了连续的特征变量之外,最常见的就是类别型的数据了,比如人的性别、学历、爱好等,这些数据类型都不能用连续的变量来表示,而是用分类的数据来表示。 Seaborn针对分类数据提供了专门的可视化函数,这些函数大致可以分为如下三种:查看全文>>
空间复杂度是对一个算法在运行过程中所占存储空间大小的度量,一般也作为问题规模n的函数,以数量级形式给出,格式如下所示:查看全文>>
如何在只有6万张图像的MNIST训练数据集上训练模型。学术界当下使用最广泛的大规模图像数据集ImageNet,它有超过1,000万的图像和1,000类的物体。然而,我们平常接触到数据集的规模通常在这两者之间。假设我们想从图像中识别出不同种类的椅子,然后将购买链接推荐给用户。一种可能的方法是先找出100种常见的椅子...查看全文>>
VGG可以看成是加深版的AlexNet,整个网络由卷积层和全连接层叠加而成,和AlexNet不同的是,VGG中使用的都是小尺寸的卷积(3×3),其网络架构如下图所示:查看全文>>