Hadoop有三种运行模式:独立(本地)运行模式,伪分布式模式,和完全分布式模式。三种模式的yingy9ong场景不同,下面我们就来详细看一下。查看全文>>
requests是基于Python开发的HTTP库,与urllib标准库相比,它不仅使用方便,而且能节约大量的工作。实际上,requests是在urllib的基础上进行了高度的封装查看全文>>
有些时候我们需要获取某个文件夹下的所有文件的名称,手工操作效率低下而且容易出错,使用Python如何实现这个功能呢?查看全文>>
很多时候我们需要将很多同类型的文件合并成一个文件,手工操作效率很低,下面我们通过一个案例来介绍使用Python合并文件夹内容的方法。查看全文>>
JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,可使人们很容易地进行阅读和编写,同时也方便了机器进行解析和生成。JSON适用于进行数据交互的场景,如网站前台与后台之间的数据交互。查看全文>>
使用lxml库时需要编写和测试XPath语句,显然降低了开发效率。除了lxml库之外,还可以使用Beautiful Soup来提取HTML/XML数据。虽然这两个库的功能相似,但是Beautiful Soup使用起来更加简洁方便,受到开发人员的推崇。查看全文>>