会员
精通Scrapy网络爬虫
更新时间:2020-11-28 14:59:54 最新章节:本书特点:
书籍简介
本书深入系统地介绍了Python流行框架Scrapy的相关技术及使用技巧。全书共14章,从逻辑上可分为基础篇和高级篇两部分,基础篇重点介绍Scrapy的核心元素,如spider、selector、item、link等;高级篇讲解爬虫的高级话题,如登录认证、文件下载、执行JavaScript、动态网页爬取、使用HTTP代理、分布式爬虫的编写等,并配合项目案例讲解,包括供练习使用的网站,以及京东、知乎、豆瓣、360爬虫案例等。本书案例丰富,注重实践,代码注释详尽,适合有一定Python语言基础,想学习编写复杂网络爬虫的读者使用。
品牌:清华大学
上架时间:2017-10-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
刘硕
同类热门书
最新上架
- 会员本书基于Python语言介绍自动化测试的基本概念和技术,旨在帮助读者了解和掌握自动化测试的实现方法。本书覆盖Python基本语法、自动化测试框架、测试用例的设计方法、集成测试的自动化等重要知识,并通过实际案例演示如何使用Python编写自动化测试脚本。本书适合测试人员和开发人员阅读。计算机6.5万字
- 会员这是一本具有高中数学知识就能读懂的机器学习图书,书中通过大量程序实例,将复杂的公式重新拆解,详细、清晰地解读了机器学习中常用的数学知识,一步步带领读者进入机器学习的领域。本书共22章,主要讲解了数据可视化、math模块、sympy模块、numpy模块、方程式、函数、最小平方法、集合、概率、贝叶斯定理、指数、对数、欧拉数、逻辑函数、三角函数、大型运算符、向量、矩阵与线性回归等数学知识。计算机5.8万字
- 会员《SQL语言从入门到精通》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了在开发中使用SQL语言必须掌握的技术。全书分为3篇共18章,内容包括SQL语言基础、SQL查询基础、复杂查询、数据排序、SQL函数的使用、分组统计、子查询、多表查询、添加数据、修改和删除数据、视图、存储过程、触发器、游标、索引、事务、管理数据库与数据表、数据库安全。所有知识都结合具体实例进行介绍,涉及的程序代计算机12.4万字
- 会员本书以R语言常见数据处理方法、ggplot2可视化为主线,希望解决大多数R学习者在学习过程中碰到的难点。本书以实战为目的,聚焦R语言本身数据处理、可视化特点,以一个个例子循序渐进的讲述R语言数据处理及可视化中用到的经典软件包。以便读者能快速将所学内容运用到在实际场景中。本书共6章,第1~3章分别介绍R语言及其软件安装、数据可视化入门介绍、数据存储结构及数据处理方法;第4章和第5章分别介绍ggplo计算机8.4万字
- 会员本书围绕Python技术栈,讲解测试开发技术栈领域的各项核心技术要点。全书共11章,首先讲解pytest单元测试框架在测试领域的技术栈要点,包含pytest从最基本的应用到高阶应用。接着讲解服务端测试开发领域主流的核心思想、主流测试开发工具在解决服务端测试开发中的技术难点,以及服务端测试框架的设计和项目实战案例。在框架的基础上扩展了服务端测试开发领域的知识面,主要介绍Docker容器化技术、基于D计算机7.8万字
- 会员本书分为三部分:第1部分介绍代码的整理(微型重构);第二部分讨论如何将整理工作整合到开发工作流程中;第三部分深入探讨什么是软件设计、软件设计如何驱动软件开发和运营成本以及软件开发和运营成本又如何驱动软件设计、投资软件结构与不投资软件结构之间的权衡是什么、我们可以利用哪些经济和人文原则来决定是否以及如何改变软件结构。计算机3.7万字
- 会员《Python数据可视化之Matplotlib与Pyecharts实战》以某上市电商企业的客户数据、订单数据、股价数据为基础,循序渐进地介绍Python可视化技术,重点介绍Pandas数据预处理与Matplotlib和Pyecharts在数据可视化应用中的基本功能和使用技巧。全书共分4篇,第1篇(第1~4章)主要介绍Python基础与Pandas数据预处理技术,帮助准备可视化数据;第2篇(第5~7计算机7.4万字
- 会员本书从需求规划、需求实现到可视化展示等,遵循项目开发的主要流程,全景介绍了金融租赁行业离线数据仓库的搭建过程。在整个数据仓库的搭建过程中,介绍了主要组件的安装部署、需求实现的具体思路、问题的解决方案等,并在其中穿插了许多大数据和数据仓库相关的理论知识,包括数据仓库的概念介绍、金融租赁业务概述、数据仓库理论介绍和数据仓库建模等。本书的第1章至第3章是项目前期准备阶段,主要为读者介绍了数据仓库的概念、计算机7.4万字