
会员
精通Scrapy网络爬虫
更新时间:2020-11-28 14:59:54
最新章节:本书特点:开会员,本书免费读 >
本书深入系统地介绍了Python流行框架Scrapy的相关技术及使用技巧。全书共14章,从逻辑上可分为基础篇和高级篇两部分,基础篇重点介绍Scrapy的核心元素,如spider、selector、item、link等;高级篇讲解爬虫的高级话题,如登录认证、文件下载、执行JavaScript、动态网页爬取、使用HTTP代理、分布式爬虫的编写等,并配合项目案例讲解,包括供练习使用的网站,以及京东、知乎、豆瓣、360爬虫案例等。本书案例丰富,注重实践,代码注释详尽,适合有一定Python语言基础,想学习编写复杂网络爬虫的读者使用。
品牌:清华大学
上架时间:2017-10-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
精通Scrapy网络爬虫最新章节
查看全部- 本书特点:
- 作者简介:
- 14.4 本章小结
- 14.3 使用scrapy-redis进行分布式爬取
- 14.2 scrapy-redis源码分析
- 14.1 Redis的使用
- 第14章 分布式爬取
- 13.6 本章小结
- 13.5 项目实战:爬取豆瓣电影信息
- 13.4 实现随机代理
最新上架
- 会员
你好,C语言
本书是一本全面介绍C语言的技术性书籍,旨在帮助读者深入了解C语言的基础知识和高级特性,以及它在实际项目中的应用。全书共15章,首先通过清晰易懂的语言,深入浅出地解释了C语言的语法和编程原理,其次重点介绍了C语言的指针操作、内存管理、文件处理和模块化编程等关键概念。此外,本书还提供了主富的实例,帮助读者加深对C语言的理解,并通过实践锻炼读者解决实际问题的能力本书适合作为高等院校计算机科学及相关专业的计算机16.3万字 - 会员
量子计算实战
在加密、科学建模、制造物流、金融建模和人工智能等领域,量子计算可以极大提升解决问题的效率。量子系统正变得越来越强大,逐渐可用于生产环境。本书介绍了量子计算的思路与应用,在简要说明与量子相关的科学原理之后,指导读者实现量子计算算法。本书将带领读者使用基于Java的Strange量子模拟器编写量子程序,并探索量子位和量子逻辑门。在介绍标准Java和构建工具创建量子算法的同时,本书还引入了有趣的示例和深计算机10.5万字 - 会员
OpenCV计算机视觉项目实战(Python版)
计算机视觉是在图像处理的基础上发展起来的新兴学科。OpenCV是一个开源的计算机视觉库,可以实现图像处理、模式识别、三维重建、物体跟踪等算法。本书基于Python,从图像基本原理说起,初步讲解计算机视觉所需的OpenCV知识。本书可作为信息处理、计算机、机器人、人工智能、遥感图像处理、认知神经科学等相关专业的教学用书,也可供相关领域的研究工作者参考。计算机10.4万字 - 会员
Python网络爬虫与数据分析从入门到实践
《Python网络爬虫与数据分析从入门到实践》从初学者的视角出发,以案例实操为核心,系统地介绍网络爬虫的原理、工具使用与爬取技术,并详细讲解数据分析的各种技巧。本书主要内容包括:Python基础语法,数据分析工具NumPy、Pandas、Matplotlib的使用,网络爬虫库Urllib、BeautifulSoup、Scrapy,正则表达式在网络爬虫中的应用,数据预处理与数据分析方法、中文文本处理计算机9.2万字 - 会员
HuggingFace自然语言处理详解:基于BERT中文模型的任务实战
本书综合性讲解HuggingFace社区提供的工具集datasets和transformers,书中包括最基础的工具集的用例演示,也包括具体的项目实战,以及预训练模型的底层设计思路和实现原理的介绍。通过本书的学习,读者可以快速掌握HuggingFace工具集的使用方法,掌握自然语言处理项目的一般研发流程,并能研发自己的自然语言处理项目。本书共14章,分为工具集基础用例演示篇(第1~6章),详细讲解计算机7.7万字 - 会员
Spring Boot从入门到精通
《SpringBoot从入门到精通》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细讲解了使用SpringBoot进行程序开发需要掌握的知识。全书分为18章,内容包括SpringBoot概述及其环境搭建,第一个SpringBoot程序,SpringBoot基础,配置SpringBoot项目,处理HTTP请求,过滤器、拦截器与监听器,Service层,日志的操作,JUnit单元计算机14.2万字 - 会员
编程改变生活:用Python提升你的能力(进阶篇·微课视频版)
本书以Python的实际应用为主线,以理论基础为核心,引导读者渐进式学习Python的在生活和工作中的实际应用。本书共13章,可分为4部分。第一部分Python的办公自动化篇(第1~5章)、第二部分网络应用篇(第6~10章)、第三部分GUI编程篇(第11~12章)、第四部分其他应用篇(第13章)。本书示例代码丰富,实用性和系统性较强,并配有视频讲解,助力读者透彻理解书中的重点、难点。精心设计的案例计算机11.6万字 - 会员
响应式编程实战:构建弹性、可伸缩、事件驱动的分布式系统
本书展示了如何利用事件驱动和响应式原理来构建健壮的分布式系统,减少延迟并提高吞吐量——特别是在微服务和无服务器应用程序中。本书分为四部分:第一部分介绍响应式的背景、环境和内容;第二部分深入讲解响应式,涵盖分布式系统的弊端、响应式系统和响应式编程;第三部分阐述如何使用Quarkus构建响应式应用程序,涵盖响应式引擎、响应式编程库SmallRyeMutiny、HTTP以及响应式数据访问的相关知识;第计算机11.1万字 - 会员
小学生Scratch创意编程(视频教学版)
《小学生Scratch创意编程(视频教学版)》采用任务制编排方式,按照课节形式设计,让学习更有节奏感。《小学生Scratch创意编程(视频教学版)》分为四部分。第一部分让读者懂得为什么学和要学什么,明白为什么而学让学习更具动力;第二部分强调基础,以项目的形式讲解每一个知识点,打牢基础才能有的放矢;第三部分从方法到方法论的提升让思维更上一层楼;第四部分通过综合项目实战,提升编程能力,提高项目分析能力计算机5.8万字