Archives: 2019

2019

06

09

scrapy-7 | Response内置CSS选择器

和xpath类似，CSS在Response中也集成了。CSS选择器的语法更加简单，但是功能不如xpath强大。 CSS即层叠样式表。语法表达式描述例子*选中所有元素css('*')Element选中Element元素css('img')

2019-06-09 scrapy

scrapy

07

scrapy-6 | Response内置XPath选择器

和Selector类似，为了方便用户编码操作，XPath在Response中也集成了。Xpath（XML Path Language）XML路径语言，是一种用来确定xml文档中某元素位置的语言。提示： HTML属于xml在第四讲案例中我们已

2019-06-07 scrapy

scrapy

06

scrapy-5 | Response内置Selector

前面大致介绍了Selector，但是在实际开发中，我们基本上都是不需要手动创建Selector对象的。 Response对象的selector属性被第一次访问时，Response对象内部就会自动创建一个Selector对象，并且将该Sele

2019-06-06 scrapy

scrapy

06

scrapy-4 | Selector提取数据

数据处理 Python中常用的处理HTTP解析库： BeautifulSoup很流行的HTTP解析库，API简洁易用，但是解析速度比较慢。 lxml由C语言编写的xml解析库，API相对复杂，解析速度快。 Scrapy的Selector

2019-06-06 scrapy

scrapy

05

scrapy-3 | Spider开发流程

感觉还差点东西，觉得流程这个东西需要搞出来。说Spider开发的流程，这里就不得不提一下爬虫的执行流程和Scrapy框架的工作原理。如下：爬虫的执行流程1. 下载页面在爬取内容之前，首先需要根据网页URL，下载网页。 2. 提取页面数据当

2019-06-05 scrapy

scrapy

05

scrapy-2 | 第一个爬虫程序

安装完成了，接下来，我们开始写程序。 #1 查看帮助 scrapy -h scrapy -h #2 有两种命令：其中Project-only必须切到项目文件夹下才能执行，而Global的命令则不需要 Global

2019-06-05 scrapy

scrapy

04

scrapy-0 | Python爬虫基础一

感觉学习Scrapy之前，应该是爬虫的基础类库。毕竟Scrapy是框架，学习框架之前应该弄熟练基础的类库的使用。 1. 数据来源：大型互联网公司百度指数阿里指数新浪指数政府机构中华人民共和国国家统计局（http://d

2019-06-04 scrapy

爬虫初识

04

scrapy-1 | 安装scrapy

决定系统化的学习爬虫，使用Python实现。以下内容来自博客园、CSDN等。非原创。 1、安装wheel（安装后，便支持通过wheel文件安装软件）pip3 install wheel 2、安装lxml、pyopenssllxml：解析XM

2019-06-04 scrapy

scrapy

03

leetcode-922 | 按奇偶排序数组 II

922. 按奇偶排序数组 II给定一个非负整数数组 A， A 中一半整数是奇数，一半整数是偶数。对数组进行排序，以便当 A[i] 为奇数时，i 也是奇数；当 A[i] 为偶数时， i 也是偶数。你可以返回任何满足上述条件的数组作为答案。

2019-06-03 leetcode

leetcode 简单难度数组

03

leetcode-999 | 车的可用捕获量

999. 车的可用捕获量在一个 8 x 8 的棋盘上，有一个白色车（rook）。也可能有空方块，白色的象（bishop）和黑色的卒（pawn）。它们分别以字符 “R”，“.”，“B” 和 “p” 给出。大写字符表示白棋，小写字符表示黑棋。

2019-06-03 leetcode

leetcode 简单难度数组

03

leetcode-1002 | 查找常用字符 I

1002. 查找常用字符给定仅有小写字母组成的字符串数组 A，返回列表中的每个字符串中都显示的全部字符（包括重复字符）组成的列表。例如，如果一个字符在每个字符串中出现 3 次，但不是 4 次，则需要在最终答案中包含该字符 3 次。你可以按

2019-06-03 leetcode

leetcode 简单难度数组

03

leetcode-561 } 数组拆分 I

561. 数组拆分 I给定长度为 2n 的数组, 你的任务是将这些数分成 n 对, 例如 (a1, b1), (a2, b2), …, (an, bn) ，使得从1 到 n 的 min(ai, bi) 总和最大。示例 3：输入: [1,

2019-06-03 leetcode

leetcode 简单难度数组