电影院要开工了，用Python看一看最近有什么刚上映的电影

佚名 4年前 (2020-07-25) Python 732人围观抢沙发百度已收录

前言

猫眼电影是淘宝联合打造电影分类最全的电影的平台，能够第一时间告知用户，最新的电影上线时间。今天教大家获取猫眼电影的即将上映的电影详情。

SRE实战互联网时代守护先锋，助力企业售后服务体系运筹帷幄！一键直达领取阿里云限量特价优惠。

电影院要开工了，用Python看一看最近有什么刚上映的电影 Python 第1张

项目目标

获取猫眼电影的即将上映的电影详情。

电影院要开工了，用Python看一看最近有什么刚上映的电影 Python 第2张

项目准备

软件：PyCharm

需要的库：requests、lxml、random、time

插件：Xpath

网站如下：

https://maoyan.com/films?showType=2&offset={}

点击下一页的按钮，观察到网站的变化分别如下：

https://maoyan.com/films?showType=2&offset=30
https://maoyan.com/films?showType=2&offset=60
https://maoyan.com/films?showType=2&offset=90

点击下一页时，页面每增加一页offset=()每次增加30，所以可以用{}代替变换的变量，再用for循环遍历这网址，实现多个网址请求。

项目实现

1、定义一个class类继承object，定义init方法继承self，主函数main继承self。导入需要的库和网址，代码如下所示。

import requests
from lxml import etree

import time
import random

class MaoyanSpider(object):
    def __init__(self):
 self.url = "https://maoyan.com/films?showType=2&offset={}"

 def main(self):
 pass

if __name__ == '__main__':
 spider = MaoyanSpider()
 spider.main()

2、随机产生UserAgent。

 for i in range(1, 50):
 # ua.random,一定要写在这里,每次请求都会随机选择。
 self.headers = {
 'User-Agent': ua.random,
 }

3、发送请求，获取页面响应。

def get_page(self, url):
 # random.choice一定要写在这里,每次请求都会随机选择
 res = requests.get(url, headers=self.headers)
 res.encoding = 'utf-8'
 html = res.text
 self.parse_page(html)

4、xpath解析一级页面数据，获取页面信息。

1）基准xpath节点对象列表。

 # 　创建解析对象
parse_html = etree.HTML(html)
# 基准xpath节点对象列表
dd_list = parse_html.xpath('//dl[@class="movie-list"]//dd')

2）依次遍历每个节点对象，提取数据。

 for dd in dd_list:
 name = dd.xpath('.//div[@class="movie-hover-title"]//span[@class="name noscore"]/text()')[0].strip()
 star = dd.xpath('.//div[@class="movie-hover-info"]//div[@class="movie-hover-title"][3]/text()')[1].strip()
 type = dd.xpath('.//div[@class="movie-hover-info"]//div[@class="movie-hover-title"][2]/text()')[1].strip()
 dowld=dd.xpath('.//div[@class="movie-item-hover"]/a/@href')[0].strip()
 # print(movie_dict)
 movie = '''【即将上映】

5、定义movie，保存打印数据。

movie = '''【即将上映】
 
电影名字: %s

主演：%s

类型：%s
详情链接：https://maoyan.com%s
=========================================================
 ''' % (name, star, type,dowld)
print( movie)

6、random.randint()方法，设置时间延时。

time.sleep(random.randint(1, 3))

7、调用方法，实现功能。

html = self.get_page(url)self.parse_page(html)

效果展示

1、点击绿色小三角运行输入起始页，终止页。

电影院要开工了，用Python看一看最近有什么刚上映的电影 Python 第3张

2、运行程序后，结果显示在控制台，如下图所示。

电影院要开工了，用Python看一看最近有什么刚上映的电影 Python 第4张

3、点击蓝色下载链接, 网络查看详情。

电影院要开工了，用Python看一看最近有什么刚上映的电影 Python 第5张

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

作者：Python进阶者

扫码关注我们

微信号：SRE实战

拒绝背锅运筹帷幄

赞 0 赏分享

转载请注明 : 文章转载自小翔博客电影院要开工了，用Python看一看最近有什么刚上映的电影

本文标题：电影院要开工了，用Python看一看最近有什么刚上映的电影

本文链接：https://liuyixiang.com/post/115990.html

上一篇 : 记一次抓包和破解App接口

下一篇 : 巩固复习(Hany驿站原创)_python的礼物

评论列表暂无评论

发表评论

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29

电影院要开工了，用Python看一看最近有什么刚上映的电影

选择打赏方式：

选择分享方式：

Petter

101481

12

121484300

电影院要开工了，用Python看一看最近有什么刚上映的电影

选择打赏方式：

选择分享方式：

Petter

101481

12

121484300

User Login

帐号或密码错误,请重试.