开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 9716|回复: 2
收起左侧

[源码分享] 【python爬虫】获取豆瓣最新热门电影名称和评分

[复制链接]

结帖率:95% (21/22)
发表于 2022-12-17 09:31:58 | 显示全部楼层 |阅读模式   广东省佛山市
获取豆瓣最新热门电影名称和评分

2022年12月17日

最新电影
电影名: 航海王:红发歌姬, 豆瓣评分:7.2
电影名: 悲情三角, 豆瓣评分:7.5
电影名: 吉尔莫·德尔·托罗的匹诺曹, 豆瓣评分:8.0
电影名: 解放黑奴, 豆瓣评分:7.5
电影名: 爱在空气中 番外篇, 豆瓣评分:8.6
电影名: 我记得, 豆瓣评分:7.2
电影名: 亲密, 豆瓣评分:8.1
电影名: 沼泽深处的女孩, 豆瓣评分:7.7
电影名: 分手的决心, 豆瓣评分:7.6
电影名: 名侦探柯南:万圣节的新娘, 豆瓣评分:7.4
电影名: 黑亚当, 豆瓣评分:5.7
电影名: 查泰莱夫人的情人, 豆瓣评分:6.6
电影名: 坠落, 豆瓣评分:7.2
电影名: 塔尔, 豆瓣评分:7.4
电影名: 山怪巨魔, 豆瓣评分:5.3
电影名: 福尔摩斯小姐:伦敦厄运, 豆瓣评分:6.5
电影名: 明日战记, 豆瓣评分:6.3
电影名: 晒后假日, 豆瓣评分:8.0
电影名: 梦乡, 豆瓣评分:7.5
电影名: 西线无战事, 豆瓣评分:8.5
电影名: 乐土, 豆瓣评分:8.4
电影名: 她说, 豆瓣评分:7.9
电影名: 6/45, 豆瓣评分:7.7
电影名: 圣蛛, 豆瓣评分:7.3
电影名: 地狱尖兵, 豆瓣评分:8.1
电影名: 世界末日, 豆瓣评分:7.0
电影名: 鳄鱼莱莱, 豆瓣评分:6.8
电影名: 危笑, 豆瓣评分:6.3
电影名: 珀尔, 豆瓣评分:7.3
电影名: 子弹列车, 豆瓣评分:7.9
电影名: 共助2:国际, 豆瓣评分:7.1
电影名: 有史以来最棒的啤酒运送, 豆瓣评分:7.8
电影名: 巴黎夜旅人, 豆瓣评分:8.1
电影名: 阿姆斯特丹, 豆瓣评分:5.8
电影名: 狩猎, 豆瓣评分:7.7
电影名: 宿敌, 豆瓣评分:8.6
电影名: 雷神4:爱与雷霆, 豆瓣评分:5.4
电影名: 天鹅挽歌, 豆瓣评分:8.1
电影名: 新神榜:杨戬, 豆瓣评分:7.0
电影名: 海的尽头是草原, 豆瓣评分:7.2
电影名: 魔法奇缘2:解除魔法, 豆瓣评分:6.1
电影名: 蜡笔小新:好别致的影分身, 豆瓣评分:8.5
电影名: 新·奥特曼, 豆瓣评分:6.7
电影名: 狼狩猎, 豆瓣评分:5.8
电影名: 余命10年, 豆瓣评分:7.1
电影名: 看他们如何逃之夭夭, 豆瓣评分:6.4
电影名: 野蛮人, 豆瓣评分:6.8
电影名: 妈妈!, 豆瓣评分:7.5
电影名: 良心护士, 豆瓣评分:6.9
电影名: 小黄人大眼萌:神偷奶爸前传, 豆瓣评分:7.1

python代码如下:
[Python] 纯文本查看 复制代码
import time
from bs4 import BeautifulSoup
import requests


def get_one_page_data():
    global lines
    lines = ''
    global headers
    headers = {
        'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.132 Safari/537.36',
        'referer': 'http://movie.mtime.com/'
    }

    # 获取热门电影列表  UrlDecode解码 %E7%83%AD%E9%97%A8 = 热门
    res = requests.get(
        'https://movie.douban.com/j/search_subjects?type=movie&tag=%E7%83%AD%E9%97%A8&page_limit=50&page_start=0',
        headers=headers)
    # print(res.text)
    lines = '最新电影'+ '\r\n'
    for i in range(50):
        title = res.json()['subjects']['title']
        rate = res.json()['subjects']['rate']
        lines = lines + '电影名: ' + title + ', 豆瓣评分:' + rate + '\r\n'

    print(lines)




if __name__ == '__main__':
    get_one_page_data()

结帖率:95% (21/22)

签到天数: 8 天

 楼主| 发表于 2022-12-18 13:53:40 | 显示全部楼层   广东省佛山市
hujunchao 发表于 2022-12-17 11:54
为什么复制了代码不能运行  后面 无法识别

因为精易论坛的这个代码识别有问题,你把尖括号<>改为中括号[]就可以了
回复 支持 反对

使用道具 举报

发表于 2022-12-17 11:54:32 | 显示全部楼层   河北省邢台市
为什么复制了代码不能运行  后面</i></i> 无法识别
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表