打造最全皮肤,Python采集游戏官网数据!
yuyutoo 2024-10-27 17:02 6 浏览 0 评论
环境:
- Python3.6.5
- Windows
- pycharm
模块:
- requests
- jsonpath
- urlretrieve
- os
思路:
进入LOL官网点击游戏资料库后,所有的英雄都在里面。
我们点击英雄头像,就会跳转到包含皮肤的界面。
立马就想到了思路:
获取到中间跳转的url,然后再请求该url跳转到皮肤页面-----然后再抓取皮肤。
思路没错,但html源代码中没有跳转的url呢?是不是就需要抓包!
elements中确实有该url,但是html源代码中并没有:
开始抓包吧:
很多人做到这里无从下手了,并没有跳转的url,但是我们可以发现跳转的url只有后面的数字ID发生了变化。
而我们的banaudio这个标签当中的url末尾是不是也有个1.ogg?与我们的跳转url中的ID值1是对应的!
所以,获取到数字即可,自行构造跳转的url。
到了跳转页面后,会发现网页源代码中同样不存在我们想要的图片数据(继续抓包):
OK,现在问题解决了!
更多python技术相关教程,直接私我即可!
python源码:
#!/usr/bin/python3
# -*- coding: utf-8 -*-
# @Time : 2019/10/9 21:20
# @Author : 善念
import requests
import jsonpath
from urllib.request import urlretrieve
import os
def get_id():
req = requests.get('https://game.gtimg.cn/images/lol/act/img/js/heroList/hero_list.js').json()
ids = jsonpath.jsonpath(req, '$..banAudio')
items = []
for id in ids:
id = id.split('ban/')[1][0:-4]
items.append(id)
return items
def get_skin(items):
for item in items:
url = 'https://game.gtimg.cn/images/lol/act/img/js/hero/{}.js'.format(item)
req = requests.get(url, headers=headers).json()
skins = req['skins']
names = jsonpath.jsonpath(skins, '$..name')
skins = jsonpath.jsonpath(req, '$..loadingImg')
try:
if not os.path.exists(names[0]):
os.mkdir(names[0])
for name, skin in zip(names, skins):
print('正在采集====={}=====这个皮肤'.format(name))
urlretrieve(skin, names[0]+'/'+name+'.jpg')
except:
pass
def go():
items = get_id()
get_skin(items)
if __name__ == '__main__':
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) '
'AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36'}
go()
效果图:
相关推荐
- 网络规划建设原来也可以这么简单!
-
废话少说,直接上干货。天气炎热,请各位看官老爷静心阅读。整体思路下图是关于网络建设的所有相关领域,接下来我为大家逐一讲解。网络分层...
- 网络规划设计师笔记-第 1 章 计算机网络原理
-
计算机网络原理1.1计算机网络概论(P1-10)...
- 别输在远见上,网工这样做职业规划,比啥都强
-
01职业中的规划,人生中的buff“职业规划“这个词,其实对很多年轻人,包括曾经年轻的我来说,都不屑一提。...
- 网络规划设计师学习中(个人自学笔记分享1),有一起学习的吗?
-
网络规划设计师,上午考试内容学习:第一章:计算机网络概述(上部分):如果你也在一起学习,那么我们来一起学习吧!坚持1年,争取明年一次性通过!...
- 在微服务中使用 ASP.NET Core 实现事件溯源和 CQRS
-
概述:事件溯源和命令查询责任分离(CQRS)已成为解决微服务设计的复杂性的强大架构模式。基本CQRS表示形式在本文中,我们将探讨ASP.NETCore如何使你能够将事件溯源和CQRS...
- 用 Nginx 部署 ASP.NET Core 应用程序
-
用Nginx部署ASP.NETCore应用程序步骤如下:在Linux中安装.NETCore运行时和Nginx:...
- Asp.net Core启动流程讲解(一)(asp.net core 入门)
-
asp.netcore默认项目包括项目根目录级的Startup.cs、Program.cs、appsettings.json(appsettings.Development.json)launch...
- 十天学会ASP之第五天(十天学会asp教程)
-
学习目的:学会数据库的基本操作1(写入记录)数据库的基本操作无非是:查询记录,写入记录,删除记录,修改记录。今天我们先学习写入记录。先建立一个表单:<formname="form1"met...
- ASP.NET Core 的 WebApplication 类
-
ASP.NETCore提供了3个主机类(Host)。这些类用于配置应用、管理生命周期和启动Web服务。...
- ASP.NET Core中的键控依赖注入(.net依赖注入原理)
-
大家好,我是深山踏红叶,今天我们来聊一聊ASP.NETCore中的FromKeyedServices,它是在.Net8中引入的。这一特性允许通过键(如字符串或枚举)来注册和检索依赖注入(D...
- Asp.net常用方法及request和response-a
-
asp.net教程asp.net常用方法:1、Request.UrlReferrer请求的来源,可以根据这个判断从百度搜的哪个关键词、防下载盗链、防图片盗链,可以伪造(比如迅雷)。(使用全局一般处理...
- asp.net常考面试题(aspnet题库)
-
asp.net常考面试题一,列举ASP.Net页面之间传递值的几种方式?1,使用QueryString,如:......?id=1;response.Redirect()......2,使用Sessi...
- 在Windows系统搭建.NET Core环境并创建运行ASP.NET网站
-
微软于6月27日在红帽DevNation峰会上正式发布了.NETCore1.0、ASP.NET1.0和EntityFrameworkCore1.0,其将全部支持Windows、OSX和...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- mybatis plus (70)
- scheduledtask (71)
- css滚动条 (60)
- java学生成绩管理系统 (59)
- 结构体数组 (69)
- databasemetadata (64)
- javastatic (68)
- jsp实用教程 (53)
- fontawesome (57)
- widget开发 (57)
- vb net教程 (62)
- hibernate 教程 (63)
- case语句 (57)
- svn连接 (74)
- directoryindex (69)
- session timeout (58)
- textbox换行 (67)
- extension_dir (64)
- linearlayout (58)
- vba高级教程 (75)
- iframe用法 (58)
- sqlparameter (59)
- trim函数 (59)
- flex布局 (63)
- contextloaderlistener (56)