ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

这个 Request URL 长得好不一样

2021-04-05 17:54:32  阅读:87  来源: 互联网

标签:网页 URL base64 Request 长得 直接 data 图片


有朋友拿到一个网站请求的链接问这要怎么解密?

图片

很明显这不是加密的数据,这是一张图片 base64 后的结果,第一次写爬虫朋友遇到这样的请求,可能需要琢磨一下这是什么东西。

如果有遇到类似数据,可以直接将这段数据复制到浏览器地址栏中打开,简单直接。

网站图片这样处理有什么好处呢?

其实这类 data 类型的 URL 格式很早的时候就在 RFC239 中提出了,这样可以在网页中直接嵌入图片,而在这类 data 类型的 URL 运用之前,网站页面上不管任何一张图片,都需要在 img 标签中指定从哪里导入,也就是是外挂图片。

如果实现了data类型的 Url 格式,这个文件就可以直接从页面文件内部读入了, 这样大大减少了网站服务器请求的频率,降低了 URL 负载,不过同样的也加大了网页的体积,有利有弊。

我们生活中其实也有用到这样的 data 类型的 URL ,直接在浏览器中选择保存网页,之后查看保存的网页的源码就可以发现类似文章开头图片中的代码。

data 类型的 URL 在爬虫中有什么用?

比较多的用处是存储图文数据,比如微信公众号,博客文章等等,但是有一个问题就是图片转化后的字符体积可能比直接存储原图还要大,这就比较尴尬了。

我们可以直接使用下面的代码将图片转化为 base64

# -*- coding: utf-8 -*-import base64with open(pngpath,"rb") as f: # b64encode是编码,    base64_data = base64.b64encode(f.read()) # b64decode是解码 # base64.b64decode(base64data) print(base64_data)

之后直接在 html 中使用下面的代码即可。

<img src="data:image/jpg;base64,这里是转化后的base64的编码"/>



标签:网页,URL,base64,Request,长得,直接,data,图片
来源: https://blog.51cto.com/15127522/2686175

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有