Python网络爬虫权威指南(第2版) 🔍
瑞安·米切尔; 神烦小宝
人民邮电出版社, 图灵程序设计丛书, 2, 2019
中文 [zh] · PDF · 10.1MB · 2019 · 📘 非小说类图书 · 🚀/duxiu/lgli/lgrs/nexusstc/zlib · Save
描述
本书采用简洁强大的 Python 语言,介绍了网页抓取相关技术,并为抓取新式网络中的各种数
据类型提供了全面的指导。第一部分重点介绍网页抓取的基本原理 :如何用 Python 从网络服务器
请求信息,如何对服务器的响应进行基本处理,以及如何以自动化手段与网站进行交互。第二部
分介绍如何用网络爬虫测试网站,自动化处理,以及如何通过更多的方式接入网络。
本书适合需要抓取 Web 数据的相关软件开发人员和研究人员阅读。
据类型提供了全面的指导。第一部分重点介绍网页抓取的基本原理 :如何用 Python 从网络服务器
请求信息,如何对服务器的响应进行基本处理,以及如何以自动化手段与网站进行交互。第二部
分介绍如何用网络爬虫测试网站,自动化处理,以及如何通过更多的方式接入网络。
本书适合需要抓取 Web 数据的相关软件开发人员和研究人员阅读。
备用文件名
nexusstc/Python网络爬虫权威指南/cca7dffa7cefb827498e8b2a2a17441f.pdf
备用文件名
lgrsnf/Python网络爬虫权威指南(第 2 版) by 米切尔 .pdf
备用文件名
zlib/Computers/瑞安·米切尔; 神烦小宝/Python网络爬虫权威指南_17009675.pdf
备选标题
Python Web Crawler Authoritative Guide 2nd Edition(Chinese Edition)
备选标题
Python网络爬虫权威指南 = Web scraping with Python
备选作者
Ryan Mitchell; O'Reilly for Higher Education (Firm),; Safari, an O'Reilly Media Company
备选作者
[ MEI ] , RUI AN · MI QIE ER ( Ryan DENG
备选作者
【美】瑞安·米切尔(Ryan Mitchell) 著
备选作者
米切尔 (Mitchell, Ryan)
备用出版商
The People's Posts and Telecommunications Publishing House
备用出版商
Posts & Telecom Press
备用出版商
People Post Press
备用版本
Tu ling cheng xu she ji cong shu, Di 1 ban, Beijing, 2019
备用版本
2nd edition, Erscheinungsort nicht ermittelbar, 2019
备用版本
China, People's Republic, China
元数据中的注释
lg3091047
元数据中的注释
{"edition":"2","isbns":["7115509263","9787115509260"],"last_page":266,"publisher":"人民邮电出版社","series":"图灵程序设计丛书"}
元数据中的注释
Type: 当代图书
元数据中的注释
Type: modern
备用描述
封面
推荐阅读
数字版权声明
扉页
版权
版权声明
O’Reilly Media, Inc.介绍
目录
前言
第一部分 创建爬虫
第1章
第1章 初见网络爬虫
1.1 网络连接
1.2 BeautifulSoup简介
1.2.1 安装BeautifulSoup
1.2.2 运行BeautifulSoup
1.2.3 可靠的网络连接以及异常的处理
第2章 复杂HTML解析
2.1 不是一直都要用锤子
2.2 再端一碗BeautifulSoup
2.2.1 BeautifulSoup的find()和find_all()
2.2.2 其他BeautifulSoup对象
2.2.3 导航树
2.3 正则表达式
2.4 正则表达式和BeautifulSoup
2.5 获取属性
2.6 Lambda表达式
第3章 编写网络爬虫
3.1 遍历单个域名
3.2 抓取整个网站
收集整个网站的数据
3.3 在互联网上抓取
第4章 网络爬虫模型
4.1 规划和定义对象
4.2 处理不同的网站布局
4.3 结构化爬虫
4.3.1 通过搜索抓取网站
4.3.2 通过链接抓取网站
4.3.3 抓取多种类型的页面
4.4 关于网络爬虫模型的思考
第5章 Scrapy
5.1 安装Scrapy
蜘蛛初始化
5.2 创建一个简易爬虫
5.3 带规则的抓取
5.4 创建item
5.5 输出item
5.6 item管线组件
5.7 Scrapy日志管理
5.8 更多资源
第6章 存储数据
6.1 媒体文件
6.2 把数据存储到CSV
6.3 MySQL
6.3.1 安装MySQL
6.3.2 基本命令
6.3.3 与Python整合
6.3.4 数据库技术与最佳实践
6.3.5 MySQL里的“六度空间游戏”
6.4 Email
第二部分 高级网页抓取
第7章 读取文档
7.1 文档编码
7.2 纯文本
文本编码和全球互联网
7.3 CSV
读取CSV文件
7.4 PDF
7.5 微软Word和.docx
第8章 数据清洗
8.1 编写代码清洗数据
数据标准化
8.2 数据存储后再清洗
OpenRefine
第9章 自然语言处理
9.1 概括数据
9.2 马尔可夫模型
维基百科六度分隔:终结篇
9.3 自然语言工具包
9.3.1 安装与设置
9.3.2 用NLTK做统计分析
9.3.3 用NLTK做词性分析
9.4 其他资源
第10章 穿越网页表单与登录窗口进行抓取
10.1 Python Requests库
10.2 提交一个基本表单
10.3 单选按钮、复选框和其他输入
10.4 提交文件和图像
10.5 处理登录和cookie
HTTP基本接入认证
10.6 其他表单问题
第11章 抓取JavaScript
11.1 JavaScript简介
常用JavaScript库
11.2 Ajax和动态HTML
11.2.1 在Python中用Selenium执行JavaScript
11.2.2 Selenium的其他webdriver
11.3 处理重定向
11.4 关于JavaScript的最后提醒
第12章 利用API抓取数据
12.1 API概述
12.1.1 HTTP方法和API
12.1.2 更多关于API响应的介绍
12.2 解析JSON数据
12.3 无文档的API
12.3.1 查找无文档的API
12.3.2 记录未被记录的API
12.3.3 自动查找和记录API
12.4 API与其他数据源结合
12.5 再说一点API
第13章 图像识别与文字处理
13.1 OCR库概述
13.1.1 Pillow
13.1.2 Tesseract
13.1.3 NumPy
13.2 处理格式规范的文字
13.2.1 自动调整图像
13.2.2 从网站图片中抓取文字
13.3 读取验证码与训练Tesseract
训练Tesseract
13.4 获取验证码并提交答案
第14章 避开抓取陷阱
14.1 道德规范
14.2 让网络机器人看着像人类用户
14.2.1 修改请求头
14.2.2 用JavaScript处理cookie
14.2.3 时间就是一切
14.3 常见表单安全措施
14.3.1 隐含输入字段值
14.3.2 避免蜜罐
14.4 问题检查表
第15章 用爬虫测试网站
15.1 测试简介
什么是单元测试
15.2 Python单元测试
测试维基百科
15.3 Selenium单元测试
与网站进行交互
15.4 单元测试与Selenium单元测试的选择
第16章 并行网页抓取
16.1 进程与线程
16.2 多线程抓取
16.2.1 竞争条件与队列
16.2.2 threading模块
16.3 多进程抓取
16.3.1 多进程抓取
16.3.2 进程间通信
16.4 多进程抓取的另一种方法
第17章 远程抓取
17.1 为什么要用远程服务器
17.1.1 避免IP地址被封杀
17.1.2 移植性与扩展性
17.2 Tor代理服务器
PySocks
17.3 远程主机
17.3.1 从网站主机运行
17.3.2 从云主机运行
17.4 其他资源
第18章 网页抓取的法律与道德约束
18.1 商标、版权、专利
版权法
18.2 侵害动产
18.3 计算机欺诈与滥用法
18.4 robots.txt和服务协议
18.5 3个网络爬虫
18.5.1 eBay起诉Bidder’s Edge侵害其动产
18.5.2 美国政府起诉Auernheimer与《计算机欺诈与滥用法》
18.5.3 Field起诉Google:版权和robots.txt
18.6 勇往直前
关于作者
关于封面
关于作者
关于封面
图书推荐
连接图灵
看完了
推荐阅读
数字版权声明
扉页
版权
版权声明
O’Reilly Media, Inc.介绍
目录
前言
第一部分 创建爬虫
第1章
第1章 初见网络爬虫
1.1 网络连接
1.2 BeautifulSoup简介
1.2.1 安装BeautifulSoup
1.2.2 运行BeautifulSoup
1.2.3 可靠的网络连接以及异常的处理
第2章 复杂HTML解析
2.1 不是一直都要用锤子
2.2 再端一碗BeautifulSoup
2.2.1 BeautifulSoup的find()和find_all()
2.2.2 其他BeautifulSoup对象
2.2.3 导航树
2.3 正则表达式
2.4 正则表达式和BeautifulSoup
2.5 获取属性
2.6 Lambda表达式
第3章 编写网络爬虫
3.1 遍历单个域名
3.2 抓取整个网站
收集整个网站的数据
3.3 在互联网上抓取
第4章 网络爬虫模型
4.1 规划和定义对象
4.2 处理不同的网站布局
4.3 结构化爬虫
4.3.1 通过搜索抓取网站
4.3.2 通过链接抓取网站
4.3.3 抓取多种类型的页面
4.4 关于网络爬虫模型的思考
第5章 Scrapy
5.1 安装Scrapy
蜘蛛初始化
5.2 创建一个简易爬虫
5.3 带规则的抓取
5.4 创建item
5.5 输出item
5.6 item管线组件
5.7 Scrapy日志管理
5.8 更多资源
第6章 存储数据
6.1 媒体文件
6.2 把数据存储到CSV
6.3 MySQL
6.3.1 安装MySQL
6.3.2 基本命令
6.3.3 与Python整合
6.3.4 数据库技术与最佳实践
6.3.5 MySQL里的“六度空间游戏”
6.4 Email
第二部分 高级网页抓取
第7章 读取文档
7.1 文档编码
7.2 纯文本
文本编码和全球互联网
7.3 CSV
读取CSV文件
7.4 PDF
7.5 微软Word和.docx
第8章 数据清洗
8.1 编写代码清洗数据
数据标准化
8.2 数据存储后再清洗
OpenRefine
第9章 自然语言处理
9.1 概括数据
9.2 马尔可夫模型
维基百科六度分隔:终结篇
9.3 自然语言工具包
9.3.1 安装与设置
9.3.2 用NLTK做统计分析
9.3.3 用NLTK做词性分析
9.4 其他资源
第10章 穿越网页表单与登录窗口进行抓取
10.1 Python Requests库
10.2 提交一个基本表单
10.3 单选按钮、复选框和其他输入
10.4 提交文件和图像
10.5 处理登录和cookie
HTTP基本接入认证
10.6 其他表单问题
第11章 抓取JavaScript
11.1 JavaScript简介
常用JavaScript库
11.2 Ajax和动态HTML
11.2.1 在Python中用Selenium执行JavaScript
11.2.2 Selenium的其他webdriver
11.3 处理重定向
11.4 关于JavaScript的最后提醒
第12章 利用API抓取数据
12.1 API概述
12.1.1 HTTP方法和API
12.1.2 更多关于API响应的介绍
12.2 解析JSON数据
12.3 无文档的API
12.3.1 查找无文档的API
12.3.2 记录未被记录的API
12.3.3 自动查找和记录API
12.4 API与其他数据源结合
12.5 再说一点API
第13章 图像识别与文字处理
13.1 OCR库概述
13.1.1 Pillow
13.1.2 Tesseract
13.1.3 NumPy
13.2 处理格式规范的文字
13.2.1 自动调整图像
13.2.2 从网站图片中抓取文字
13.3 读取验证码与训练Tesseract
训练Tesseract
13.4 获取验证码并提交答案
第14章 避开抓取陷阱
14.1 道德规范
14.2 让网络机器人看着像人类用户
14.2.1 修改请求头
14.2.2 用JavaScript处理cookie
14.2.3 时间就是一切
14.3 常见表单安全措施
14.3.1 隐含输入字段值
14.3.2 避免蜜罐
14.4 问题检查表
第15章 用爬虫测试网站
15.1 测试简介
什么是单元测试
15.2 Python单元测试
测试维基百科
15.3 Selenium单元测试
与网站进行交互
15.4 单元测试与Selenium单元测试的选择
第16章 并行网页抓取
16.1 进程与线程
16.2 多线程抓取
16.2.1 竞争条件与队列
16.2.2 threading模块
16.3 多进程抓取
16.3.1 多进程抓取
16.3.2 进程间通信
16.4 多进程抓取的另一种方法
第17章 远程抓取
17.1 为什么要用远程服务器
17.1.1 避免IP地址被封杀
17.1.2 移植性与扩展性
17.2 Tor代理服务器
PySocks
17.3 远程主机
17.3.1 从网站主机运行
17.3.2 从云主机运行
17.4 其他资源
第18章 网页抓取的法律与道德约束
18.1 商标、版权、专利
版权法
18.2 侵害动产
18.3 计算机欺诈与滥用法
18.4 robots.txt和服务协议
18.5 3个网络爬虫
18.5.1 eBay起诉Bidder’s Edge侵害其动产
18.5.2 美国政府起诉Auernheimer与《计算机欺诈与滥用法》
18.5.3 Field起诉Google:版权和robots.txt
18.6 勇往直前
关于作者
关于封面
关于作者
关于封面
图书推荐
连接图灵
看完了
备用描述
作为一种采集和理解网络上海量信息的方式,网页抓取技术变得越来越重要。而编写简单的自动化程序(网络爬虫),一次就可以自动抓取上百万个网页中的信息,实现高效的数据采集和处理,满足大量数据需求应用场景。 本书采用简洁强大的Python语言,全面介绍网页抓取技术,解答诸多常见问题,是掌握从数据爬取到数据清洗全流程的系统实践指南。书中内容分为两部分。第一部分深入讲解网页抓取的基础知识,重点介绍BeautifulSoup、Scrapy等Python库的应用。第二部分介绍网络爬虫编写相关的主题,以及各种数据抓取工具和应用程序,帮你深入互联网的每个角落,分析原始数据,获取数据背后的故事,轻松解决遇到的各类网页抓取问题。第2版全面更新,新增网络爬虫模型、Scrapy和并行网页抓取相关章节。 解析复杂的HTML页面 使用Scrapy框架开发爬虫 学习存储数据的方法 从文档中读取和提取数据 清洗格式糟糕的数据 自然语言处理 通过表单和登录窗口抓取数据 抓取JavaScript及利用API抓取数据 图像识别与文字处理 避免抓取陷阱和反爬虫策略 使用爬虫测试网站
开源日期
2021-08-19
ISBN-13978-7-115-50926-0
ISBN-107-115-50926-3
CADAL SSNOZY45580
OCLC1178845456
OCLC1256384995
OCLC1258269085
AacIdaacid__duxiu_records__20240130T000000Z__99XcdsDjzbcJSymuGywHSs
AacIdaacid__duxiu_records__20240130T000000Z__Zy6tg6vzkLK7LxZvAHW8e3
AacIdaacid__gbooks_records__20240920T051416Z__RD69tzZEaiH2VS9DgRGiDP
AacIdaacid__isbngrp_records__20240920T194930Z__AjLpMpBj8DktXsEqeMRmnv
AacIdaacid__nexusstc_records__20240516T153335Z__AMDzXFjQhNUNcvXwupT5j5
AacIdaacid__worldcat__20250804T000000Z__2HxcR2PjWcAeaK46x8WDMP
AacIdaacid__worldcat__20250804T000000Z__5tqoZsbSCX9oyWkZSVsMEq
AacIdaacid__worldcat__20250804T000000Z__6syRFubpTRYceVFMmPNqVJ
AacIdaacid__worldcat__20250804T000000Z__7EJjaQ6FAjhE8VTmcCvMPv
AacIdaacid__worldcat__20250804T000000Z__7Uf7DbBVN4jydMLeXN5GKj
AacIdaacid__worldcat__20250804T000000Z__A76eRfKbGMpHcVC2WfW7nn
AacIdaacid__worldcat__20250804T000000Z__FU7qat2KhLaGsoW9xfAqWK
AacIdaacid__worldcat__20250804T000000Z__HoC2MLTNb7CS6qAbjkdRW7
AacIdaacid__worldcat__20250804T000000Z__WFhSghJTa3mGKJsJFfA4Gc
AacIdaacid__worldcat__20250804T000000Z__arwJSPMHEihHpxeegAc55v
AacIdaacid__worldcat__20250804T000000Z__ip28YTtpHLcX8Evzkq3CfR
AacIdaacid__worldcat__20250804T000000Z__mDGrjvL5WjiypjFmwiGkD7
AacIdaacid__worldcat__20250804T000000Z__nhggCkxsDSHn9bURjsZrDf
AacIdaacid__zlib3_records__20240809T190427Z__17009675__jduTBwv3MvHZ5cgFJawZPb
AA Record IDmd5:cca7dffa7cefb827498e8b2a2a17441f
Collectionduxiu
Collectionlgli
Collectionlgrs
Collectionnexusstc
Collectionzlib
Content Typebook_nonfiction
SHA-2567800ebfe
DuXiu Source Scrape Date2024-01-30
Google Books Source Scrape Date2024-09-20
ISBNdb Scrape Date2022-09-01
ISBN GRP Source Scrape Date2024-09-20
Libgen.li Source Date2021-08-19
Libgen.rs Non-Fiction Date2021-08-19
Nexus/STC Source issued_at Date2019-01-01
Nexus/STC Source Updated Date2024-05-16
OCLC Scrape Date2025-01-01
Z-Library Source Date2021-08-19
Filepathlgli/U:\libgen_is_new\3056000/cca7dffa7cefb827498e8b2a2a17441f..pdf
Filepathlgrsnf/Python网络爬虫权威指南(第 2 版) by 米切尔 .pdf
Filepathnexusstc/Python网络爬虫权威指南/cca7dffa7cefb827498e8b2a2a17441f.pdf
Filepathzlib/Computers/瑞安·米切尔; 神烦小宝/Python网络爬虫权威指南_17009675.pdf
Filesize10120355
Google Bookszc62zQEACAAJ
IPFS CIDQmcZcAYGmmk9pn9EXZRb6VGYJTMamyQLjTP7dRAp5MfRWS
IPFS CIDbafykbzaceapuphnx5oxw72u3qv3w6vrg2do6upaqavbzyovm2ef63gir36lp6
ISBN GRP ID07b56737dad9e350a1ad1624ae872c13
Languagezh
Libgen.li File94057833
Libgen.li libgen_id3091047
Libgen.rs Non-Fiction3056897
Libgen.rs Non-Fiction Topiccomputers
MD5cca7dffa7cefb827498e8b2a2a17441f
Nexus/STCaejyx2i9k0s8ejpcxc98k2lht
OCLC Editions1
OCLC Editions (from search_holdings_summary_all_editions)1
OCLC 'From Filename'range_query/7115509###
OCLC 'From Filename'range_query/7115509###____2
OCLC 'From Filename'range_query/7115509###____3
OCLC 'From Filename'range_query/backup_7115509###____2
OCLC 'From Filename'range_query/backup_7115509###____3
OCLC 'From Filename'search_holdings_all_editions_response/2025-05-23_21.tar/1178845456
OCLC 'From Filename'search_holdings_all_editions_response/2025-08-19_22.tar/1256384995
OCLC 'From Filename'search_holdings_all_editions_response_type/1178845456
OCLC 'From Filename'search_holdings_all_editions_response_type/1256384995
OCLC 'From Filename'search_holdings_summary_all_editions/1178845456/index/55357178
OCLC 'From Filename'search_holdings_summary_all_editions/1256384995/index/59481405
OCLC 'From Filename'w2/v6/1040/1040862677
OCLC 'From Filename'w2/v7/1272/1272570306
OCLC 'From Filename'w2/v7/4266/426626780
OCLC 'From Filename'w2/v7/8860/886006692
OCLC Holdings13
OCLC Holdings3
OCLC Holdings+Editions (to find rare books)13/1
OCLC Holdings+Editions (to find rare books)3/1
OCLC Holdings+Editions+LibraryID (to find rare books)13/1/18342
OCLC Holdings+Editions+LibraryID (to find rare books)13/1/18492
OCLC Holdings+Editions+LibraryID (to find rare books)13/1/18573
OCLC Holdings+Editions+LibraryID (to find rare books)13/1/18593
OCLC Holdings+Editions+LibraryID (to find rare books)13/1/18596
OCLC Holdings+Editions+LibraryID (to find rare books)13/1/64579
OCLC Holdings+Editions+LibraryID (to find rare books)13/1/87410
OCLC Holdings+Editions+LibraryID (to find rare books)13/1/87413
OCLC Holdings+Editions+LibraryID (to find rare books)3/1/112222
OCLC Holdings (from library_ids)1
OCLC Holdings (from library_ids)8
OCLC Holdings (from search_holdings_all_editions_response)1
OCLC Holdings (from search_holdings_all_editions_response)8
OCLC Holdings (from search_holdings_summary_all_editions)13
OCLC Holdings (from search_holdings_summary_all_editions)3
OCLC ISBNs+Holdings+Editions (to find rare books)2/13/1
OCLC ISBNs+Holdings+Editions (to find rare books)2/3/1
OCLC ISBNs+Holdings+Editions+LibraryID (to find rare books)2/13/1/18342
OCLC ISBNs+Holdings+Editions+LibraryID (to find rare books)2/13/1/18492
OCLC ISBNs+Holdings+Editions+LibraryID (to find rare books)2/13/1/18573
OCLC ISBNs+Holdings+Editions+LibraryID (to find rare books)2/13/1/18593
OCLC ISBNs+Holdings+Editions+LibraryID (to find rare books)2/13/1/18596
OCLC ISBNs+Holdings+Editions+LibraryID (to find rare books)2/13/1/64579
OCLC ISBNs+Holdings+Editions+LibraryID (to find rare books)2/13/1/87410
OCLC ISBNs+Holdings+Editions+LibraryID (to find rare books)2/13/1/87413
OCLC ISBNs+Holdings+Editions+LibraryID (to find rare books)2/3/1/112222
OCLC Library ID112222
OCLC Library ID18342
OCLC Library ID18492
OCLC Library ID18573
OCLC Library ID18593
OCLC Library ID18596
OCLC Library ID64579
OCLC Library ID87410
OCLC Library ID87413
Server Pathg4/libgenrs_nonfiction/libgenrs_nonfiction/3056000/cca7dffa7cefb827498e8b2a2a17441f
SHA-129999f3d103a51e0a634835c1560e72dfaa9c32b
SHA-25660c8de6a6b5df8f408b5c9228ed3fec00053dd00e47f3364945ca78de05f35a8
Torrentexternal/libgen_rs_non_fic/r_3056000.torrent
Year2019
Z-Library17009675
Zlib Category ID10
Zlib Category NameComputers
ISBN-13:
978-7-115-50926-0 / 9787115509260
ISBN-10:
7-115-50926-3 / 7115509263
代码浏览器: 在代码浏览器中查看“isbn10:7115509263”
CADAL SSNO:
ZY45580
网站: /datasets/duxiu
AacId:
aacid__duxiu_records__20240130T000000Z__99XcdsDjzbcJSymuGywHSs
Anna’s Archive Container identifier.
AacId:
aacid__duxiu_records__20240130T000000Z__Zy6tg6vzkLK7LxZvAHW8e3
Anna’s Archive Container identifier.
AacId:
aacid__gbooks_records__20240920T051416Z__RD69tzZEaiH2VS9DgRGiDP
Anna’s Archive Container identifier.
AacId:
aacid__isbngrp_records__20240920T194930Z__AjLpMpBj8DktXsEqeMRmnv
Anna’s Archive Container identifier.
AacId:
aacid__nexusstc_records__20240516T153335Z__AMDzXFjQhNUNcvXwupT5j5
Anna’s Archive Container identifier.
AacId:
aacid__worldcat__20250804T000000Z__2HxcR2PjWcAeaK46x8WDMP
Anna’s Archive Container identifier.
AacId:
aacid__worldcat__20250804T000000Z__5tqoZsbSCX9oyWkZSVsMEq
Anna’s Archive Container identifier.
AacId:
aacid__worldcat__20250804T000000Z__6syRFubpTRYceVFMmPNqVJ
Anna’s Archive Container identifier.
AacId:
aacid__worldcat__20250804T000000Z__7EJjaQ6FAjhE8VTmcCvMPv
Anna’s Archive Container identifier.
AacId:
aacid__worldcat__20250804T000000Z__7Uf7DbBVN4jydMLeXN5GKj
Anna’s Archive Container identifier.
AacId:
aacid__worldcat__20250804T000000Z__A76eRfKbGMpHcVC2WfW7nn
Anna’s Archive Container identifier.
AacId:
aacid__worldcat__20250804T000000Z__FU7qat2KhLaGsoW9xfAqWK
Anna’s Archive Container identifier.
AacId:
aacid__worldcat__20250804T000000Z__HoC2MLTNb7CS6qAbjkdRW7
Anna’s Archive Container identifier.
AacId:
aacid__worldcat__20250804T000000Z__WFhSghJTa3mGKJsJFfA4Gc
Anna’s Archive Container identifier.
AacId:
aacid__worldcat__20250804T000000Z__arwJSPMHEihHpxeegAc55v
Anna’s Archive Container identifier.
AacId:
aacid__worldcat__20250804T000000Z__ip28YTtpHLcX8Evzkq3CfR
Anna’s Archive Container identifier.
AacId:
aacid__worldcat__20250804T000000Z__mDGrjvL5WjiypjFmwiGkD7
Anna’s Archive Container identifier.
AacId:
aacid__worldcat__20250804T000000Z__nhggCkxsDSHn9bURjsZrDf
Anna’s Archive Container identifier.
AacId:
aacid__zlib3_records__20240809T190427Z__17009675__jduTBwv3MvHZ5cgFJawZPb
Anna’s Archive Container identifier.
AA Record ID:
md5:cca7dffa7cefb827498e8b2a2a17441f
Anna’s Archive record ID.
Collection:
duxiu
The collection on Anna’s Archive that provided data for this record.
URL: /datasets/duxiu
网站: /datasets
代码浏览器: 在代码浏览器中查看“collection:duxiu”
Collection:
lgli
The collection on Anna’s Archive that provided data for this record.
URL: /datasets/lgli
网站: /datasets
代码浏览器: 在代码浏览器中查看“collection:lgli”
Collection:
lgrs
The collection on Anna’s Archive that provided data for this record.
URL: /datasets/lgrs
网站: /datasets
代码浏览器: 在代码浏览器中查看“collection:lgrs”
Collection:
nexusstc
The collection on Anna’s Archive that provided data for this record.
URL: /datasets/nexusstc
网站: /datasets
Collection:
zlib
The collection on Anna’s Archive that provided data for this record.
URL: /datasets/zlib
网站: /datasets
代码浏览器: 在代码浏览器中查看“collection:zlib”
Content Type:
book_nonfiction
Content type, determined by Anna’s Archive.
SHA-256:
7800ebfe
代码浏览器: 在代码浏览器中查看“crc32:7800ebfe”
DuXiu Source Scrape Date:
2024-01-30
Date Anna’s Archive scraped the DuXiu collection.
网站: /datasets/duxiu
Google Books Source Scrape Date:
2024-09-20
Date Anna’s Archive scraped the Google Books collection.
网站: /datasets/gbooks
ISBNdb Scrape Date:
2022-09-01
The date that Anna’s Archive scraped this ISBNdb record.
网站: /datasets/isbndb
ISBN GRP Source Scrape Date:
2024-09-20
Date Anna’s Archive scraped the ISBN GRP collection.
Libgen.rs Non-Fiction Date:
2021-08-19
Date Libgen.rs Non_Fiction published this file.
网站: /datasets/lgrs
Nexus/STC Source issued_at Date:
2019-01-01
Date Nexus/STC reports in their issued_at field, which is the “issuing time of the item described by record.”
Nexus/STC Source Updated Date:
2024-05-16
Date Nexus/STC last updated this record.
OCLC Scrape Date:
2025-01-01
The date that Anna’s Archive scraped this OCLC/WorldCat record.
网站: /datasets/oclc
Filepath:
lgli/U:\libgen_is_new\3056000/cca7dffa7cefb827498e8b2a2a17441f..pdf
Browse collections using their original file paths (particularly 'upload' is interesting)
Filepath:
lgrsnf/Python网络爬虫权威指南(第 2 版) by 米切尔 .pdf
Browse collections using their original file paths (particularly 'upload' is interesting)
Filepath:
nexusstc/Python网络爬虫权威指南/cca7dffa7cefb827498e8b2a2a17441f.pdf
Browse collections using their original file paths (particularly 'upload' is interesting)
Filepath:
zlib/Computers/瑞安·米切尔; 神烦小宝/Python网络爬虫权威指南_17009675.pdf
Browse collections using their original file paths (particularly 'upload' is interesting)
Filesize:
10120355
Filesize in bytes.
Google Books:
zc62zQEACAAJ
网站: /datasets/gbooks
IPFS CID:
QmcZcAYGmmk9pn9EXZRb6VGYJTMamyQLjTP7dRAp5MfRWS
Content Identifier (CID) of the InterPlanetary File System (IPFS).
IPFS CID:
bafykbzaceapuphnx5oxw72u3qv3w6vrg2do6upaqavbzyovm2ef63gir36lp6
Content Identifier (CID) of the InterPlanetary File System (IPFS).
ISBN GRP ID:
07b56737dad9e350a1ad1624ae872c13
ISBN GRP ID.
Libgen.li File:
94057833
Global file ID in Libgen.li. Directly taken from the 'f_id' field in the 'files' table.
网站: /datasets/lgli
代码浏览器: 在代码浏览器中查看“lgli:94057833”
Libgen.li libgen_id:
3091047
Repository ID for the 'libgen' repository in Libgen.li. Directly taken from the 'libgen_id' field in the 'files' table. Corresponds to the 'thousands folder' torrents.
网站: /datasets/lgli
Libgen.rs Non-Fiction:
3056897
Repository ID for the non-fiction ('libgen') repository in Libgen.rs. Directly taken from the 'id' field in the 'updated' table. Corresponds to the 'thousands folder' torrents.
网站: /datasets/lgrs
代码浏览器: 在代码浏览器中查看“lgrsnf:3056897”
Libgen.rs Non-Fiction Topic:
computers
Libgen’s own classification system of 'topics' for non-fiction books. Obtained from the 'topic' metadata field, using the 'topics' database table, which seems to have its roots in the Kolxo3 library that Libgen was originally based on. https://web.archive.org/web/20250303231041/https://wiki.mhut.org/content:bibliographic_data says that this field will be deprecated in favor of Dewey Decimal.
网站: /datasets/lgrs
MD5:
cca7dffa7cefb827498e8b2a2a17441f
Nexus/STC:
aejyx2i9k0s8ejpcxc98k2lht
ID of an individual edition of a file in Nexus/STC.
OCLC Editions:
1
Number of editions (unique OCLC IDs) reported by OCLC/WorldCat metadata. 'many' means 20 or more.
网站: /datasets/oclc
代码浏览器: 在代码浏览器中查看“oclc_editions:1”
OCLC Editions (from search_holdings_summary_all_editions):
1
网站: /datasets/oclc
OCLC 'From Filename':
range_query/7115509###
网站: /datasets/oclc
OCLC 'From Filename':
range_query/7115509###____2
网站: /datasets/oclc
OCLC 'From Filename':
range_query/7115509###____3
网站: /datasets/oclc
OCLC 'From Filename':
range_query/backup_7115509###____2
网站: /datasets/oclc
OCLC 'From Filename':
range_query/backup_7115509###____3
网站: /datasets/oclc
OCLC 'From Filename':
search_holdings_all_editions_response/2025-05-23_21.tar/1178845456
网站: /datasets/oclc
OCLC 'From Filename':
search_holdings_all_editions_response/2025-08-19_22.tar/1256384995
网站: /datasets/oclc
OCLC 'From Filename':
search_holdings_all_editions_response_type/1178845456
网站: /datasets/oclc
OCLC 'From Filename':
search_holdings_all_editions_response_type/1256384995
网站: /datasets/oclc
OCLC 'From Filename':
search_holdings_summary_all_editions/1178845456/index/55357178
网站: /datasets/oclc
OCLC 'From Filename':
search_holdings_summary_all_editions/1256384995/index/59481405
网站: /datasets/oclc
OCLC 'From Filename':
w2/v6/1040/1040862677
网站: /datasets/oclc
OCLC 'From Filename':
w2/v7/1272/1272570306
网站: /datasets/oclc
OCLC 'From Filename':
w2/v7/4266/426626780
网站: /datasets/oclc
OCLC 'From Filename':
w2/v7/8860/886006692
网站: /datasets/oclc
OCLC Holdings:
13
Number of library holdings (for all editions) reported by OCLC/WorldCat metadata. 'many' means 20 or more.
网站: /datasets/oclc
代码浏览器: 在代码浏览器中查看“oclc_holdings:13”
OCLC Holdings:
3
Number of library holdings (for all editions) reported by OCLC/WorldCat metadata. 'many' means 20 or more.
网站: /datasets/oclc
代码浏览器: 在代码浏览器中查看“oclc_holdings:3”
OCLC Holdings+Editions (to find rare books):
13/1
<number of oclc_holdings>/<number of oclc_editions>. If both numbers are low (but not zero) this might be a rare book.
网站: /datasets/oclc
OCLC Holdings+Editions (to find rare books):
3/1
<number of oclc_holdings>/<number of oclc_editions>. If both numbers are low (but not zero) this might be a rare book.
网站: /datasets/oclc
OCLC Holdings+Editions+LibraryID (to find rare books):
13/1/18342
网站: /datasets/oclc
OCLC Holdings+Editions+LibraryID (to find rare books):
13/1/18492
网站: /datasets/oclc
OCLC Holdings+Editions+LibraryID (to find rare books):
13/1/18573
网站: /datasets/oclc
OCLC Holdings+Editions+LibraryID (to find rare books):
13/1/18593
网站: /datasets/oclc
OCLC Holdings+Editions+LibraryID (to find rare books):
13/1/18596
网站: /datasets/oclc
OCLC Holdings+Editions+LibraryID (to find rare books):
13/1/64579
网站: /datasets/oclc
OCLC Holdings+Editions+LibraryID (to find rare books):
13/1/87410
网站: /datasets/oclc
OCLC Holdings+Editions+LibraryID (to find rare books):
13/1/87413
网站: /datasets/oclc
OCLC Holdings+Editions+LibraryID (to find rare books):
3/1/112222
网站: /datasets/oclc
OCLC Holdings (from library_ids):
1
网站: /datasets/oclc
OCLC Holdings (from library_ids):
8
网站: /datasets/oclc
OCLC Holdings (from search_holdings_all_editions_response):
1
网站: /datasets/oclc
OCLC Holdings (from search_holdings_all_editions_response):
8
网站: /datasets/oclc
OCLC Holdings (from search_holdings_summary_all_editions):
13
网站: /datasets/oclc
OCLC Holdings (from search_holdings_summary_all_editions):
3
网站: /datasets/oclc
OCLC ISBNs+Holdings+Editions (to find rare books):
2/13/1
网站: /datasets/oclc
OCLC ISBNs+Holdings+Editions (to find rare books):
2/3/1
网站: /datasets/oclc
OCLC ISBNs+Holdings+Editions+LibraryID (to find rare books):
2/13/1/18342
网站: /datasets/oclc
OCLC ISBNs+Holdings+Editions+LibraryID (to find rare books):
2/13/1/18492
网站: /datasets/oclc
OCLC ISBNs+Holdings+Editions+LibraryID (to find rare books):
2/13/1/18573
网站: /datasets/oclc
OCLC ISBNs+Holdings+Editions+LibraryID (to find rare books):
2/13/1/18593
网站: /datasets/oclc
OCLC ISBNs+Holdings+Editions+LibraryID (to find rare books):
2/13/1/18596
网站: /datasets/oclc
OCLC ISBNs+Holdings+Editions+LibraryID (to find rare books):
2/13/1/64579
网站: /datasets/oclc
OCLC ISBNs+Holdings+Editions+LibraryID (to find rare books):
2/13/1/87410
网站: /datasets/oclc
OCLC ISBNs+Holdings+Editions+LibraryID (to find rare books):
2/13/1/87413
网站: /datasets/oclc
OCLC ISBNs+Holdings+Editions+LibraryID (to find rare books):
2/3/1/112222
网站: /datasets/oclc
OCLC Library ID:
112222
OCLC/WorldCat partner library, from which they ingest metadata. Only added for records with less than 10 total holdings.
网站: /datasets/oclc
OCLC Library ID:
18342
OCLC/WorldCat partner library, from which they ingest metadata. Only added for records with less than 10 total holdings.
网站: /datasets/oclc
OCLC Library ID:
18492
OCLC/WorldCat partner library, from which they ingest metadata. Only added for records with less than 10 total holdings.
网站: /datasets/oclc
OCLC Library ID:
18573
OCLC/WorldCat partner library, from which they ingest metadata. Only added for records with less than 10 total holdings.
网站: /datasets/oclc
OCLC Library ID:
18593
OCLC/WorldCat partner library, from which they ingest metadata. Only added for records with less than 10 total holdings.
网站: /datasets/oclc
OCLC Library ID:
18596
OCLC/WorldCat partner library, from which they ingest metadata. Only added for records with less than 10 total holdings.
网站: /datasets/oclc
OCLC Library ID:
64579
OCLC/WorldCat partner library, from which they ingest metadata. Only added for records with less than 10 total holdings.
网站: /datasets/oclc
OCLC Library ID:
87410
OCLC/WorldCat partner library, from which they ingest metadata. Only added for records with less than 10 total holdings.
网站: /datasets/oclc
OCLC Library ID:
87413
OCLC/WorldCat partner library, from which they ingest metadata. Only added for records with less than 10 total holdings.
网站: /datasets/oclc
Server Path:
g4/libgenrs_nonfiction/libgenrs_nonfiction/3056000/cca7dffa7cefb827498e8b2a2a17441f
Path on Anna’s Archive partner servers.
SHA-1:
29999f3d103a51e0a634835c1560e72dfaa9c32b
SHA-256:
60c8de6a6b5df8f408b5c9228ed3fec00053dd00e47f3364945ca78de05f35a8
Torrent:
external/libgen_rs_non_fic/r_3056000.torrent
Bulk torrent for long-term preservation.
网站: /torrents
Z-Library:
17009675
ID in Z-Library.
URL: https://z-lib.gd/
网站: /datasets/zlib
代码浏览器: 在代码浏览器中查看“zlib:17009675”
Zlib Category ID:
10
Category ID on the Z-Library website.
Zlib Category Name:
Computers
Name for the zlib_category_id (category ID on the Z-Library website).
🚀 快速下载
成为会员以支持书籍、论文等的长期保存。为了感谢您对我们的支持,您将获得高速下载权益。❤️
如果您在本月捐款,您将获得双倍的快速下载次数。
今日下载剩余 XXXXXX 次。感谢您成为会员!❤️
你已经用完了今日的高速下载次数。
你最近下载过此文件。链接在一段时间内仍然有效。
🐢 低速下载
由可信的合作方提供。 更多信息请参见常见问题解答。 (可能需要验证浏览器——无限次下载!)
- 低速服务器(合作方提供) #1 (稍快但需要排队)
- 低速服务器(合作方提供) #2 (稍快但需要排队)
- 低速服务器(合作方提供) #3 (稍快但需要排队)
- 低速服务器(合作方提供) #4 (稍快但需要排队)
- 低速服务器(合作方提供) #5 (无需排队,但可能非常慢)
- 低速服务器(合作方提供) #6 (无需排队,但可能非常慢)
- 低速服务器(合作方提供) #7 (无需排队,但可能非常慢)
- 低速服务器(合作方提供) #8 (无需排队,但可能非常慢)
- 低速服务器(合作方提供) #9 (无需排队,但可能非常慢)
- 下载后: 在我们的查看器中打开
所有选项下载的文件都相同,应该可以安全使用。即使这样,从互联网下载文件时始终要小心。例如,确保您的设备更新及时。
外部下载
- Libgen.rs 非虚构文学板块
- Libgen.li (点击顶部的“GET”) 已知他们的广告包含恶意软件,因此请使用广告拦截器或不要点击广告
- Nexus/STC (Nexus/STC 文件下载可能不可靠)
- IPFS
- Z-Library
- Z-Library TOR (需要TOR浏览器)
- Z-Library
- Z-Library TOR (需要TOR浏览器)
- 批量种子下载 (仅限专家) 馆藏 “libgen_rs_non_fic” → 种子 “r_3056000.torrent” → file “cca7dffa7cefb827498e8b2a2a17441f”
-
对于大文件,我们建议使用下载管理器以防止中断。
推荐的下载管理器:JDownloader -
您将需要一个电子书或 PDF 阅读器来打开文件,具体取决于文件格式。
推荐的电子书阅读器:Anna的档案在线查看器、ReadEra和Calibre -
使用在线工具进行格式转换。
推荐的转换工具:CloudConvert和PrintFriendly -
您可以将 PDF 和 EPUB 文件发送到您的 Kindle 或 Kobo 电子阅读器。
推荐的工具:亚马逊的“发送到 Kindle”和djazz 的“发送到 Kobo/Kindle” -
支持作者和图书馆
✍️ 如果您喜欢这个并且能够负担得起,请考虑购买原版,或直接支持作者。
📚 如果您当地的图书馆有这本书,请考虑在那里免费借阅。
下面的文字仅以英文继续。
总下载量:
“文件的MD5”是根据文件内容计算出的哈希值,并且基于该内容具有相当的唯一性。我们这里索引的所有影子图书馆都主要使用MD5来标识文件。
一个文件可能会出现在多个影子图书馆中。有关我们编译的各种数据集的信息,请参见数据集页面。
有关此文件的详细信息,请查看其JSON 文件。 Live/debug JSON version. Live/debug page.