archive.org API 的信封。
项目描述
回程机
这个项目是一个用于从 archive.org API 简单地获取页面历史版本的信封。
该页面可用于后续的网页抓取
设置和使用
从pip安装
pip install waybackmachine
要从存档中获取最新版本,只需使用fetch()函数。
import waybackmachine as wm
url = "https://en.wikipedia.org/wiki/COVID-19"
latest = wm.fetch(url)
latest.response # requests.Response
latest.date # capture time
latest.url # url
您可以选择指定日期。选择此日期之后的第一个版本。
may2020 = wm.fetch(url, date="2020-05-01")
浏览
您还可以及时向后迭代存档版本。
for version in wm.browse(url):
version.response # requests.Response
version.date # capture time
version.url # url
这将迭代来自archive.org的屏幕截图。
您可以按如下方式指定自定义日期范围。
for version in wm.browse(url, start='2020-06-30', end='2020-03-01'):
pass
贡献
由Martin Benes开发。
加入GitHub。
项目详情
关
waybackmachine -0.5.0.tar.gz 的哈希值
| 算法 | 哈希摘要 | |
|---|---|---|
| SHA256 | c3400901bd51c3a6e542502861e8e1cb21f412063daf8325b92a0269059e7cc7 |
|
| MD5 | 1b47ebe2223b48cdfad6f3d810f723fb |
|
| 布莱克2-256 | b20352950ac71a6efaf59266732f98bbde30b3ed556933810dbe580a44ef6398 |
关
waybackmachine -0.5.0-py3-none-any.whl 的哈希值
| 算法 | 哈希摘要 | |
|---|---|---|
| SHA256 | 8c74cad5dc0e465eba86f826e356ed6a44982f84bcd11caaa1846a6ce0ebcdab |
|
| MD5 | 623540471ccbce1d591f7d16ab43a5d1 |
|
| 布莱克2-256 | 49c04b76c8856b8710aca29a4c375f5220414e089f0e44b135624cb6b9149333 |