Skip to main content

archive.org API 的信封。

项目描述

PyPI 版本 PyPI 下载 星星 贡献者 车轮 地位 PyPi 许可证 最后一次提交

回程机

这个项目是一个用于从 archive.org API 简单地获取页面历史版本的信封。

该页面可用于后续的网页抓取

设置和使用

pip安装

pip install waybackmachine

要从存档中获取最新版本,只需使用fetch()函数。

import waybackmachine as wm

url = "https://en.wikipedia.org/wiki/COVID-19"
latest = wm.fetch(url)
latest.response  # requests.Response
latest.date  # capture time
latest.url  # url

您可以选择指定日期。选择此日期之后的第一个版本。

may2020 = wm.fetch(url, date="2020-05-01")

浏览

您还可以及时向后迭代存档版本。

for version in wm.browse(url):
    version.response  # requests.Response
    version.date  # capture time
    version.url  # url

这将迭代来自archive.org的屏幕截图。

您可以按如下方式指定自定义日期范围。

for version in wm.browse(url, start='2020-06-30', end='2020-03-01'):
    pass

贡献

Martin Benes开发。

加入GitHub

下载文件

下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

源分布

waybackmachine-0.5.0.tar.gz (7.7 kB 查看哈希)

已上传 source

内置分布

waybackmachine-0.5.0-py3-none-any.whl (6.5 kB 查看哈希

已上传 py3