零代码编程:用ChatGPT批量自动下载archive.org上的音频书

这篇具有很好参考价值的文章主要介绍了零代码编程:用ChatGPT批量自动下载archive.org上的音频书。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

http://archive.org 是一个神奇的网站,可以下载各种古旧的软件、书籍、音频、视频,还可以搜索各个网站的历史网页。

比如说,一些儿童故事音频就可以在http://archive.org下载到,可以用来做英语听力启蒙用。

举个例子,要下载https://archive.org/details/107frogandtoadallyear_202004这个网页上的所有音频内容,该怎么办呢?

零代码编程:用ChatGPT批量自动下载archive.org上的音频书,音视频

右击,检查网页,点击网络,然后选择媒体,然后可以看到正在播放的音频文件,右击复制链接,如下:

https://archive.org/details/107frogandtoadallyear_202004/2-12+Alone.mp3

查看网页源代码,搜索某一个音频文件标题:Alone.mp3

零代码编程:用ChatGPT批量自动下载archive.org上的音频书,音视频

找到了音频文件的地址:

<button type="button" data-event-click-tracking="TrackList|Item" class="track selected" data-track-number="21">

<!--?lit$3345567357$--><span class="track-number"><!--?lit$3345567357$-->22</span>

<span class="track-title"><!--?lit$3345567357$-->2-12 Alone

<!--?lit$3345567357$-->

</span>

<span class="track-length">

<!--?lit$3345567357$-->

<!--?lit$3345567357$-->05:10

</span>

</button>

接下来就好办了,在ChatGPT中输入提示词:

你是一个Python编程专家,现在要完成一个下载网页中音频的任务,具体步骤如下:

打开网站:https://archive.org/details/107frogandtoadallyear_202004

解析源代码,找出所有itemprop="hasPart"的div元素,定位其中itemprop="associatedMedia" 的link元素;

提取link元素的href值,作为音频下载的URL地址;

多线程下载这个音频文件,保存到电脑D盘的文件夹:Frog and Toad Audio Collection

注意:每一步都要输出信息

要有反爬虫措施,比如下载一个音频文件后暂停3秒;

零代码编程:用ChatGPT批量自动下载archive.org上的音频书,音视频

音频下载的Python源代码:

import requests

from bs4 import BeautifulSoup

import os

import time

import threading

class Downloader(threading.Thread):

def __init__(self, url, path):

threading.Thread.__init__(self)

self.url = url

self.path = path

def run(self):

print(f'Starting download {self.path}')

r = requests.get(self.url, stream=True)

with open(self.path, 'wb') as f:

for chunk in r.iter_content(chunk_size=1024):

if chunk:

f.write(chunk)

print(f'Finished download {self.path}')

time.sleep(3) # pause for 3 seconds

def get_audio_links(url):

r = requests.get(url)

soup = BeautifulSoup(r.text, 'html.parser')

audio_links = []

for div in soup.find_all('div', itemprop='hasPart'):

link = div.find('link', itemprop='associatedMedia')

if link:

audio_links.append(link['href'])

return audio_links

def download_audios(url, directory):

if not os.path.exists(directory):

os.makedirs(directory)

audio_links = get_audio_links(url)

downloaders = []

for i, audio_link in enumerate(audio_links):

path = os.path.join(directory, f'audio{i}.mp3')

downloader = Downloader(audio_link, path)

downloader.start()

downloaders.append(downloader)

for downloader in downloaders:

downloader.join()

url = 'https://archive.org/details/107frogandtoadallyear_202004'

directory = 'D:\\Frog and Toad Audio Collection'

download_audios(url, directory)

零代码编程:用ChatGPT批量自动下载archive.org上的音频书,音视频

程序运行,很快就把网页中的音频下载完了。文章来源地址https://www.toymoban.com/news/detail-720487.html

到了这里,关于零代码编程:用ChatGPT批量自动下载archive.org上的音频书的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 如何借助ChatGPT,自动批量产出短视频爆款文案

    如何借助chatgpt批量出爆款文案。 这里我们首先得认识并了解到爆款文案的逻辑。 共通性是打动人,去原创的话,文案能否火,纯靠天吃饭。 所以我们让chatgpt去自己写原创短视频文案,那么chatgpt大概率自由发挥,我们也不太清楚能否火。 顶多把文案的开头结尾和中间的结构

    2023年04月23日
    浏览(52)
  • 狗屁文章生成器-批量生成文章自动发布网站-免费下载

    狗屁文章生成器,什么是狗屁文章生成器,狗屁文章生成器从字面意思都能理解出来,就是生成的文章毫无逻辑感,胡乱生成,毫无可读性。只需要输入就能实现狗屁文章生成。狗屁文章生成器。火于2020年某老板喊一员工写3000字原创检讨,然后该员工就采用的这套狗屁

    2024年02月04日
    浏览(137)
  • 常见气象数据获取方式及批量下载代码汇总

    气象数据获取因其数据源多、请求规则不一,格式复杂、体积庞大,所以经常成为气象小白的噩梦。这里收集了一些常用气象数据下载方法及下载的代码,供大家参考 目录 1. 中国气象数据网(这是最官方的数据平台) 2. NOAA 全球地面站观测数据 3. 全球探空数据 4. 全国空气质

    2024年01月24日
    浏览(47)
  • ChatGPT炒股:批量自动提取股票公告中的表格并合并数据

    首先,在ChatGPT中输入提示词: 写一段Python代码: F盘文件夹“新三板 2023年日常性关联交易20230704”中很多个PDF文件,用 Tabula提取这些PDF文件中第1页中的第2个表格,然后保存到表格文件中,文件标题名和原PDF文件保持一致; 注意:表格中的元素,如果为None,则替换为空字符

    2024年02月13日
    浏览(43)
  • 根据若依系统+minio实现批量下载附件并自动压缩成zip

    效果实现:   分割!!!! 以下代码参考于 http://t.csdn.cn/4dUmDwg 话不多说 直接从后端开始 0.首先是pom依赖 1.后端Controller ids和tableName为我业务需要(主要是查询数据库的附件表) 2.Service实现层 需要各位自己搜索minio关于下载的代码 也就是获取图片的inputStream流(因为各自代码逻辑不同

    2024年02月09日
    浏览(56)
  • Chatgpt批量改写文章网页版可多开软件-自动登录换号生成word或者TXT

    Chatgpt批量改写文章网页版可多开软件介绍: 1、改写后生成docx格式文档和生成txt文档二选一。 2、支持原来docx文档里带图片的改写,改写伪原创后的docx里也带图片。 3、软件可以设置是否开启标题改写,可以自定义标题改写指令。 4、可以设置是否 改写后文档内容长度 跟原

    2024年02月06日
    浏览(42)
  • 利用Python中selenium库爬虫实现中国裁判文书网自动登录批量下载功能——最新版详细教程!!

    如果电脑上没有chrome浏览器或者当前chrome浏览器不是最新版,请先去chrome官网下载安装最新版chrome浏览器 https://www.google.cn/chrome/index.html 什么是ChromeDriver ChromeDriver是一种用于自动化和控制Google Chrome浏览器的工具。它是一个开源的项目,由Google维护,并提供给开发者使用。Ch

    2024年02月04日
    浏览(112)
  • Codeium - 一款国内下载很慢注册不上的个人免费的AI代码补全工具

    下载地址:Codeium - VSCode扩展市场 等待下载 等吧,下载速度10KB/s 终于下载完了,下载了半个小时 VSCode左下角,点击帐户图标展开菜单 点击 使用 Codeium Auth 登录以使用 Codeium…… 点击 打开(O) 按钮打开Codeium官网 点击 Log in with Google ,Google ?连不上Google 谷什么歌 或者点击 Si

    2024年02月11日
    浏览(175)
  • postman archive / postman old versions / postman 历史版本下载

    Updating your team to the current version of Postman:     url: https://learning.postman.com/docs/administration/updating/ Installing earlier versions of Postman:      Downloading Postman v9 :          Download Postman v9 for Windows 64-bit : https://go.pstmn.io/dl-win64-v9-latest          Download Postman v9 for Linux 64-bit : https://go.pstm

    2024年02月08日
    浏览(45)
  • ChatGPT人工智能自动化编程应用实践

    随着人工智能技术的发展,软件开发的需求和难度也不断增加。传统的软件开发方法,需要程序员编写大量的代码,耗时耗力,而且容易出错。为了提高软件开发的效率和质量,人工智能生成代码(AIGC)技术应运而生。AIGC技术利用人工智能模型,根据用户的需求或示例,自

    2024年02月04日
    浏览(43)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包