asdTools-爬取WordPress文章并获得Markdown文本

这篇具有很好参考价值的文章主要介绍了asdTools-爬取WordPress文章并获得Markdown文本。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

文章首发见博客:https://mwhls.top/4824.html。
无图/格式错误/后续更新请见首发页。
更多更新请到mwhls.top查看
欢迎留言提问或批评建议,私信不回。

Github - 开源代码及Readme
Blog - 工具介绍

摘要:爬取我的WordPress博客,并以markdown格式输出。文章来源地址https://www.toymoban.com/news/detail-683638.html

场景
  • 想快速以带水印的markdown格式转发我的博客,不想手动敲。
使用示例
  • 开源地址:asdTools/WordPressSpiderInMarkdown.py at main
    from asdTools.Classes.Spider.WordPressSpiderInMarkdown import WordPressSpiderInMarkdown
    from asdTools.Classes.Tool.Clipboard import Clipboard
    
    if __name__ == "__main__":
        """
        Before: https://mwhls.top/4810.html
        After: https://blog.csdn.net/asd123pwj/article/details/132394313
        仅在我的博客测试正常:mwhls.top
        爬取WordPress文章,并转为markdown格式
        Only testing in my blog: mwhls.top
        Crawl post of WordPress, and output in markdown
        """
        spider = WordPressSpiderInMarkdown()
        spider.log("Input post url from mwhls.top:") 
        url = spider.input("")
    
        spider.log(f"Parsing {url}")
        title, result = spider.get_post(url)
    
        spider.log("Title has copied")
        Clipboard.copy(title)
        spider.pause()
    
        spider.log("Content has copied")
        Clipboard.copy(result)
        spider.done()
        spider.pause()
    

到了这里,关于asdTools-爬取WordPress文章并获得Markdown文本的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • python通过selenium获取输入框的文本值爬取编辑框内容

    以百度首页的输入框为例,当输入‘你好‘后,html中的value的值会变成‘你好’ 运行代码得到以下效果

    2024年02月04日
    浏览(68)
  • python爬虫爬取微信公众号的阅读数、喜爱数、文章标题和链接等信息

    爬虫的步骤: (1)申请自己的公众号 (2)使用fiddler抓包工具 (3)pycharm (一)申请公众号 官网:微信公众平台 填入相关信息创建微信公众号 进入公众号界面如下: 找到新的创作-图文信息 在弹出的界面中查找公众号文章-输入公众号名称-确定 点击确认之后,进入公众号

    2024年02月05日
    浏览(54)
  • 使用Python和Selenium自动化爬取 #【端午特别征文】 探索技术极致,未来因你出“粽” # 的投稿文章

    本文章将介绍如何使用Python的Selenium库和正则表达式对CSDN的活动文章进行爬取,并将爬取到的数据导出到Excel文件中。 导入相关模块 首先,我们需要导入以下模块: re是Python内置的正则表达式模块,用于处理字符串匹配和搜索。 time模块提供了一些与时间相关的函数,我们可

    2024年02月11日
    浏览(53)
  • csdn文章markdown格式下载

            网上下载CSDN文章的方式多种多样,有的直接下载为pdf格式,有的利用python/java代码将文章下载为md格式,也有的用JavaScript下载文章,但下载的文章仅限于自己写的(后面会介绍),这里也提供一种简单且易懂的下载文章的方式供读者使用(无需下载任何软件/任何

    2024年02月06日
    浏览(40)
  • Python爬虫爬取知乎文章内容(解决最新js反爬2021.9 x-zse-96 2.0版本加密破解分析)...

    有个需求爬取知乎文章,正好记录下爬取过程以及出现问题并解决方法 我是在没有登录的情况下爬取文章的 本文仅供研究与学习使用 知乎现今的 x-zse 参数的加密方法已升级成了:x-zse-96 2.0版本。 来看这篇帖子的应该都知道,这个参数动态唯一,没有就拿不到api数据。 查阅

    2023年04月08日
    浏览(51)
  • Markdown:简洁高效的文本标记语言

    在当今信息爆炸的时代,我们需要一种简洁、高效的文本标记语言来排版和发布内容。Markdown应运而生,它是一种轻量级的文本标记语言,以其简单易学、易读易写的特点,成为了广大写作者的首选工具。本文将介绍Markdown的语法优缺点,以及它可以解决的问题和应用领域。

    2024年02月19日
    浏览(52)
  • WordPress获取文章所属分类名称或别名方法

            最近在开发WordPress主题的时候,想要获取到文章所属分类名称或别名,想了半天没想到,于是去百度了下,马上就得到答案了。 非常简单,WordPress本身自带一个函数可以调出分类别名和链接:         不过上面函数会连分类链接一起获取到,实际的应用中,我

    2024年02月13日
    浏览(31)
  • 给WordPress设置自动发布每日60秒文章

    应大家需求,出一个 wp 自动发布每日 60 秒读懂世界文章的教程. 1.复制下方的 php 代码 2. 去到网站的根目录新建 PHP 文件,粘贴刚刚复制的代码文件名命名 60s 3. 修改刚刚代码中第 33 行的地址,改成自己站点的地址 4. 在宝塔后台设置定时访问的任务:你网站 /60s.php

    2024年02月08日
    浏览(35)
  • WordPress给每个文章开头或者末尾添加内容

    有需求想要给每个文章开头或者末尾添加内容,百度搜了些代码,感觉好用,贴上来备忘。 使用方法:在主题文件的functions.php 中,直接添加以下代码即可。 在文章内容开头添加固定内容 在文章内容末尾添加固定内容   在开头和末尾同时添加固定内容 在自定义文章类型“

    2024年02月13日
    浏览(40)
  • 还在手动复制文章吗?教你如何一键将文章从notion同步到WordPress

    本文会给大家介绍如何在WordPress上安装一个插件,实现将notion上写的文章自动同步到WordPress上,从而提高写作效率,接下来请跟随我的脚步一起来操作吧! 在WordPress后台添加新插件页面中搜索“notion”,选择如下图红框勾选的插件“WP Sync for Notion”进行安装。 插件安装成功

    2024年01月20日
    浏览(50)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包