让AI帮你工作(2)-如何阅读pdf论文

这篇具有很好参考价值的文章主要介绍了让AI帮你工作(2)-如何阅读pdf论文。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

这个系列快结束了,后面会有一到两篇文章介绍,如何用AI实实在在的应用在工业生产研发,如何指导化工分子合成,如何做DNA的研究预测,合成。

背景

最近chatpdf在各媒体传的风风火火,从效果上是很震撼的。原因大概分析有三:

1.pdf在大家印象中是一种保存性文档,很不容易做二次数据处理

2.可以对pdf中内容做问答,还可以顺带做翻译,做长文章的摘要观点生成

3.可以找到某个观点出现在哪

但其实如果是做nlp的同学又稍微熟悉办公自动化的同学,应该知道上面几点都不难。

1.pdf其实是可以想word一样的方便操作的。

2.文章摘要有难度,但是chatgpt对知识整理能力是可以的,调api就好

3.把自动化能力+chatgpt做个整合就可以实现

复现

python如何读取pdf

用python读取并处理pdf文件,把文件保存成csv,按文本内容、行、页数。用PyPDF2抽取pdf数据,把每行内容、页数、行数用pandas存成cvs,具体操作如下,结果如右。

怎么用openai学习pdf文档,AIGC,自然语言综合项目,AI应用市场,人工智能,AIGC,信息可视化,Powered by 金山文档

代码如下:

import PyPDF2
import pandas as pd

# 打开PDF文件
with open('大模型综述-李飞飞等.pdf', 'rb') as pdf_file:
    # 创建PdfFileReader对象
    pdf_reader = PyPDF2.PdfReader(pdf_file)

    # 获取PDF文件的总页数
    num_pages = len(pdf_reader.pages)

    # 创建空列表存储数据
    data = []

    # 循环遍历每一页PDF文件
    for page in range(num_pages):
        # 获取页面对象
        pdf_page = pdf_reader.pages[page]  #pdf_reader.getPage(page)

        # 提取页面文本内容
        text = pdf_page.extract_text()

        # 分割文本内容为行
        lines = text.split('\n')
        #data.append([line, page+1] + columns)

        # 循环遍历每一行文本
        i = 0
        for line in lines:
            i = i+1
            # 分割行为列
            #columns = line.split(',')

            # 添加行、页码和列到数据列表中
            data.append([line, page+1, i])

# 将数据列表转换为Pandas DataFrame对象
df = pd.DataFrame(data, columns=['text', 'page'] + [f'col_{i}' for i in range(len(data[0])-2)])

# 将DataFrame对象保存为CSV文件
df.to_csv('example.csv', index=False)
pdf信息如何送给chatgpt
如何抽取摘要

将论文输入到ChatGPT中,让模型生成摘要。可以使用以下代码将论文输入到ChatGPT中,并让模型生成摘要:

#每次prompt有限制,可以分批输入,要抽取的好,有些拼接技巧,各位看官自己动动脑动动手试试
import openai
openai.api_key = "你的apitoken"
openai.ChatCompletion.create(
    model="gpt-3.5-turbo",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Who won the world series in 2020?"},
        {"role": "assistant", "content": "The Los Angeles Dodgers won the World Series in 2020."},
        {"role": "user", "content": "Please generate a summary of the given article: {}\n\n ARTICLE TEXT HERE".format(' '.join(df['text'][0:200]))}
    ]
)

效果如下:

怎么用openai学习pdf文档,AIGC,自然语言综合项目,AI应用市场,人工智能,AIGC,信息可视化,Powered by 金山文档
如何提问找到原文

代码如下:

import openai
openai.api_key = "你的api token"
openai.ChatCompletion.create(
    model="gpt-3.5-turbo",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Who won the world series in 2020?"},
        {"role": "assistant", "content": "The Los Angeles Dodgers won the World Series in 2020."},
        {"role": "user", "content": "Please analyze the given article {article} and list the key {key} topics discussed: \n\n ARTICLE TEXT HERE".format(article =' '.join(df['text'][0:200]),key = 'where ia content?')
        }
    ]
)

效果如下:

行号和页数,因为我没把前面处理好存在csv里的数据带上,所以没显示,这个各位看官可以自己动试试效果,不难。

怎么用openai学习pdf文档,AIGC,自然语言综合项目,AI应用市场,人工智能,AIGC,信息可视化,Powered by 金山文档
如何翻译
import openai
openai.api_key = "你的api token"
openai.ChatCompletion.create(
    model="gpt-3.5-turbo",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Who won the world series in 2020?"},
        {"role": "assistant", "content": "The Los Angeles Dodgers won the World Series in 2020."},
        {"role": "user", "content": "把输入的英文{article} 翻译成中文 : \n\n ARTICLE TEXT HERE".format(article =' '.join(df['text'][0:20]))
        }
    ]
)

结果如下:

怎么用openai学习pdf文档,AIGC,自然语言综合项目,AI应用市场,人工智能,AIGC,信息可视化,Powered by 金山文档

utf-8转成中文文章来源地址https://www.toymoban.com/news/detail-818916.html

到了这里,关于让AI帮你工作(2)-如何阅读pdf论文的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 让Ai帮你工作(4)--锁定图片生成角色

    Gpt4多模态模型上来后,MJ也是紧接着发布了V5,微软发布自己Ai作图工具,Abode、unity这些传统老牌作图软件工具也是紧跟着发布自己的AI作图插件工具。这已经标志着Ai作图已经成为计算成像的另一条生成链。 各大厂都已经发布了这么多的工具,开箱即用。我们是否还需要学习

    2024年02月09日
    浏览(46)
  • ai绘画怎么弄?这些软件轻松帮你实现

    在数字化时代,人工智能和机器学习的快速发展为创意产生了新的可能性。近年来,一种令人兴奋的技术引起了广泛关注,那就是通过输入文字来自动生成逼真而惊艳的图像。这项技术的出现,不仅让我们窥见了人工智能的创造力,也为创意表达和图像设计带来了翻天覆地的

    2024年02月11日
    浏览(45)
  • 【论文阅读】SAM医学图像分割近期工作综述

    How Segment Anything Model (SAM) Boost Medical Image Segmentation? 论文:[2305.03678] How Segment Anything Model (SAM) Boost Medical Image Segmentation? (arxiv.org) 仓库:https://github.com/yichizhang98/sam4mis 摘要: 在这项工作中,我们总结了近期工作中以扩展 SAM 医疗图像分割的任务,包括经验基准和方法的调整,并

    2024年02月11日
    浏览(44)
  • 论文如何降低AIGC?七个策略帮你摆脱困境

    大家好,小发猫降ai今天来聊聊论文如何降低AIGC?七个策略帮你摆脱困境,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 论文如何降低AIGC?七个策略帮你摆脱困境 在学术界,AIGC(人工智能生

    2024年04月10日
    浏览(76)
  • AI写作查出来高风险怎么办?七步策略帮你解决困境

    大家好,小发猫降ai今天来聊聊AI写作查出来高风险怎么办?七步策略帮你解决困境,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: AI写作查出来高风险怎么办?七步策略帮你解决困境 在当今

    2024年03月20日
    浏览(52)
  • 如何使用AI帮你制作PPT

    在现代人日益忙碌的生活中,难免需要一些轻松愉快的聊天来放松身心。而现在,有了 ChatGPT,轻松愉快的聊天变得更加智能、有趣且不受时间、地点限制! ChatGPT 是基于 GPT-3.5-turbo 训练模型的智能聊天机器人。它可以应用于广泛的应用场景,例如: 在社交媒体上模拟真实用

    2024年02月08日
    浏览(49)
  • Claude2 AI实战:PDF文档智能化阅读与解析

    Claude2 的对外发布后有一项显著的功能,支持pdf、txt等文档的上传,直接将ChatPDF、ChatDOC、ChatWeb纳入到射程之内,这一批垂类产品的护城河瞬间被Claude2打破,这就是降维打击的冲击力。Claude2在人工反馈评估方面相比之前的版本更具有更强的能力。 本文单独将PDF文档拿出来聊

    2024年02月13日
    浏览(44)
  • 手把手教你怎么搭建自己的AI数字人直播间?帮你24小时不间断直播卖货

    在搭建AI数字人直播间之前,您需要了解数字人技术。 数字人是一种由人工智能技术构建的虚拟人物,其外貌、行为、语言等特征与真实人物相似,可以与人进行互动。数字人可以通过语音合成、人脸识别、情感识别等技术来实现与观众的交互。数字人直播间是使用现有的技

    2024年02月05日
    浏览(200)
  • 如何用AI提高论文阅读效率?

     已经2024年了,该出现一个写论文解读AI Agent了。 大家肯定也在经常刷论文吧。 但真正尝试过用GPT去刷论文、写论文解读的小伙伴,一定深有体验——费劲。其他agents也没有能搞定的,今天我发现了一个超级厉害的写论文解读的agent ,传送门: 赛博马良智能体-AI论文解读达

    2024年01月18日
    浏览(38)
  • 【生成式AI】ProlificDreamer论文阅读

    Project指路:https://ml.cs.tsinghua.edu.cn/prolificdreamer/ 论文简介:截止2023/8/10,text-to-3D的baseline SOTA,提出了VSD优化方法 text-to-3D Problem text-to-3D 解决的问题就是给定一段话,生成视角一致的3D场景,如果了解过这个领域的可以略过不看 研发路线大概是dreamfeild-dreamfusion-polificdreamer D

    2024年02月13日
    浏览(31)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包