PPTAgent:中科院开源AI工具,自动将文档转化为高质量PPT

[复制链接]
wwr 发表于 2025-1-15 11:54:05 | 显示全部楼层 |阅读模式
wwr
2025-1-15 11:54:05 695 0 看全部
快速阅读
  • 功能:PPTAgent 支持从文档自动生成高质量演示文稿,涵盖大纲生成、幻灯片设计与内容评估。
  • 技术:基于两阶段编辑方法,结合大型语言模型(LLM)实现智能分析与迭代优化。
  • 应用:适用于教育、企业培训、市场营销等多个领域,提升演示文稿生成效率与质量。
正文(附运行示例)PPTAgent 是什么PPTAgent 是由中国科学院软件研究所中文信息处理实验室推出的创新框架,旨在通过模仿人类工作流程的两阶段编辑方法,从文档自动生成高质量的演示文稿。该框架通过分析参考演示文稿,提取结构模式和内容模式,并基于代码动作草拟大纲并生成幻灯片,确保内容的一致性和对齐。
PPTAgent 基于大型语言模型(LLM)的能力,将演示文稿生成过程分解为迭代的编辑工作流程,从而提高生成演示文稿的连贯性和适应性。此外,PPTAgent 还引入了 PPT Eval 评估框架,从内容、设计和连贯性三个维度全面评估生成的演示文稿质量,为未来的演示文稿生成研究提供宝贵的资源和见解。
PPTAgent 的主要功能
  • 分析参考演示文稿:理解其结构模式和内容模式。
  • 草拟大纲:基于分析结果,创建详细的演示文稿大纲。
  • 生成幻灯片:基于代码动作,将大纲转化为具体的幻灯片内容,确保内容的一致性和对齐。
  • 编辑和修正:提供反馈机制,对生成的幻灯片进行编辑和自我修正,提高生成文稿的质量。
  • 综合评估:基于 PPT Eval 框架,从内容、设计和连贯性三个维度评估生成的演示文稿质量。
PPTAgent 的技术原理
  • 第一阶段:演示文稿分析
    • 幻灯片聚类:将幻灯片分为结构幻灯片和内容幻灯片,分别通过 LLM 和层次聚类方法进行分析。
    • 模式提取:利用 LLM 的情境感知能力,提取多样化的内容模式,确保编辑的目的性。

  • 第二阶段:演示文稿生成
    • 大纲生成:指导 LLM 创建结构化大纲,结合文档内容和参考演示文稿的语义信息。
    • 幻灯片生成:在大纲指导下,基于迭代编辑参考幻灯片生成新幻灯片,并通过 API 支持文本和视觉元素的编辑。

如何运行 PPTAgent
运行该项目一般需要以下几个步骤,确保你已经安装了 Node.js 和 npm(或 yarn)。以下是详细的步骤:
1. 安装 Node.js 和 npm(如未安装)
Vue 项目依赖于 Node.js 环境。如果你还没有安装 Node.js,可以访问 Node.js 官网 下载并安装适合你操作系统的版本。npm 会随 Node.js 一起安装。
2. 克隆该项目到本地运行环境git clone https://github.com/icip-cas/PPTAgent.git
3. 进入项目目录
进入到项目web_ui目录。例如:
cd PPTAgent/pptagent_ui
4. 安装依赖
在项目目录下运行以下命令来安装项目所需的依赖包:
npm install# 或者使用 yarn# yarn install
5. 运行开发服务器
安装完依赖后,你可以通过以下命令启动开发服务器:
npm run serve# 或者使用 yarn# yarn serve
这将启动一个本地开发服务器,默认情况下会在 http://localhost:8080 提供项目。你可以通过浏览器访问这个地址来查看你的 Vue 应用。
如何使用 PPTAgent 评估生成的 PPT1. 安装依赖pip install -r requirements.txtsudo apt install libreofficesudo apt install poppler-utils
2. 生成演示文稿python rebuild.py rebuild_all --out_filename "final.pptx"
3. 将 PPT 转换为图片python evals.py pptx2images
4. 评估演示文稿python evals.py eval_experiment -s 0 -j 0
资源
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则 返回列表

wwr当前离线
版主

查看:695 | 回复:0

欢迎
  • 联系电话
    13143516491
  • 邮    箱
  • 地    址
    广州·天河·五山路·金山大厦·北塔1801
快速回复 返回顶部 返回列表
|