AI 我方讲昭着论文,还能生成更好意思不雅的幻灯片。

加州大学圣塔芭芭拉(UCSB)与圣克鲁兹(UCSC)的探讨者建议EvoPresent,一个能够自我进化的学术演讲智能体框架,让 AI 不仅能"讲解晰论文",还能"讲得面子"。

从逻辑到审好意思:科研演讲自动化的瓶颈
尽管已有许多系统能将论文自动调节为幻灯片或海报,但它们仍存在三大局限:
叙事单一、规画僵化、阑珊反映。
AI 通常沿用论文结构机械索求本体,敷陈阑珊升沉;模板化规画又难适配不同作风,常出现色调突破、排版拥堵等问题;生成流程一朝限制,系统便无法判断"那里不好意思",更谈不上自我修正。 这些不及让 AI 演讲显得忽视机械,难以兼顾逻辑与好意思感。
EvoPresent恰是在此建议新的旅途,让 AI 像东说念主类讲者相通,在生成中反想,在反想中进化。

多智能体融合:让 AI 成为一个"演讲团队
EvoPresent 由四个智能体构成:Storyline Agent构建叙事逻辑,
Scholar Agent丰富本体与可视化,Design Agent认真排版与渲染,Checker Agent基于好意思学模子评估并反映。 它们在"草稿—反映—修正"的轮回中协同责任,使 AI 具备自我改良才智,从而生成兼具逻辑与好意思感的学术演讲。

PresAesth:让 AI 懂规画的好意思
EvoPresent 的中枢是好意思学模子PresAesth,这是一个基于多任务强化学习(Multi-task RL)的模子,用来模拟东说念主类的审好意思判断。
它同期履行三项任务:
好意思学评分:
为幻灯片生成 1 – 10 分的视合计分;
残障识别:
发现布局、留白、字体比例等问题并给出证明性反映;
版块相比:
判断多种规画中哪一个更具好意思感。
探讨者遴荐了 Group Relative Policy Optimization ( GRPO ) 算法,通过东说念主类偏好数据探员模子,使其能在反映中逐步变成可证明的审好意思推理。与传统监督学习不同,这种时势让模子不仅会"打分",还能阐发原因,如"标题层级不澄清""笔墨与图像间距不及"。

EvoPresent Benchmark:学术演讲的"好意思学措施"
为了让 AI "学会面子",团队构建了首个系统化评测体系——EvoPresent Benchmark。
它由两个部分构成:
第一部分Presentation Generation Quality,收录 650 篇来自 NeurIPS、ICLR、CVPR 等顶会的论文,隐蔽幻灯片、讲稿、视频等多模态容颜,从叙事通顺性、布局均衡、好意思学分数等多个维度评估自动生成质料。
第二部分Aesthetic Awareness Dataset,包含 2000 对东说念主工标注的幻灯片样本,通过不同进程的视觉扰动(如调整留白、色调或版式)生成对比样本,用于探员与考证好意思学评估才智。
这一框架使 AI 的视觉抒发有了可量化的措施,也让演讲生成的"好意思学进化"不错被系统性猜度。

实验效果:AI 正在学会反想
在实验中,探讨者将 EvoPresent 与多种主流辗转进行了对比,包括 GPT-4o、Claude 4、DeepSeek-R1 等端到端模子,以及 PresentAgent、Paper2Poster 等多智能体系统。效果标明,EvoPresent 在本体连贯性与视觉规画两方面均赢得显贵进步。

更遑急的发现是,模子的自我进步才智与界限无关,而与反映质料高度干系。
即使使用轻量模子(如 GPT-4o),只好有高质料审好意思反映,系统也能在三轮迭代内将视觉评分从 3.2 进步至 8.0。这意味着 AI 的"反想机制"比单纯的算力推广更辗转。

从自动化到艺术化:科研传播的新拐点
EvoPresent 展示了一种全新的科研传播范式,让 AI 成为"自我改良的敷陈者"。
它将论文解读、叙事构建、视觉规画与好意思学评价形影相随,使自动化生成不再留步于信息复述,而能在容颜与本体间寻求新的均衡。
这种理念的意旨不仅在于纯粹技能,更在于重塑科研抒发的好意思学措施。昔时,上传论文不详意味着自动生成一场完好的" AI 汇报":幻灯片、配音、视频齐由系统完成,并凭证会议作风与受众特征自动调整规画作风。正如论文标题所言," Presenting a Paper is an Art. "
EvoPresent 让 AI 着实运行学习这门艺术,不仅剖判逻辑,更剖判"好意思"。
Project Page: https://evopresent.github.io
arXiv: arXiv:2510.05571九游体育app娱乐