现金巴黎人娱乐城app平台还需圭表悟事件之间的时期干系和因果筹谋-2024年金沙巴黎人娱乐城(中国大陆)官方网站-登录入口

发布日期:2025-01-26 07:47    点击次数:164

现金巴黎人娱乐城app平台还需圭表悟事件之间的时期干系和因果筹谋-2024年金沙巴黎人娱乐城(中国大陆)官方网站-登录入口

目下,大模子不错帮你梳理新闻时期线了现金巴黎人娱乐城app平台,以后吃瓜就更简单了!

AI Agent 的风,我们赛博乐子东谈主也得吹吹。

这便是来自阿里巴巴通义实验室与上海交通大学的新酌量,他们提倡了一种基于 Agent 的新闻时期线纲要新框架——CHRONOS。

它不仅不错帮你从海量新闻中回来出要紧事件,更要紧的是,它还不错梳理出赫然的时期线,以后上网冲浪时种种复杂事件都一目了然。

其中的 CHRONOS 一词取自希腊外传中的时期之神柯罗诺斯。

该框架通过迭代多轮的自我发问面孔,络续检索增强生成时期,从互联网上检索关联事件信息,并生成时期限定的新闻纲要,为新闻时期线纲要生成提供了一种全新的科罚决策。

先来通盘瞅瞅几个例子。

比如对于新闻"国足 1-0 巴林",CHRONOS 省略回来海量新闻,呈现事件的世代相承。

对于笼罩时期更长的新闻"中国探月工程",CHRONOS 也能聚焦要点事件,呈面前期线发展,使得用户省略一目了然。

补都绽放域 TLS 短板

时期线回来(Timeline Summarization, TLS)任务是一种当然说话处理鸿沟的经典时期挑战,它旨在从多半文本数据中索求要道事件,并依时代限定罗列,以提供对某一主题或鸿沟历史发展的结构化视图。

举例,在新闻鸿沟,时期线回来不错匡助用户快速了解一个新闻事件的世代相承。该任务不仅条目识别出要紧的事件,还需圭表悟事件之间的时期干系和因果筹谋,以便生成一个连贯、纯粹且信息丰富的时期线纲要。

凭据可检索事件的来源,不错将 TLS 任务细分为顽固域(closed-domain)和绽放域(open-domain)两个设定:在顽固域 TLS 任务中,时期线是从一组预界说的、与特定主题或鸿沟关联的新闻著述中创建的,而绽放域 TLS 指的是从互联网上平直搜索和检索新闻著述来生成时期线的经由。

昔时的责任东要聚首于科罚顽固域上时期线生成问题,而绽放域 TLS 则需要浩大的信息检索和筛选智商,以及在莫得全局视图的情况下识别和开导事件之间筹谋的智商,为这项任务提倡了新的要乞降挑战。

迭代检索的 CHRONOS 框架

为了应付上述挑战,团队提倡 CHRONOS 框架,通过迭代发问进行关联事件检索,生成准确、全面的时期线纲要,省略灵验地科罚绽放域和顽固域两种设定下的 TLS 任务。

1. 动机

时期线生成的中枢在于开导事件之间的时期和因果干系。

每个新闻事件都不错被暗示为一个不同的节点,任务的标的是开导这些节点之间的边,以展示它们的关联性,并最终酿成一个异构图,从主题新闻的节点开始。

因此,通过一个检索机制来检索关联的新闻著述,不错灵验开导这些边,酿成事件之间的筹谋。

2. 概括

CHRONOS 诈欺大模子的智商,通过模拟东谈主类信息检索的经由,即通过提倡问题、基于检索截至进一步提倡新的问题,最终荟萃对于关联事件的全面信息并回来为时期线。

CHRONOS 包括以下几个模块:

自我发问 ( Self-Questioning ) :领先搜索粗粒度的新闻布景信息,然后迭代地提倡问题,以检索更多关联新闻。

问题改写 ( Question Rewriting ) :将复杂或发达欠安的问题领悟为更具体、更易检索的查询。

时期线生成 ( Timeline Generation ) :通过统一每一轮检索生成的时期线往复来一个隆起要紧事件的时期线。

3. 自我发问 3.1 粗粒度布景调研

在自我发问的运转阶段,CHRONOS 使用标的新闻的标题看成要道词进行搜索,以荟萃与标的新闻最平直关联的信息。

这些信息组成了新闻布景(News Context),为自我发问打下初步基础。

3.2 发问示例摄取

在粗粒度布景调研之后,CHRONOS 诈欺大模子的凹凸文体习智商,通过极少样本领导来指挥模子生成对于标的新闻的问题。

为了评估问题样本色量,引入了时序信息量(Chrono-Informativeness, CI)的倡导,用来估量模子提倡的问题检索与参考时期线对都事件的智商,即高 CI 值的问题更有可能换取检索到与标的新闻事件关联的著述,用检索生成的时期线和参考时期线中包含日历的 F1 分数进行估量。

基于最大化问题集时序信息量的标的,构建一个"新闻 - 问题"的示例池,用于指挥新标的新闻的问题生成。

对于每个新的标的新闻,通过余弦相似性动态检索与标的新闻最相似的样本,确保了样本的凹凸文关联性和时期信息的准确性。

3.3 迭代发问

CHRONOS 通过连气儿迭代发问,逐渐真切探索事件的细节。

每一轮迭代都基于前一轮的检索截至,以发现新的问题和信息,直到得志时期线中事件数目或达到最大迭代次数。

3.4 问题改写

查询改写(Query Rewriting)是检索增强生成中常用的优化设施。

在 CHRONOS 框架中,团队通过对运转发问阶段产生的平日或复杂问题改写为 2-3 个更易于检索的子问题,省略生成更具体、更有针对性的查询,从而提高搜索引擎的检索恶果。

他们相同在领导中加入极少样本,指挥大模子进行灵验改写,将复杂问题转机为更具体的查询,同期保抓问题的原始意图。

3.5 时期线生成

CHRONOS 通过两阶段生成好意思满的时期线回来:生成(Generation)和统一(Merging)。

生成:通过分析每一轮检索到的新闻著述来识别要道事件和详备信息。诈欺大模子的清爽和生成智商,索求每个事件的发生辰期和关联细节,并为每个事件撰写纯粹的描摹。这些事件和描摹被组织成初步的时期线,按照时期限定罗列,为后续的统一阶段提供基础。

统一:将多轮检索生成的初步时期线整合成一个连贯的最终纲要。这照旧由波及对都不同时代线中的事件、科罚任何日历或描摹上的破裂,并摄取最具代表性和要紧性的事件。

全新数据集 OPEN-TLS

为了评估 TLS 系统,酌量团队还荟萃了由专科记者撰写的对于近期新闻事件的时期线,构建了一个名为Open-TLS的新数据集。

与以往顽固域的数据集比较,Open-TLS 不仅在数据集限度和内容上愈加种种化,笼罩政事、经济、社会、体育和科学时期等多个鸿沟,况兼在时效性上更具上风,为绽放域 TLS 任务提供了一个更全面和更具挑战性的基准。

实验截至 1. 实验设定

实验基于 GPT-3.5-Turbo、GPT-4 和 Qwen2.5-72B 辞别构建 CHRONOS 系统,评测绽放域和顽固域两个设定下 TLS 的性能发达。使用的评估盘算主要有:

ROUGE-N: 估量生成时期线和参考时期线之间的 N-gram 重迭。具体包括:(1)Concat F1:通过将通盘日历纲要结合起来猜度 ROUGE,以评估举座的一致性;(2)Agree F1:仅使用匹配日历的纲要猜度 ROUGE,以评估特定日历的准确性;(3)Align F1:在猜度 ROUGE 之前,先凭据相似性和日历接近性对展望纲要和参考纲要进行对都,评估对都后的一致性。

Date F1:估量生成时期线中日历与参考时期线中真的日历匹配进度。

2. 绽放域 TLS

在绽放域 TLS 的实验中,CHRONOS 与几个基线设施进行了比较,包括平直搜索标的新闻(DIRECT)和重写标的新闻以创建查询用于检索(REWRITE)。

对比之下,CHRONOS 通过迭代自我发问和检索关联新闻著述的设施,权臣提高了事件回来的质料和日历对都的准确性,在所权谋上都卓绝于基线设施。

3. 顽固域 TLS

在顽固域 TLS 的实验中,CHRONOS 与之前的代表性责任进行了比较,包括:(1)基于事件团员设施的 CLUST ( Gholipour Ghalandari and. Ifrim, 2020 ) ;(2)基于事件图模子 EGC(Li et al., 2021)和(3)诈欺大模子进行事件聚类的 LLM-TLS(Hu et al., 2024)。

在 Crisis 和 T17 这两个经典数据集上的比较截至表示,CHRONOS 达到了与这些责任雷同的发达,在两个数据集的 AR-2 盘算上赢得了 SOTA 恶果,阐明了其在不同类型事件和时期跨度上的浩大性能和合乎性。

4. 运行时期分析

CHRONOS 的另一个上风体目下效劳方面。

与相同基于大模子、但需要处理新闻库中通盘著述的 LLM-TLS 设施比较,它通过检索增强机制专注于最关联的新闻著述,权臣减少了处理时期。

这种效劳的培育使其在执行应用中更为实用,尤其是在需要快速反应的场景中。

案例酌量:苹果家具发布时期线

团队真切分析了模子在处理具体新闻事件时的发达,通过摄取具有代表性的新闻事件,如苹果公司的紧要家具发布,省略不雅察到 CHRONOS 奈何通过轮回渐进的自我发问和信息检索来生成时期线。

在案例酌量中,CHRONOS 展示了其省略准确索求要道事件和日历的智商,同期也揭示了在某些情况下可能需要编削的所在,举例对某些事件的遗漏或日历幻觉。

结语

CHRONOS 框架通过络续大型说话模子的迭代自我发问和检索增强生成时期,为时期线回来任务提供了一种新颖且灵验的科罚决策。

这种设施的中枢在于模拟东谈主类的信息检索经由,通过不停地提倡和回答新问题来逐渐真切清爽事件,最毕生成一个全面且连贯的时期线纲要。

实验截至已经充分阐明了 CHRONOS 在复杂事件检索和构建时期线方面的智商,展示了该框架在执行新闻时期线生成应用中的应用后劲和准确性。

同期,这种迭代发问的检索生成设施是否具有泛化到通用任务上的智商也值得改日进一步酌量。

论文:https://arxiv.org/abs/2501.00888

Github:   https://github.com/Alibaba-NLP/CHRONOS

Demo:   https://modelscope.cn/studios/vickywu1022/CHRONOS

Reference:  

[ 1 ] Demian Gholipour Ghalandari and Georgiana Ifrim. 2020. Examining the state-of-the-art in news timeline summarization. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, pages 1322 – 1334, Online. Association for Computational Linguistics.  

[ 2 ] Manling Li, Tengfei Ma, Mo Yu, Lingfei Wu, Tian Gao, Heng Ji, and Kathleen McKeown. 2021. Timeline summarization based on event graph compression via time-aware optimal transport. In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, pages 6443 – 6456, Online and Punta Cana, Dominican Republic. Association for Computational Linguistics.  

[ 3 ] Qisheng Hu, Geonsik Moon, and Hwee Tou Ng. 2024. From moments to milestones: Incremental timeline summarization leveraging large language models. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics ( Volume 1: Long Papers ) , pages 7232 – 7246, Bangkok, Thailand. Association for Computational Linguistics.

—  完  —

投稿请发邮件到:

ai@qbitai.com

标题注明【投稿】,告诉我们:

你是谁,从哪来,投稿内容‍

附上论文 / 表情主页畅通,以及筹谋面孔哦

我们会(尽量)实时薪金你

点这里� � 关怀我,紧记标星哦~

一键三连「共享」、「点赞」和「在看」

科技前沿进展日日再会 ~  



相关资讯



Powered by 2024年金沙巴黎人娱乐城(中国大陆)官方网站-登录入口 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群系统 © 2013-2024