未来财经网 前沿创业财经资讯

首页 /  商业看点 / 内容详情

可以生成现有标题的幽默版本的模型

商业看点 时间:2021-10-09 10:00:48

在过去十年左右的时间里,计算机科学家开发了越来越多的计算模型,可以生成、编辑和分析文本。虽然这些模型中的一些已经取得了显著的成果,但人类语言和交流的某些方面已经证明特别难以通过计算进行复制。

其中一个方面是幽默,即人类说或写有趣事情的能力。幽默是一种微妙而内在的人类品质;因此,在机器上复制它绝非易事。

赫尔辛基大学的研究人员最近试图通过开发一个可以将现有新闻标题转变为幽默的框架来人工复制机器中的幽默。该模型首先在arXiv上预先发表的一篇论文中介绍,并在第12届国际计算创造力会议(ICCC 2021)上介绍。该模型经过训练,可以分析现有数据集中的标题,并替换其中的单词,以赋予它们滑稽或有趣的特性。

开展这项研究的两位研究人员哈立德·阿尔纳贾尔(Khalid Alnajjar)和米卡·哈玛莱宁(Mika Hämäläinen)在论文中写道:“自动化新闻生成已经成为新闻机构的主要兴趣。”。“通常,自动生成的新闻文章的标题缺乏想象力,因为它们是用现成的模板生成的。我们提出了一种计算创新的标题生成方法,可以生成现有标题的幽默版本。”

Alnjar和H.M.S.L.AuiNeNN最近的论文从罗切斯特大学和微软研究AI的三位研究人员的灵感中得到启发,胡教授介绍了一个包含15000多条注释新闻标题的数据集。在这项研究中,研究人员确定了人类常用的使标题有趣的策略,他们发现这些策略与现有的幽默理论是一致的。

赫尔辛基大学的团队设计了一个模型,利用这些策略来改变非幽默标题,使读者更有趣。为了做到这一点,它试图为现有标题中的一些词语找到有趣的替代品。

研究者模型产生的两个标题例子是:“特朗普在推特上吃错了李·格林伍德”和“美国说土耳其通过梳理叙利亚库尔德人帮助伊斯兰国。”

为了评估他们的模型的有效性,Alnajjar和Hämäläinen使用该模型改变了从Humicroedit数据集中随机选择的83条标题,使它们更幽默。随后,他们要求众包平台上的评论员提供反馈,说明他们是否认为该模型产生的标题有趣。

总的来说,研究人员发现,他们的模型产生的幽默标题在几个层面上与人类产生的标题相当。此外,他们发现,平均而言,来自网络的人类评估者认为他们系统产生的标题在36%的时间里很有趣。如果这一模式得到进一步改进,它将最终帮助媒体机构和记者为新闻文章提供新的有趣标题。

“由于我们的系统为每个原始标题生成的最佳标题在我们的评估中衡量的大多数因素方面平均可以达到人类水平,因此我们研究的近期方向是开发更好的排名机制,以达到我们系统的最大容量。”Alnajjar和Hämäläinen在论文中得出结论。“也许这种排名可以通过在幽默注释语料库上训练长短时记忆(LSTM)分类器来学习。”

标签: #商业看点

郑重声明:图文由自媒体作者发布,我们尊重原作版权,但因数量庞大无法逐一核实,图片与文字所有方如有疑问可与我们联系,核实后我们将予以删除。

标签列表

网站分类