ACL2019 Tutorial 日现场见闻(附Tutorial PPT 下载)

创业指导 阅读(1211)
mg注册网站

%5C

雷锋人工智能科技评论:,自然语言处理领域的顶级学术会议ACL2019在意大利佛罗伦萨举行。作为文艺复兴时期的重要艺术城市和今天的旅游目的地,夏季期间佛罗伦萨不仅有来自世界各地的计算语言学家和NLP应用程序开发人员,当然还有许多游客。佛罗伦萨的街道和街道也非常热闹。

ACL2019的会议地址是Fortezza da Basso,这是文艺复兴时期的代表性建筑之一。它建于16世纪,是一座守卫佛罗伦萨的堡垒,现在已成为佛罗伦萨的主要场所。会议演讲,论文报告,研讨会等将在这里的各个场地举行。

%5C

教程日活动

%5C

在会议的第一天,第28天是教程日,主要关注9个不同的教程主题(教学讲座); 7月29日至7月31日是定期会议,会议开幕式,2场邀请演讲,以及所有论文。口头报告,海报展示,纸质演示,ACL论文奖和个人荣誉奖。 8月1日和2日的内容是研讨会(研讨会)。

%5C

会议的签署也在28日开始。登录时还有文艺复兴时期的元素。会议准备了两张着名画作的复印件,供与会者合影留念。

%5C

ACL 2019拥有众多赞助商,您不仅可以在展台区域的赞助商展示卡上看到它,而且您也可以感受到它越来越多:签署时发布的信息包中有ACL宣传材料。赞助公司,传播可以填一个。表;内容主要是介绍本ACL中的论文和计划活动。当然,官方ACL2019会议手册也是一个很大的问题。

%5C

雷锋网人工智能科技评论记者参加了无人监督的跨语言代表学习讲座,其中包括来自“NLP Net Red”塞巴斯蒂安鲁德的三位发言人。

%5C

%5C

他们从跨语言NLP主题的起源和单词表示的流行,比较有监督和无监督的学习方法,以及不同的无监督学习方法的角度,讨论了双语和多语言表达学习模型的发展。相似点和不同点解释了应用步骤中的要点,讨论了现有方法在稳定性,可用性,语言对和数据量方面的局限性,并说明了无监督的跨语言表示学习对后续任务和应用的帮助。这里的鸽子很多,不怕人,甚至其中一只飞到这个讲座的地方“听”。

%5C

在为期一天的讲座之后,晚上有一个欢迎招待会,为参与者提供社交空间。我们还愉快地发现了国内外几家人工智能研究机构内容的追随者。

所有教学讲座的介绍和下载

我们将总结所有讲座的内容如下。本文末尾附有所有九个讲座的PPT下载链接。

教学讲座 1: Latent Structure Models for Natural Language Processing,用于自然语言处理的隐含结构模型

隐式结构模型是处理复合数据,挖掘语言结构和构建NLP数据处理流水线的非常有效的工具。它们有两大优势:它们可以在训练过程中整合结构偏差,使模型更加准确;他们还可以找到隐含的语言结构,从而获得更好的可解释性。

本讲座将介绍近年来离散隐式结构模型的发展。内容具体,首先介绍了现有方法的动机,潜力和局限性,然后详细讨论了设计此类模型的三种策略:梯度近似,强化学习和端到端差分方法。讲座将重点关注这些方法之间的联系及其优缺点。解释的方法已用于许多NLP任务,例如情感分析,自然语言推理,语言建模,机器翻译,语义分析等。通过解释实例和评估结果,NLP从业者将更多地了解哪种方法适合解决自己的问题。

教学讲座 2: Graph-Based Meaning Representations: Design and Processing,基于图的意思表征:设计以及处理

(北京大学孙伟伟先生也是本讲座的发言人之一)

在过去几年中,以标记有向图形式编码和处理句子含义的方法受到了极大的关注。在这个方向上有许多研究框架,包括抽象意义表示,最小递归语义的基于图形的渲染,以及双向字法语依赖图。双语语义依赖图)和通用概念认知注释。

作为句子意义的高级向量表示的补充,层次表示的层次表示和语义从一开始的语义表示也是NLP研究的重要基石。未来将继续在理解自然语言方面发挥重要作用。影响。本教学讲座将首先简要回顾形式语义和语言语义的相关背景,然后对不同的语义图和相关词汇进行半正式的抽象定义,然后比较和总结基于图的基于意义的表征框架和现状。有些库,最后从技术角度如何选择不同的代表性分析方法。本讲座的最终目标是为不同的语义库和相应的分析研究提供统一的视角,并为入门级自然语言处理开发人员和用户消除使用最新技术和最佳用例的障碍。

教学讲座 3: Discourse Analysis and Its Applications,话语分析及其应用

话语处理是一系列NLP任务,它们从文本中提取多个不同级别的语言结构,可用于支持许多文本挖掘应用程序。它包括识别一组会话内容中的主题结构,识别一致的结构,识别互相关结构以及识别对话结构。这些提取的结构可用于推断文本摘要,文章评分,情感分析,机器翻译,信息提取,问题和答案以及线索重建。

本讲座将首先介绍话语分析的基本概念:单向文本&对话,同步和非同步对话,以及对分析中关键语言结构的讨论。然后我们将介绍传统的机器学习方法以及一些最新的基于深度学习的方法,并比较它们在评估数据上的表现。对于所提到的每个话语结构,本讲座将介绍其在下游文本挖掘任务中的用途,以及评估它们的方法和指标的详细信息。最后,我们将讨论该领域的未来挑战和发展机遇。

教学讲座 4: Computational Analysis of Political Texts: Bridging Research Efforts Across Communities,政治文本的计算性分析:沟通不同领域的研究成果

利用计算方法研究政治内容的文本经历了快速发展,现在在政治学研究中也形成了一批不断壮大的“基于文本的数据”的研究者。 NLP方法被广泛用于许多分析和任务中,包括从文本记录中猜测一个人的政治立场,在政治文本中检测意见,以及分析在政治沟通中使用风格(例如在政治过程中的语义混淆)议程)。性的作用)。政治科学研究人员已经建立了许多资源,并使用一些NLP方法来处理文本数据;这个过程很大程度上独立于NLP研究人员。

与此同时,NLP研究人员还研究了许多非常相似的任务,例如选举结果预测,思想分类和位置检测。这两组研究人员对彼此之间几乎没有了解。 NLP研究人员对政治科学中这些有趣的应用知之甚少。政治学家不知道哪种新的NLP方法可以用来解决它们。问题。本讲座将全面概述政治文本计算分析领域的研究成果,以及NLP研究人员相关研究的最新进展。类似的任务。

教学讲座 5: Wikipedia as a Resource for Text Analysis and Retrieval,把维基百科作为文本分析和检索的资源

许多网民提供的维基百科文章不仅反映了公众或网民日益增长的兴趣,也反映了迄今为止最大的开放,分散,非结构化或半结构化知识。图书馆。本讲座分析了维基百科如何作为文本分析和检索的文本库。维基百科可以发挥积极作用的文本分析任务包括共同手指分析,词义和实体去模糊以及信息提取。

对于信息检索任务,它可以更好地理解查询指令的结构和含义,也可以帮助更好地匹配文档查询,聚合查询结果,并为热实体的查询提供知识检索。本教程将比较维基百科和其他手动收集的知识库的特性和优缺点。它将介绍将维基百科的半结构化数据转换为结构化数据的出口资源,并介绍维基百科及其出口。资源可以在文本分析和增强的信息检索中发挥作用。

教学讲座 6: Deep Bayesian Natural Language Processing,深度贝叶斯自然语言处理

本讲座将介绍自然语言处理的深贝叶斯学习的发展,以及语音识别,文本摘要,文本分类,文本分割,信息提取,图像描述生成,句子生成,对话控制和情感分类。广泛用于许多任务,如推荐系统,问答,机器翻译等。传统上,我们使用“深度学习”来描述基于实际值的推理和优化过程的确定性模型。然而,从文档中提取的单词,句子,实体,动作和“语音结构”可能不是精确的数学或计算机程序。正确表达或优化。离散或连续隐藏变量的自然语言模型中的“分布函数”可能无法被正确地分解或预测。

本讲座介绍了统计模型和神经网络的基础知识,重点介绍了一系列先进的贝叶斯模型和深度模型。还介绍了这些模型之间的联系的原因,这些模型可以在许多符号表示和复杂的自然语言模式中发挥作用。教学内容还包括:为解决复杂模型优化问题而提出的变更推理和抽样方法,将单词表示,句子表示,聚合和协同聚合与语言约束和语义限制相结合,分别解决贝叶斯深度问题。关于学习和理解中不同问题的案例研究,以及未来研究的一些方向和前景。

教学讲座 7: Unsupervised Cross-Lingual Representation Learning,无监督的跨语言表征学习

件和要求的效果; 3,弱相关语言的更健壮的方法可以改善不稳定性和不良性能; 4,如何全面评估这些特征; 5,介绍可以从跨语言词表征中受益的实际应用。

教学讲座 8: Advances in Argument Mining,争论挖掘领域的进步

争议和辩论是公民社会和智慧生活的基石。辩论的处理支持了政府的运作,建立了科学进步,形成了宗教信仰。当我们更好地理解参数是如何形成的,如何解释它们以及它们如何影响它们时,我们现在还可以询问有关如何建模机器和复制自然语言参数的识别,重建和解释的计算问题。评估,推理过程。

本讲座的目的是向学生介绍这一领域,该领域在过去三年中取得了巨大进步,并在此期间展示了重要的研究成果。争议挖掘基于意见挖掘和情感分析,它不仅与提取人们的想法有关,而且与他们持有这些想法的原因有关。今天有数百篇论文,数百万美元的商业和研究投资。

教学讲座 9: Storytelling from Structured Data and Knowledge Graphs : An NLG Perspective

在本讲座中,我们将讨论将结构化数据和知识库转换为自然语言话语的基础知识,方法和系统开发方法。本讲座的内容包括自然语言生成(NLG)任务的挑战和方法,特别强调从(结构化)数据到文本的转换范式。

我们预计受众将获得以下好处:1。如何使用基本和最流行的NLP和NLG技术来描述和汇总非语言或结构化文本数据; 2.对一些开放性问题,未来有一些见解或许它可以导致重要的科学研究成果。我们将全面介绍从数据表示到领域适应的各种方法,从数据到文本,以及传统的基于规则的启发式方法,以及现代A数据驱动的深度学习架构,简单讨论评估和质量预测。

9教学讲座PPT包下载链接:

ACL2019首日开幕式的内容公告也已发布,请参阅此文章。

更多ACL 2019会议内容报道,未来更多热门新闻,请继续关注雷锋网络AI技术评论。