400-640-8558
Toggle Menu

英国留学生自然语言处理专业知识科普

发布时间: 2021-07-22 17:02:00
文章来源: 考而思
摘要:
自然语言处理( Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。

  机器人真的是一个非常有趣的东西,他们模仿我们进行语言或任何可能进行的活动,同学们在研究机器人的同时,会发现其内部的计算机操控着一切,计算机是有自己独特的语言的,我们在了解计算机语言后了解了计算机本身的内涵,我们可以随意的编译他们,让他们帮助我们完成一些复杂的项目。

  与计算机语言类似的,机器人也有着他们独特的编译语言,结合了计算机科学与人工智能科学双重领域的全新研究领域的科学出现了,叫做自然语言处理,同时衍生了相对应的专业学科。

  自然语言虽说是机器语言,但是从某种程度上来讲,研究也涉及了自然语言,也就是我们人所常用的语言,这么想来,这门专业学科还需要和语言学相互有着密切的联系,有联系是必然的,但是两者间有着重要的区别。

  专业主要涉及计算机科学的分支,自然语言处理致力于制造能够理解和响应文本或语音数据的机器,并以自己的文本或语音做出响应,就像人类一样理解文本和口语。这是一种非常新颖的技术,涉及未来的很多领域。

自然语言

  几个自然语言处理任务分解人类文本和语音数据,帮助计算机理解它摄取的东西。

  1、语音识别

  将语音数据可靠地转换为文本数据的任务,遵循语音命令或回答口头问题的应用程序都需要语音识别。让语音识别变得特别有挑战性的是人们说话的方式——快速、含糊不清的单词,不同的重音和语调,不同的口音,经常使用不正确的语法。

  2、词性标注

  也称为语法标记,是根据特定单词或文本的用法和上下文来确定其词性的过程。词性在“我能做纸飞机”中将“制造”作为动词,在“你拥有什么样的汽车”中将“制造”作为名词

  3、词义消歧

  通过语义分析过程来选择具有多重含义的单词的含义,从而确定在给定上下文中最有意义的单词。例如,词义消歧有助于区分动词“make”在“make the grade”(成绩)和“make a bet”(地点)中的含义。

  4、命名实体识别

  或者NEM,认为单词或短语是有用的实体。NEM将“肯塔基”作为一个地点,将“弗雷德”作为一个人的名字。

  5、共同参考分辨率

  识别两个词是否和何时指代同一个实体的任务。最常见的例子是确定某个代词所指的人或物体(例如“她”=“玛丽”),但也可能涉及识别文本中的隐喻或习语(例如,“熊”不是动物,而是一个多毛的大人物)。

  6、情感分析

  试图从文本中提取主观品质——态度、情绪、讽刺、困惑、怀疑。

  7、自然语言生成

  有时被描述为语音识别或语音转文本的对立面;这是将结构化信息转化为人类语言的任务。

自然语言处理

  自然语言处理将计算语言学,与统计、机器学习和深度学习模型相结合。这些技术共同使计算机能够以文本或语音数据的形式处理人类语言,并“理解”其全部含义,包括说话者或作者的意图和情感。

  自然语言无疑是一门高新技术领域中个的主要科研目标,未来会不会由机器人来代替人们进行一些工作,或者我们将眼光再放远一些,或者说让我们的想法更加大胆一些。

  机器与人相互交流,就像人工智能领域中的机器人,谁不想拥有一位属于自己的多啦A梦呢?在交互的过程中,语言交流必不可少,有了语言的支持,人工智能才能真正的得到质的飞跃。

  如果要在研究领域得到一定的成果,同学们需要掌握语言学,同时精通计算机科学中的语言知识,了解人工智能的运作方式。

  进入统计NLP,它将计算机算法与机器学习和深度学习自动提取、分类和标记文本和语音数据元素的模型,然后为这些元素的每个可能含义分配统计似然性。如今,基于卷积神经网络(CNNs)和递归神经网络(RNNs)的深度学习模型和学习技术使自然语言处理系统能够在工作时“学习”,并从大量原始、非结构化和未标记的文本和语音数据集中提取更准确的含义。

自然语言处理知识

  关于NLP用例

  垃圾邮件检测

  可能不认为垃圾邮件检测是一种NLP解决方案,但是最好的垃圾邮件检测技术使用NLP的文本分类功能来扫描电子邮件中经常指示垃圾邮件或网络钓鱼的语言。这些指标可能包括金融术语的过度使用、典型的不良语法、威胁性语言、不恰当的紧迫性、拼错的公司名称等等。垃圾邮件检测是少数几个专家认为“大部分已经解决”的自然语言处理问题之一(尽管你可能会说这与你的电子邮件体验不匹配)。

  机器翻译

  有效的翻译必须准确捕捉输入语言的意义和语气,并将其翻译成与输出语言具有相同意义和预期影响的文本。机器翻译工具在准确性方面正在取得良好进展。测试任何机器翻译工具的一个很好的方法是将文本翻译成一种语言,然后回到原文。一个经常被引用的经典例子:不久前,翻译”精神是愿意的,但肉体是软弱的”从英语到俄语,又回到了“屈服”伏特加不错,但是肉烂了。“今天,结果是”精神渴望,但肉体是软弱的,“这并不完美,但激发了人们对英俄翻译的信心。

NLP语言科学

  虚拟助理和聊天机器人

  苹果的Siri和亚马逊的Alexa等虚拟助手使用语音识别来识别语音命令中的模式,并生成自然语言,以适当的动作或有用的评论来回应。聊天机器人对键入的文本条目执行同样的魔法。其中最好的人还学会识别关于人类请求的上下文线索,并随着时间的推移使用它们来提供更好的响应或选项。这些应用程序的下一个增强功能是问题回答,用他们自己的话回答我们的问题(无论是预期的还是不预期的)的能力。

  社交媒体情绪分析

  NLP已经成为从社交媒体渠道发现隐藏数据见解的必不可少的商业工具。情绪分析可以分析社交媒体帖子、回复、评论等中使用的语言,以提取对产品、促销和事件的态度和情绪——信息公司可以在产品设计、广告活动等中使用。

  未来社会的发展离不开语言的研究,如果同学们在学习自然语言处理专业中遇到困难,有可能是某一个学科领域没有领悟或者学习透彻,其实也很正常,毕竟多学科之间紧密相连,需要同学们进行课件的整理与研究,完成专业课程的学习。

课程听不懂?作业不会写?复习没方向?专业老师为您答疑解惑
展开