了解人工智能AI

什么是人工智能

是魔术吗?亚瑟·克拉克(Arthur C Clarke)在被理解之前,任何足够先进的技术都是不可思议的。计算机人工智能只是一种非常先进的软件,而仅仅是软件。AI人工智能主要有两种主要类型:AGI和NarrowAI。AGI被定义为系统能够理解和以与人类类似的方式学习,这种AI距离现实还有很多年。第二种人工智能是针对特定用例(例如Google)设计的Narrow AI。翻译图像处理自驾车SIRI问答系统Seal AI驱动合约分析平台使用这种类型的AI

在法律行业中,人工智能的旗帜下目前包含多种方法和功能

对于此博客,我们专注于基于文本的AI,特别是具有深度学习和半监督监督学习的机器学习两者都利用了能够通过示例进行学习并且是Narrow AI中发展最快的方面的算法

人工智能的学习能力是指它能够采取示例(包括语言图片数据等)并存储它们的数字表示形式以便将来与新示例进行比较的能力。训练机器学习受监督半监督和无监督

  • 监督学习是人类通过提供许多带有标签的示例来进行授课的地方,然后通过主动学习或反馈回路进一步改进系统
  • 半监督学习的定义是从未标记的数据预教导系统,然后提供较少数量的标记的数据来微调系统的预测
  • 无监督学习是仅向系统提供数据并通过其选择的功能来学习表示信息的地方,即选择仅数据且无需人工干预即可驱动预测的地方

监督学习需要高质量的训练数据领域专家和潜在的数据科学家来训练软件使用的模型。结果模型可能是一个黑盒,其完全取决于训练的数量和质量,或者可以通过特征选择和生成来影响来自数据科学家的准确模型依赖于相关数据和人工审查,创建起来可能既昂贵又耗时

无监督或深度学习类似于人类的预训练。它以最少的示例提供答案,而是依靠更细粒度的预训练,包括语法语法标点模式,并且更多的预训练可以通过使用诸如Wikipedia的大量公共信息来实现。和在线书籍深度学习模型可能是最高效,最准确的模型,但是它们需要大量的计算能力才能创建初始模型。就效率而言,深度学习方法还允许采用一种转移学习的形式,在该学习中,一项任务的预训练可以应用于其他类似任务这可以节省培训时间和数据量,并提高新领域内的培训速度。这种培训类型还允许进行语言翻译和培训,一旦使用了许多方法

虽然这两种方法在某些任务上都表现出色,但它们却不太适合其他任务,因此,应结合使用其他技术。规则和半监督这两种技术

  • 规则是明确定义的声明这些规则擅长于查找常规模式,例如电话号码,邮政编码和合同ID。它们在语言差异和拼写错误方面遇到困难,但是规则非常精确,它们要么是真匹配,要么是假不匹配
  • 半监督依靠单词相似度的频率和分布来生成结果,它们通过在单个示例或最近邻居的无监督但固定的簇周围进行聚类来查找整个数据集中常见的标准化语言,非常有效。

正如我们所看到的,每种技术都有其自身的优缺点。优化的解决方案将为每种任务选择并应用正确的技术组合,从而产生最高效,最精确的结果

用例规则聚类或ML DL

这是三个示例,说明您是否可以为任务概述选择合适的技术

  1. 我正在寻找出现在预定义字符串中的联系人ID
    • 规则
    • 聚类
    • ML DL
    • 技术结合
  2. 我的业务受到公共健康危机的威胁。如何找到类似于我的“不可抗力”示例的语言,以及rd当事人条款此外还有大流行的排除
    • 规则
    • 聚类
    • ML DL
    • 技术结合
  3. 我正在寻找合同的主导语言,但措辞变化很大,并且没有很多示例
    • 规则
    • 聚类
    • ML DL
    • 技术结合

查看答案并了解有关Seal人工智能的更多信息点击这里