第二章 使用 SQL Search

这篇具有很好参考价值的文章主要介绍了第二章 使用 SQL Search。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

第二章 使用 SQL Search

SQL Search

本主题介绍 SQL Search工具,这是一种用于执行上下文感知文本搜索操作的工具。要使用SQL Search,必须为包含要搜索的文本的每个列定义 SQL 搜索索引。然后,可以使用标准 SQL 查询以及包含 InterSystems SQL 搜索语法的 WHERE 子句来搜索文本记录。查询将返回包含指定搜索项的所有记录。还可以突出显示返回记录中的匹配文本。

在你开始之前

需要有一个已启动并正在运行的 IRIS 实例,并且具有有效的许可证密钥,可以提供对 IRIS 自然语言处理器 (NLP) 的访问。 (可以从管理门户查看许可证密钥:选择“系统管理”,然后选择“许可”。)

本文档中的示例使用 Aviation.Event SQL 表中的数据。如果希望使用此示例数据,可以 https://github.com/intersystems/Samples-Aviation 中获取。 (不需要了解有关 GitHub 的任何信息或拥有 GitHub 帐户。)找到 README.md 文件的内容,该文件显示在 GitHub 存储库中包含的文件名和目录下方。滚动到 README.md 文件底部的“安装说明”部分并完成这些步骤。

SQL 搜索的索引源

可以使用 SQL Search 来搜索 %String 数据类型或 %Stream.GlobalCharacter(字符流)数据类型中的文本。

要执行 SQL Search,要搜索的列必须具有已定义的 SQL 搜索位图索引。 SQL 搜索索引有四个级别。这些级别在嵌套子类中定义。每个索引级别都提供前一级别的所有功能,以及特定于该级别的其他 SQL 搜索功能。可以创建以下任何 SQL 搜索索引类型:

  • 最小索引(%iFind.Index.Minimal):支持使用通配符、模糊搜索和正则表达式进行 SQL 单词和短语搜索。它不支持共现或位置短语搜索或搜索结果的突出显示。
  • 基本索引(%iFind.Index.Basic):支持使用通配符的 SQL 单词和词组搜索。它支持共现和位置短语搜索以及搜索结果的突出显示。
  • 语义索引(%iFind.Index.Semantic ):支持 NLP 实体的 SQL 搜索,并可选择支持否定属性。
  • 分析索引(%iFind.Index.Analytic):支持语义索引的所有 NLP 功能,以及路径、邻近度和优势信息。

每个索引级别都支持前一级别的所有参数,并添加一个或多个附加参数。未指定的参数采用默认值。

以下类定义示例创建一个表,该表在 Narrative 属性(列)上具有语义索引。索引属性可以是数据类型 %String%Stream.GlobalCharacter

   Class Aviation.TestSQLSrch Extends %Persistent [
      DdlAllowed,Owner={UnknownUser},SqlRowIdPrivate,
      SqlTableName=TestSQLSrch ]
  { 
  Property UniqueNum As %Integer;
  Property CrashDate As %TimeStamp [ SqlColumnNumber=2 ];
  Property Narrative As %String(MAXLEN=100000) [ SqlColumnNumber=3 ];
  Index NarrSemanticIdx On (Narrative) As %iFind.Index.Semantic(INDEXOPTION=0,
     LANGUAGE="en",LOWER=1);
  Index UniqueNumIdx On UniqueNum [ Type=index,Unique ];
  }

任何类型的 SQL 搜索索引都支持以下参数:

  • IGNOREPUNCTUATION 指定是否忽略标点符号。对于 %iFind.Index.Minimal,默认值为 1:忽略标点符号。对于所有其他 SQL 搜索索引类型,默认值为 0:标点符号影响搜索结果;文本中的前导标点符号和尾随标点符号必须与搜索字符串中的相同标点符号匹配。
  • INDEXOPTION 指定是否建立索引以允许词干或分解。由于支持这些操作的索引会显着增加索引的大小,因此建议指定 INDEXOPTION=0,除非很可能会使用词干提取或分解。默认值为 0
  • LANGUAGE 指定索引记录时使用的语言。例如,“en”指定英语。使用“*”启用自动语言识别。默认为“en”
  • LOWER 指定查询搜索是否区分大小写。默认情况下, SQL 搜索索引不区分大小写; SQL 搜索在对其建立索引之前将文本标准化为小写。 LOWER 参数确定是否执行小写标准化(LOWER=1,默认值,标准化为小写)。由于语言约定通常在句子开头或在标题中使用单词时将其大写,因此在大多数应用中优选标准化为小写。如果指定 LOWER=0,则查询 search_items 字符串区分大小写。例如,如果指定 LOWER=0,则查询 search_items 字符串“turkey”将仅匹配 turkey,而不匹配 Turkey。如果指定 LOWER=1,则查询 search_items 字符串“turkey”将匹配 turkey 和 Turkey。
  • USERDICTIONARY 允许指定在索引之前应用于文本的用户定义的 UserDictionary 的名称。此参数是可选的,仅供高级使用。

语义索引(%iFind.Index.Semantic)还支持以下可选参数:文章来源地址https://www.toymoban.com/news/detail-811442.html

  • IFINDATTRIBUTES 允许指定是否识别文本中的否定并存储否定属性。 IFINDATTRIBUTES=1 标识并索引否定。默认值为 IFINDATTRIBUTES=0

到了这里,关于第二章 使用 SQL Search的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • (SpringBoot)第二章:Spring创建和使用

    注意 :在Java中对象也叫做Bean,所以后续文章中用Be

    2024年02月08日
    浏览(43)
  • 第二章:在html中使用javascript

    1、在html页面中插入js的主要方法就是使用script元素 2、html4.01为script定义了以下6个属性:【language已经废弃,其他5个属性都是可选的】 async  表示应该 立即下载脚本 ,但不应该妨碍页面中的其他操作,比如下载其他资源或等待加载其他脚本, 仅对外部文件有效【指定async属

    2024年02月17日
    浏览(36)
  • C#使用MongoDB-第二章 序列化

    这里在C#中所使用的连接MongoDB数据库的依赖库为 MongoDB.Driver ,使用前先到Nuget中进行安装。 默认情况下,在我们对MongoDB数据库进行CRUD时,MongoDB.Driver(以后简称驱动库)会自动为我们根据属性、属性类型,将实体类型转换为对应的BSON。 实体类 对应的BSON 1、主键Id 默认情况

    2024年01月22日
    浏览(51)
  • 第二章-Spring Boot Starter介绍和使用

            我们知道Spring Boot大大简化了项目初始搭建以及开发过程,而这些都是通过Spring Boot提供的starter来完成的。品达通用权限系统就是基于Spring Boot进行开发,而且一些基础模块其本质就是starter,所以我们需要对Spring Boot的starter有一个全面深入的了解,这是我们开发品

    2024年01月22日
    浏览(48)
  • ElasticSearch第二章(ES8.X的使用)

    目录 1:ES的使用(DSL创建索引库-相当于表) 1.1:什么是索引库 1.2:索引库的增删改查使用 2:ES的使用(DSL操作文档-相当于数据) 2.1:什么是文档 2.2:文档的增删改查 3:java代码开发 3.1:准备工作 3.2:代码操作索引(也就是表的增删改查) 3.3:代码操作文档(也就是数

    2024年03月23日
    浏览(46)
  • WebRTC实战-第二章-使用WebRTC实现音视频通话

    、 什么是WebRTC|WebRTC入门到精通必看|快速学会音视频通话原理|WebRTC超全资料分享FFmpeg/rtmp/hls/rtsp/SRS WebRTC **WebRTC详细指南** http://www.vue5.com/webrtc/webrtc.html WEBRTC三种类型(Mesh、MCU 和 SFU)的多方通信架构 WebRTC API包括媒体捕获,音频和视频编码和解码,传输层和会话管理 。 假设

    2023年04月12日
    浏览(53)
  • 在.NET Framework中使用RocketMQ(阿里云版)实战【第二章】

    章节 第一章:https://www.cnblogs.com/kimiliucn/p/17662052.html 第二章:https://www.cnblogs.com/kimiliucn/p/17667200.html 作者:西瓜程序猿 主页传送门:https://www.cnblogs.com/kimiliucn/ 上一章节主要介绍了RocketMQ基本介绍和前期准备,以及如何创建生产者。那这一章节主要介绍一下消费端的实现、如何

    2024年02月11日
    浏览(39)
  • 【云计算与虚拟化】第二章 实验一 VMware Workstation的使用

    实验一   vmware workstation的使用 安装Windows Server 2012 R2虚拟机,并激活 (计算机命名为:学号 + 姓名拼音的首字母) 2.在 Windows Server 2012 R2 的虚拟机中安装 VMTools 3.关机创建快照 (快照命名为:学号 + 姓名拼音的首字母) 4.通过启用共享文件夹的形式让虚拟机访问主机的文件

    2024年02月05日
    浏览(60)
  • 【云计算与虚拟化】第二章 实验二 Vmware Workstation 15的使用

    实验二   Vmware Workstation 15的使用 在上一实验的基础上,将两台虚拟机调节到在桥接模式下,配置相应的网络参数,实现虚拟机1和2能相互通信,虚拟机1和2能够ping通外网,虚拟机1和2能ping通物理机。 (截取虚拟网络编辑器中桥接的信息以及两台虚拟机调节到在桥接模式的

    2024年02月06日
    浏览(54)
  • 第二章(第二节):无穷小量和函数

    若 lim f(x) = 0 , 则称函数 f(x) 当 x → x 0 时是无穷小量,简称: 无穷小 。      x→ x 0 定理1. 有限多个 无穷小量的代数和仍是无穷小量 定理2. 有限多个 无穷小量的积也是无穷小量 定理3.常数与无穷小量的积也是无穷小量 定理4.有界变量与无穷小量的积是无穷小量 当 x→

    2024年02月08日
    浏览(53)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包