提升搜索效率:深入了解Amazon Kendra的强大功能

article/2025/8/21 12:38:29

从智能文档搜索到精准的自然语言处理,Amazon Kendra为企业提供了一个强大的解决方案,帮助我们突破传统搜索引擎的局限,快速实现信息的高效整合与检索,接下来让我们一起探索Amazon Kendra如何成为工作中的得力助手,提升生产力。

目录

初识Amazon Kendra

亚马逊云科技账号注册 

使用Amazon Kendra

写在最后

初识Amazon Kendra

        Amazon Kendra:是由亚马逊推出的一款基于人工智能的智能搜索服务,它专为企业设计旨在帮助组织更高效地从大量数据中提取相关信息,通过自然语言处理(NLP)技术,Amazon Kendra能够理解用户查询的意图并从企业的不同数据源中快速精准地检索出相关答案。

        与传统的搜索引擎不同,Amazon Kendra能够处理多种格式的文件和数据源,包括文档、电子邮件、数据库、网站内容等。它支持多语言并可以通过与其他亚马逊云科技服务的集成,进一步提升搜索的深度和精度,其优势在于其智能化的搜索能力,不仅能根据关键词进行匹配,还能理解上下文,提高检索的准确度,从而帮助企业提高工作效率、加快决策速度,并优化知识管理流程,我们可以来到亚马逊云科技的 亚马逊云科技 可以看到,亚马逊云科技提供了很多的云服务内容,这里我们可以看到今天博主讲解的Elastic Load Balancing也赫然其中:

        作为一款智能搜索服务的Amazon Kendra特别适用于企业和组织中大量信息的管理与检索。以下是它的几个主要优势: 

1)智能化的自然语言处理:Kendra能够理解自然语言查询,不仅仅是基于关键词的匹配,用户可以用日常语言提出问题,Kendra会自动分析上下文提供更相关和精确的答案

2)跨数据源搜索:Kendra能够连接并搜索多个数据源,包括本地存储、云端存储(如Amazon S3)、数据库、企业应用(如SharePoint、Salesforce)等,它能统一检索不同格式和类型的数据帮助用户快速找到所需信息

3)高效的信息提取与整理:通过机器学习技术Kendra能够根据企业的特定需求优化搜索结果,过滤掉无关信息并自动整理出最有价值的内容,从而提升工作效率

4)自定义搜索体验:用户可以根据自己的需求定制Kendra的搜索结果,包括调整排序和优先级以及设置特定的搜索领域,使得结果更贴近实际需求

        对于Amazon Kendra博主也不可能讲解的面面俱到,本文博主就举一个简单的示例进行讲解,作为一个抛砖引玉的作用而已,如果有感兴趣的朋友可以随时阅读官方文档,里面也是详细介绍了该服务的具体服务内容及其搭建使用教程,也是能够帮助大家可以对该服务进行快速入门的,可以点击 地址 进行查看:

亚马逊云科技账号注册 

        如果是第一次使用亚马逊云科技服务的人,第一步肯定是要先注册账号了,这里我将注册账号的流程简单的分享一下给大家,如下所示:

首先打开 亚马逊云科技 亚马逊云科技的 官网,然后点击右上角的创建用户按钮,创建新的账户:

然后输入要创建的邮箱地址,然后点击验证邮箱地址,在邮箱中找到验证码然后输入即可: 

然后验证通过之后输入一下要创建用户的密码即可,如下所示:

下一步就是输入一些相应的个人信息即可: 

然后下一步就是输入自己的账号信息即可,一般都是visa卡就可以: 

后面就是要确认一下输入的信息,然后进行一个身份的验证,这里选择短信验证然后地区选择中国就行,下一步就是进行短信验证了: 

下一步就是选择自己的支持计划,根据自身情况,个人开发就选择第一个,企业的话选择后面两个都可以: 

        点击完成注册之后,等待一段时间亚马逊云科技会进行一些验证,验证通过然后我们转到登录页面,输入我们刚才创建好的账户即可,然后就进入到管理控制台进行相关操作,如下控制台我们就可以使用不同的亚马逊云科技提供的各种服务进行使用了: 

使用Amazon Kendra

        接下来展示如何利用Amazon Kendra开发企业级搜索引擎,我们可以在一个小时内完成新的Amazon Kendra索引的设置而不需要具备深厚的技术知识或丰富的机器学习背景,在创建Amazon Kendra索引之前,我们需要先把文档上传到S3的存储桶里。当数据访问完毕后,就可以将文件加载到存储桶当中进行进一步处理,以下截屏所示为amazon_help_docs文件的内容:

要创建您的第一个Amazon Kendra索引,需要在控制台上选择Services,然后在Machine Learning之下选择Amazon Kendra,如下图所示:

        Amazon Kendra主页面中选择Create an Index,在Index details部分的Index name当中输入kendra-blog-index,在Description部分输入My first Kendra index,在IAM role部分选择Create a new role,在Role name部分输入-index-role,在Encryption部分不要选择Use an KMW managed encryption key,在默认情况下数据将使用Amazon Kendra所拥有的密钥进行加密:

        关于Amazon Kendra创建的IAM角色的更多详细信息,Amazon Kendra提供两个版本,其中Kendra Enterprise版主要为生产类工作负载提供高可用性服务,Kendra Developer版则适用于构建概念验证与试验,在本文中我们将使用Developer版,在Provisioning editions部分选择Developer edition,选择Create:

索引创建过程最多可能需要30分钟。在创建完成之后将在页面上方看到一条消息提示索引已经成功创建:

        数据源是存储文档以进行索引的位置,可以将数据源与Amazon Kendra索引自动同步保证搜索能够正确反映源存储库内的新文档、更新文档或者已删除文档,在继续下一步之前请保证索引已经创建完成且索引状态显示为Active,在kendra-blog-index页面中选择Add data sources: 

        Amazon Kendra支持六种数据源类型:Amazon S3、SharePoint Online、ServiceNow、OneDrive、Salesforce online以及Amazon RDS,在本文中我们使用Amazon S3。在Amazon S3之下选择Add connector:

        在Define attributes部分的Data source name位置输入amazon_help_docs,在Description部分输入亚马逊云科技中的 services documentation,选择Next,如下图所示:

        在默认情况下元数据文件将与文档存储在同一目录当中,如果要将这些文件放置在其他文件夹中可以通过添加前缀实现,在Select decryption key部分取消全部勾选项,在Role name部分输入 source-role,在Additional configuration部分可以添加模式以包含或排除某些文件夹或文件,在本文的示例中请直接保留默认值:

        在Frequency部分选择Run on demand,这一步定义了数据源与Amazon Kendra索引间的同步频率,对于本次演练可以手动执行同步操作,选择Next,如下图:

        在数据源创建完成之后选择Sync now 将文档与Amazon Kendra索引进行同步,整个同步过程的持续时间取决于您索引的文档数量,在本用例中可能需要15分钟之后您应看到一条消息提示您同步成功:

Amazon Kendra能够接受.csv文件当中每一行以问题开头、以答案结尾的内容。具体参见下表:

问题答案URL(可选)

What is the height of the Space Needle?

605 feet

https://www.spaceneedle.com/

How tall is the Space Needle?

605 feet

https://www.spaceneedle.com/

What is the height of the CN Tower?

1815 feet

https://www.cntower.ca/

How tall is the CN Tower?

1815 feet

https://www.cntower.ca/

下面来看本示例中使用的.csv文件格式:

"How do I sign up for the Amazon Prime free Trial?"," To sign up for the Amazon Prime free trial, your account must have a current, valid credit card. Payment options such as an Amazon.com Corporate Line of Credit, checking accounts, pre-paid credit cards, or gift cards cannot be used. "," https://www.amazon.com/gp/help/customer/display.html/ref=hp_left_v4_sib?ie=UTF8&nodeId=201910190”

        在FAQ settings下的S3部分输入 s3://kendrapost-{your account id}/faqs/kendrapost.csv,在IAM role部分选择Create a new role,在Role name部分输入faqs-role(您的角色名称应使用 AmazonKendra-YourRegion-前缀),如下图所示:

选择Add稍等一会儿,直到状态显示为Active:

        现在可以在搜索控制台上查看常见问题能否正常起效了,在Indexes之下选择索引,在Data management之下选择Search console,如下图所示:

在搜索字段中,输入 How do I sign up for the Amazon Prime free Trial? 以下截屏所示,为Amazon Kendra将您之前上传的常见问题添加至结果清单,并提供答案与指向该文档的链接: 

当然我们也可以在应用程序中通过搜索控制台添加以下组件:

1)Main search page:包含所有组件的主页,可以将应用程序与Amazon Kendra API集成起来

2)Search bar:可在其中输入搜索词并调用搜索功能的组件

3)Results:显示Amazon Kendra结果的组件其中包含三个部分:最佳答案、常见问题解答结果与建议文档

4)Pagination:用于对Amazon Kendra响应结果进行分页的组件

        Amazon Kendra还提供可部署在您网站中的源代码。此项功能基于修改后的MIT许可,因此您可以直接套用或者根据实际需求做出修改,以下截屏所示,为即使演示网页运行在计算机本地,其结果仍与我们从Amazon Kendra控制台处获得的完全相同。

写在最后

        在信息爆炸的时代,如何快速高效地从海量数据中提取出有价值的知识已经成为企业成功的关键,Amazon Kendra凭借其强大的人工智能和自然语言处理能力,正为企业提供着前所未有的搜索体验。从跨数据源的智能检索,到个性化的结果优化,它不仅提高了工作效率,还为决策者提供了更准确、更有深度的见解。,如果感兴趣的朋友也可以去体验一番:亚马逊云科技

        与传统的搜索系统相比,Kendra能够理解和响应自然语言查询,意味着用户可以像与人对话一样提出问题,而系统则能准确把握问题的语境,返回最相关的答案。这一创新特性,使得不论是技术人员还是非技术人员,都能享受智能搜索带来的便捷。而Kendra的个性化调整功能,更能根据不同企业的需求,定制最适合的搜索体验,确保每一位用户都能快速找到最具价值的信息: 

        Amazon Kendra的到来不仅是信息检索的革新更是企业知识管理与数字化转型的加速器,从提升工作效率到促进团队协作,再到加强企业决策能力,它为各行各业提供了无穷的可能,随着智能搜索技术的不断发展,Kendra无疑会继续为全球企业提供更先进、更智能的解决方案,如果决定不再使用服务的话,记得要在控制台关闭服务,以防超过免费额度产生扣费。

亚马逊云科技上海峰会展示云计算前沿技术与实践,涵盖机器学习、大数据等热点。专家现场指导,丰富动手实验,立即注册 开启您的云转型之旅!


http://www.hkcw.cn/article/BqyNZtHsGC.shtml

相关文章

社群营销:信任比流量值钱

你肯定见过那种群里天天甩链接的,动不动就所有人,点进去全是促销信息——这种玩意儿不叫社群营销,顶多是广告轰炸。 搞社群得先把自己当人,也把别人当人。别整那些机器人自动回复,谁半夜两点发消息都秒回,…

嵌入式工作项目中的线程管理(监控线程和重启线程的具体实现)

嵌入式工作项目中的线程管理(监控线程和重启线程的具体实现) 1. 背景 环境:ARMv7,Linux; 软件所处位置:应用层; 问题出现概率:偶先,概率极小; 问题描述: 一个负责校时的进程,里面有一个是网络校时的线程和一个 GPS 校时的线程,还有处理其他一些业务的线程;出现…

【图像处理基石】立体匹配的经典算法有哪些?

1. 立体匹配的经典算法有哪些? 立体匹配是计算机视觉中从双目图像中获取深度信息的关键技术,其经典算法按技术路线可分为以下几类,每类包含若干代表性方法: 1.1 基于区域的匹配算法(Local Methods) 通过…

Unity QFramework 简介

目录 什么是MVC模式? QFramework 架构提供了 Model 的概念 QFramework 架构引入 Command 的方式 QFramework 架构引入 Event事件机制 四个层:表现层、系统层、数据层、工具层 委托和回调函数的关系 命令和事件的区别 工具篇 QFramework整体基于M…

非线性声学计算与强化学习融合框架:突破复杂环境人机交互的新技术

随着人工智能的快速发展,尤其是在深度学习和强化学习领域,声学计算和人机交互进入前所未有的扩展和创新阶段。尽管传统声学方法取得了显著成功,但这些线性或准线性方法在实际环境中往往存在关键的不足,尤其在动态、复杂或混响环境…

广东河源再发3.0级地震 近期无大震风险

广东河源再发3.0级地震 近期无大震风险!中国地震台网正式测定,5月30日2时21分在广东河源市源城区(北纬23.72度,东经114.68度)发生3.0级地震,震源深度10千米。河源市地震局表示,目前未收到人员伤亡和财产损失报告。该局会商研判认为,本次地震是前一天5月29日13时17分发生…

极致视频压缩日记 - 1.2GB=>200MB - 低码率高画质 - 批量多目录自动转换脚本

效果图 格式av10.3M的码率,跟格式h.2645M的码率,画质竟然差不多! GPU拉满全速编码! 目标 1.视频瘦身储存,画质不变 2.自动批量压缩视频,多层目录递归处理 (脚本https://www.amjun.com/2327.html) 3.免费 (…

媒体:升学不再只有“独木桥” 职教贯通培养拓宽道路

媒体:升学不再只有“独木桥” 职教贯通培养拓宽道路!随着职教贯通培养模式的不断推进,我国学生的升学选择已经更加多元。高考不再是唯一的出路。5月28日,教育部公布2025年全国高考报名人数为1335万人,比2024年的1342万人减少7万人。这是自2017年以来高考报名人数首次减少。…

多地曝“谷子店”闭店消息 “谷子经济”面临转型挑战

手办模玩生产车间里,年轻人正在参与“谷子”涂装工作。消费者正在挑选“谷子”。“谷子经济”还能像过去那样“丰收”吗?挣“二次元”的钱,难不难?不只是做单一的“谷子”销售,还自主开发产品,做IP代运营,一步一步介入“谷子经济”全链条。自己开发App,为平台用户建立“…

我国入境游出境游持续升温 双向奔赴激发市场活力

走进2025上海国际旅游交易博览会现场,可以感受到入境和出境旅游市场的繁荣。中外客商、展商根据满满的时间表,听宣讲、看项目、谈合作,为世界旅游市场注入动力。今年的上海国际旅游交易博览会于5月27日至29日举行,吸引了来自全球80多个国家和地区的700多家展商参展,展会规…

白宫称美国法院“叫停”关税是司法越权

美国联邦巡回上诉法院当地时间29日批准特朗普政府的请求,暂时中止美国国际贸易法院此前做出的禁止执行特朗普政府对多国加征关税措施的行政令的裁决。自美国国际贸易法院28日裁定禁止执行美政府多个关税行政令后,特朗普政府多名官员就指责这一裁决,提起了上诉。△白宫新闻秘…

运镜决定节奏:AI视频创作中的动态叙事法则

在AI视频创作工具日益普及的今天,如何通过镜头语言精准掌控节奏,成为创作者的核心竞争力。运镜——即镜头的移动方式(如推、拉、摇、移)与视角选择(如仰拍、俯拍、主观视角)——不仅是技术操作,…

【Redis】string

String 字符串 字符串类型是 Redis 最基础的数据类型,关于字符串需要特别注意: 首先 Redis 中所有的键的类型都是字符串类型,而且其他几种数据结构也都是在字符串的基础上构建的。字符串类型的值实际可以是字符串,包含一般格式的…

Java 文件操作 和 IO(3)-- Java文件内容操作(1)-- 字节流操作

Java 文件操作 和 IO(3)-- Java文件内容操作(1)-- 字节流操作 文章目录 Java 文件操作 和 IO(3)-- Java文件内容操作(1)-- 字节流操作观前提醒:1. Java中操作文件的简单介…

MySQL进阶篇(存储引擎、索引、视图、SQL性能优化、存储过程、触发器、锁)

MySQL进阶篇 存储引擎篇MySQL体系结构存储引擎简介常用存储引擎简介存储引擎的选择 索引篇索引简介索引结构(1)BTree索引(2)hash索引 索引分类索引语法SQL性能分析指标(1)SQL执行频率(2)慢查询日志(3)profile详情(4)explain或desc执行计划 索引使用引起索引的失效行为SQL提示覆…

造血干细胞移植中,选择合适供者需综合多因素考量

KIR 单体型即杀伤细胞免疫球蛋白样受体(KIR)单体型,是指 KIR 基因在染色体上特定的组合形式 。主要内容如下: 分类 着丝粒单体型(C 型):含有较多的抑制性 KIR 基因,这些基因编码的…

四.MySQL数据类型

数据类型分类 一.数值类型 1.tinyint类型 MySQL 整数类型范围(有符号 / 无符号) 类型字节最小值(有符号/无符号)最大值(有符号/无符号)TINYINT1-128 / 0127 / 255SMALLINT2-32,768 / 032,767 / 65,535ME…

深度解构:Profinet转Profibus网关如何重塑产品分离装置的控制逻辑

PROFINET是一种基于以太网的工业以太网通讯协议,而PROFIBUS则是一种国际化的现场总线标准。在很多工业生产环境中,这两种通讯方式都有其各自的应用场合和优势。当产品分离装置需要同时使用PROFINET和PROFIBUS进行通信时,无锡耐特森PROFINET转…

EasyVoice:开源的文本转语音工具,让文字“开口说话“

名人说:博观而约取,厚积而薄发。——苏轼《稼说送张琥》 创作者:Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊) 目录 一、EasyVoice是什么?1. 核心特性一览2. 技术架构概览 二、安装部署指南…

外航飞机疑盲降国内在建跑道 机组认错跑道复飞

5月28日,有网友发帖称,一架外国航空公司的飞机在降落西安咸阳国际机场时发生意外状况,疑似盲降正在建设中的跑道,接地后复飞。该事件引发网友关注。据网友所述,该飞机在准备降落时,地面指令让落23L(南一跑道),结果落向24L(正在建的南二跑道),然后指挥复飞了,最后落…