智能搜索系统
现在全文检索功能基本上已经是各个软件系统的标配了。我们也不例外。
但WebFuture中的搜索功能绝不仅限于常规的全文检索,而是在全文检索的基础做了许多改进,已经可以称得上是智能搜索了。

智能搜索

产品优势

  • 一站式集中搜索

    无需另外部署搜索引擎系统,直接一站式对整站数据进行全文检索。

    了解详情
  • 实时搜索

    更新索引时间可以做到近乎实时,就是说新添加的内容可以马上在搜索结果中出现。

    了解详情
  • 几乎所有的网站数据都可以被搜索到

    只要是网站的功能模块,都提供了相应的索引项。比如文章、图片、视频、内容、信息公开、便民咨询、信访、网上办事、数据开放、在线访谈、新闻发布会、问卷调查、投票、在线表单、知识竞赛。也就是说,几乎所有的网站数据都是可以被搜索到的。

    搜索范围除了网站数据库中的数据以外,还支持搜索在网站中上传的附件(文本文件、Word和PDF格式)的内容。

    了解详情
  • 类似百度搜索框计算

    不同索引项,提供了不同的显示样式,类似百度的“搜索框计算”。

    了解详情
  • 搜索结果智能排序

    搜索领导人姓名时,领导信息会排在第一。

    了解详情
  • 支持精准搜索

    根据《国务院办公厅秘书局关于印发政府网站与政务新媒体检查指标、监管工作年度考核指标的通知》要求,随机选择网站已发布的信息或服务的标题进行搜索,在搜索结果第一页需要显示该内容。为响应该指标,WebFuture在全文检索基础上增加了“精准搜索”特性。如果搜索关键字和内容标题完全匹配,则该内容作为检索结果显示在第一页的顶部。

    了解详情
  • 支持联想搜索

    用户在搜索框中输入关键词时,只要输入前几个字,系统会自动从已有的搜索关键词中匹配出更完整的搜索关键词供用户选择,以减少用户输入。这一功能我们称之为“联想搜索”或者“搜索关键词自动补全”,类似在百度输入搜索关键词时的效果。

    了解详情
  • 支持错别字自动纠正

    当用户输入的搜索关键词含有错别字时,系统会自动纠正为正确的词语再进行搜索,用户也可以强制系统仍使用原始关键词进行搜索。

    了解详情
  • 支持拼音搜索

    当用户输入的关键词含有拼音时,可以自动将拼音转为合适的对应汉字后再进行搜索,用户也可以强制仍使用原始关键词进行搜索。

    了解详情
  • 支持屏蔽词拦截

    当用户输入的关键词含有屏蔽词(敏感词)时,系统不展示搜索结果信息。屏蔽词词库使用公用的“敏感词词库”。

    了解详情
  • 支持防暴力搜索

    支持防暴力搜索。当遇到恶意的通过搜索功能来进行CC攻击时,可以识别这种行为并进行拦截和提示。

    了解详情
  • 支持搜索热词自动排序和显示

    系统会自动统计搜索关键词的搜索频度,将某一时间段内搜索量较高的关键词作为搜索热词,并根据搜索热度自动调整排序。

    了解详情
  • 支持分词/不分词搜索

    搜索模式可以在分词搜索和不分词搜索之间选择。

    了解详情
  • 内置庞大词库

    系统内置词库中的词语数量达到78.9万个,涵盖了政治、生活、百科等多个分类,从而可以让索引时的分词更有效,更符合大众的搜索习惯。

    了解详情
  • 词库自动维护

    支持全文检索的词库自动维护,系统不需要人工录入分词词条,而是会自动根据搜索热度和匹配度等参数将用户输入的搜索关键词智能的转化为全文检索的分词词条,并每天自动定时重建索引和更新索引,从而可以不断自动优化搜索结果。这样就让管理员的维护工作量一下子减少到了最低。随着数据的积累,系统会越来越智能的知道用户想搜索的是什么,并给出联想提示,从而获得了与我们在百度等商业搜索引擎搜索时类似的友好用户体验。

    了解详情

功能清单

索引项管理

  • 所有网站功能模块均配备了相应的索引内容提供者和索引项。
  • 索引项支持创建、修改、删除、查看、搜索和排序。
  • 支持索引的重建和更新,以及查看索引更新的进度。

分词扩展词库管理

  • 系统内置的词库包含了多达78.9万个词汇,涵盖政治、生活、百科等多个领域,从而在索引时能够更有效地进行分词,更符合大众的搜索习惯。
  • 支持手动维护分词扩展词库,用户可以添加、删除、修改和搜索分词词条。
  • 系统还支持全文检索词库的自动维护,无需人工录入分词词条,系统会根据搜索热度和匹配度等参数,智能地将用户搜索时输入的关键词转化为全文检索的分词词条,并每天自动定时重建和更新索引,从而持续优化搜索结果。

全文检索配置

  • 支持配置全文检索的各种参数。

前台搜索结果

  • 支持根据搜索项对搜索结果进行分类,并汇总统计结果数量。
  • 支持按索引项分类进行搜索。
  • 搜索结果支持按“发布时间+相关程度/相关程度/发布时间”进行排序。
  • 支持指定时间范围筛选搜索结果。
  • 在搜索领导姓名时,相关信息将优先显示在首位。
  • 支持精准搜索:当搜索关键字与内容标题完全匹配时,该内容将优先显示在搜索结果首页顶部。
  • 支持联想搜索:当用户在搜索框中输入关键词的前几个字时,系统会自动匹配已有的完整关键词供用户选择,减少输入量。
  • 支持错别字自动纠正:当用户输入的关键词中含有错别字时,系统会自动纠正为正确的词语再进行搜索,用户也可选择使用原始关键词进行搜索。
  • 支持拼音搜索:当用户输入拼音关键词时,系统可将拼音自动转为对应的汉字后进行搜索,用户也可强制选择使用原始拼音进行搜索。
  • 支持屏蔽词拦截:当用户输入的关键词含有屏蔽词(敏感词)时,系统将不显示任何搜索结果。屏蔽词词库使用公用的“敏感词词库”。
  • 支持防暴力搜索:当系统检测到恶意使用搜索功能进行CC攻击时,能够识别并拦截这种行为,并给出提示。
  • 支持搜索热词:系统会自动统计关键词的搜索频率,并将某一时间段内搜索量较高的关键词标记为热词,根据热度自动调整关键词的排序。

搜索项管理

  • 搜索项支持将来自不同索引项、内容模型和节点的搜索结果进行整合,实现仅统计特定节点的数据(例如“政策文件”)或跨模块汇总数据(如“互动交流”涵盖便民咨询、领导信息、问卷调查等多个模块的数据)。
  • 支持搜索项的创建、修改、删除、查看、启用和禁用操作,并允许对搜索项进行排序。
  • 系统内置了与索引项相对应的搜索项。

搜索关键词管理

  • 系统会自动记录用户输入的搜索关键词以及搜索次数,并且可以在后台对这些搜索关键词进行管理。

搜索热词管理

  • 系统会自动统计搜索关键词的搜索频度,并将一定时间段内搜索量较高的关键词标记为热门搜索词,同时根据搜索热度动态调整其排序。
  • 后台管理中还支持手动管理和排序这些热门搜索词及推荐的关键词。

搜索异常结果记录

  • 对数据库中的每篇文章进行遍历,并根据文章标题进行搜索,检查该文章是否出现在搜索结果的第一页。如果没有出现在第一页,则将其记录下来,供开发人员分析原因。这样做是为了满足政府网站绩效考核中对搜索功能的相关要求。

联想关键词配置

  • 支持配置联想搜索的各种参数,重新构建联想搜索的索引,并能够查看索引的构建进度。

高级搜索

  • 高级搜索功能支持设定以下搜索参数:搜索方式(例如,包含所有关键词/完整匹配关键词/包含任意关键词)、索引项(所有或特定索引项)、站点(全部站点或指定站点)、发布时间(所有时间范围或设定为一天、一周、一个月、一年内或特定日期)、搜索词位置(标题、正文或任意位置),以及显示条数等。
×

用户登录