首页 > 语言 > 关键词  > SQL最新资讯  > 正文

SQL Server 2005中用存储过程实现搜索功能

2008-10-17 09:26 · 稿源:blue1000.com

现在很多网站都提供了站内的搜索功能,有的很简单在SQL语句里加一个条件如:where names like ‘%words%’就可以实现最基本的搜索了。

我们来看看功能强大一点,复杂一点的搜索是如何实现的(在SQL SERVER200/2005通过存储过程实现搜索算法)。

我们把用户的搜索可以分为以下两种:

1.精确搜索,就是把用户输入的各个词语当成一个整体,不分割搜索.

2.像百度,GOOGLE一样的,按空格把输入的每一个词分离,只要包含这些词语,而不管出现的顺序,称为ALL-word Search.

3.对输入的词只要有一个出现就为匹配 称为Any-word Search

一、对搜索结果进行排序的算法

在前面提到的LIKE语句最大的问题就是搜索的结果是没有经过排序的,我们不知道结果出现在的顺序是如何的,因为它是随机的。像百度,GOOGLE都会对结果用算法进行排序再显示的.好我们也来建立一个简单的排序法。一个很常见的算法是计算关键词在被搜索内容中出现的次数,次数最多的排在结果的第一位。我们的是在存储过程中实现这个算法的,而在SQLSERVER中没有提供计算关键词在被搜索内容中出现的次数这样的函数,我们要自己写一个UDF(User-Defined Functions),UDF是SQLSERVER的内部函数,可以被存储过程调用或者被其他UDF调用。函数如下:

以下为引用的内容:

1CREATE FUNCTION dbo.wordCount
2
3(@word VARCHAR(15),
4
5@Phrase VARCHAR(1000))
6
7RETURNS SMALLINT
8
9AS
10
11BEGIN
12
13/**//* 如果@word 或者@Phrase 为空返回 0 */
14
15IF @word IS NULL OR @Phrase IS NULL RETURN 0
16
17/**//* @Biggerword 比@word长一个字符 */
18
19DECLARE @Biggerword VARCHAR(21)
20
21SELECT @Biggerword = @word + 'x'
22
23/**//*在 @Phrase用@Biggerword替换@word */
24
25DECLARE @BiggerPhrase VARCHAR(2000)
26
27SELECT @BiggerPhrase = REPLACE (@Phrase, @word, @Biggerword)
28
29/**//* 相减结果就是出现的次数了 */
30
31RETURN LEN(@BiggerPhrase) - LEN(@Phrase)
32
33END
34

以上就是整个UDF,它用了一个很高效的方法来计算关键词出现的次数。

二、参数传递

用户输入的关键词从一个到多个不等,我们可以把参数固定为@word1~@word5,这样比较方面实现。当用户输入超过5个时,忽略不计,少于5个的地方视为空。其实GOOGLE也是这样做的,只是GOOGLE的最大词语限制是10个。

三、搜索的实现过程

假定我们对Product表进行搜索,Product字段有:Id,Name ,Descripton(产品描述),搜索要同时对Name 和 Description进行。

Any-World Search实现如下:

以下为引用的内容:

1SELECT Product.Name,
2 3 * wordCount(@word1, Name) + wordCount(@word1, Description) +
3
4 3 * wordCount(@word2, Name) + wordCount(@word2, Description) +
5
6
7
8 AS Rank
9FROM Product
10
11

这里对Name赋予权重为3,Description为1(大家根据实际情况赋予不同的权重),Rank是计算列,通过前面定义的UDF计算所关键词出现的次数乘上权重等到的。

同样的All-word Search实现如下:

以下为引用的内容:

1SELECT Product.Name,
2
3 (3 * wordCount(@word1, Name) + wordCount(@word1, Description)) *
4
5 CASE
6
7 WHEN @word2 IS NULL THEN 1
8
9 ELSE 3 * wordCount(@word2, Name) + wordCount(@word2, Description)
10
11 END *
12
13
14
15 AS Rank
16
17FROM Product
18

这时把每个关键词出现的次数相乘只要一个没出现RANK就为0,为0就是搜索结果为空。

还可以这样实现:

以下为引用的内容:

1SELECT Product.Name,
2 CASE
3 WHEN @word1 IS NULL THEN 0
4 ELSE ISNULL(NULLIF(dbo.wordCount(@word1, Name + ' ' + Description), 0), -1000)
5 END +
6 CASE
7 WHEN @word2 IS NULL THEN 0
8 ELSE ISNULL(NULLIF(dbo.wordCount(@word2, Name + ' ' + Description), 0), -1000)
9 END +
10
11 AS Rank
12FROM Product

对没出现的关键词赋值-1000,这样Rank就肯定为负数,负数表示搜索结果为空。

四、对结果进行分页

搜索的结果可能很多,对结果分页可以提高性能。我在如何在数据层分页以提高性能已经说明了如何用存储过程进行分页了,这里就不在详细复述了。

过程简单来说就是创建一个临时表,表中包含行号,读取时按行号来读取数据

五、完整代码

经过前面的分析,完整代码如下:

以下为引用的内容:

1CREATE PROCEDURE SearchCatalog
2(
3 @PageNumber TINYINT,
4 @ProductsPerPage TINYINT,
5 @HowManyResults SMALLINT OUTPUT,
6 @Allwords BIT,
7 @word1 VARCHAR(15) = NULL,
8 @word2 VARCHAR(15) = NULL,
9 @word3 VARCHAR(15) = NULL,
10 @word4 VARCHAR(15) = NULL,
11 @word5 VARCHAR(15) = NULL)
12AS
13/**//* 创建临时表,保存搜索的结果(Sql Server2005适用,Sql Server2000见如何在数据层分页以提高性能) */
14DECLARE @Products TABLE
15(RowNumber SMALLINT IDENTITY (1,1) NOT NULL,
16 ID INT,
17 Name VARCHAR(50),
18 Description VARCHAR(1000),
19Rank INT)
20
21/**//* Any-words search */
22IF @Allwords = 0
23 INSERT INTO @Products
24 SELECT ID, Name, Description,
25 3 * dbo.wordCount(@word1, Name) + dbo.wordCount(@word1, Description) +
26
27 3 * dbo.wordCount(@word2, Name) + dbo.wordCount(@word2, Description) +
28
29 3 * dbo.wordCount(@word3, Name) + dbo.wordCount(@word3, Description) +
30
31 3 * dbo.wordCount(@word4, Name) + dbo.wordCount(@word4, Description) +
32
33 3 * dbo.wordCount(@word5, Name) + dbo.wordCount(@word5, Description)
34
35 AS Rank
36
37 FROM Product
38 ORDER BY Rank DESC
39
40/**//* all-words search */
41
42IF @Allwords = 1
43
44 INSERT INTO @Products
45
46 SELECT ID, Name, Description,
47
48 (3 * dbo.wordCount(@word1, Name) + dbo.wordCount
49
50(@word1, Description)) *
51
52 CASE
53
54 WHEN @word2 IS NULL THEN 1
55
56 ELSE 3 * dbo.wordCount(@word2, Name) + dbo.wordCount(@word2,
57
58Description)
59
60 END *
61
62 CASE
63
64 WHEN @word3 IS NULL THEN 1
65
66 ELSE 3 * dbo.wordCount(@word3, Name) + dbo.wordCount(@word3,
67
68Description)
69
70 END *
71
72 CASE
73
74 WHEN @word4 IS NULL THEN 1
75
76 ELSE 3 * dbo.wordCount(@word4, Name) + dbo.wordCount(@word4,
77
78Description)
79
80 END *
81
82 CASE
83
84 WHEN @word5 IS NULL THEN 1
85
86 ELSE 3 * dbo.wordCount(@word5, Name) + dbo.wordCount(@word5,
87
88Description)
89
90 END
91
92 AS Rank
93
94 FROM Product
95
96 ORDER BY Rank DESC
97
98/**//* 在外部变量保存搜索结果数 */
99
100SELECT @HowManyResults = COUNT(*)
101
102FROM @Products
103
104WHERE Rank > 0
105
106/**//* 按页返回结果*/
107
108SELECT ProductID, Name, Description, Price, Image1FileName,
109
110 Image2FileName, Rank
111
112FROM @Products
113
114WHERE Rank > 0
115
116 AND RowNumber BETWEEN (@PageNumber-1) * @ProductsPerPage + 1
117
118 AND @PageNumber * @ProductsPerPage
119ORDER BY Rank DESC

至此一个简单的搜索算法就实现了。

举报

  • 相关推荐
  • 一天净赚2000元!知了猴怎么就火出圈了

    媒体报道,当夏季夜幕降临,山间树林、公园河堤便悄然出现一群夜行者。他们手持电筒、拎着塑料袋,目光如炬地扫视每一棵树这99.99%是在捕捉知了猴,即蝉的幼虫。 在青岛等地,有人一晚上能捕获12-15斤,按当前每斤105元的市价计算,可净赚2000余元,价格较二十年前暴涨6倍。 这种藏在树枝间的暗夜美味,蛋白质含量远超普通食材,尤以刚褪壳时的口感最为鲜嫩。民间素

  • 女子买菜错付2000元大爷称只看到5元 后续:已报警找回

    ​7 月 9 日,四川发生一起因付款疏忽引发的趣事。一位大姐在路边摊选购蔬菜时,掏出一沓现金准备付款,不料在付款过程中却“迷糊”了一把。她左手捏着一张 5 元纸币,右手则握着一沓总计 2000 多元的现金,却鬼使神差地将两千多元递给了卖菜大爷,自己浑然未觉。 随后,当大姐准备继续挑选其他蔬菜并再次付款时,才发现手中的钱已经所剩无几。面对这一突如其来的�

  • MCP server资源网站去哪找?国内MCP服务合集平台有哪些?

    在人工智能飞速发展的今天,AI模型与外部世界的交互变得愈发重要。一个好的工具不仅能提升开发效率,还能激发更多的创意。今天,我要给大家介绍一个宝藏平台——AIbase(<https://mcp.aibase.cn/>),一个专注于MCP(Model Context Protocol)服务的全球集合平台,它正在悄然改变AI应用开发的格局。 平台精心挑选了全球最受欢迎的MCP服务进行推荐。这些服务经过了市场的检验,具�

  • MCP协议资源服务去哪找?国内MCP server资源网站推荐

    ​在人工智能技术飞速发展的今天,AI模型与外部工具和服务的交互需求日益增长。为了满足这一需求,一个名为 AIbase 的全球MCP服务器集合平台(https://mcp.aibase.cn/)应运而生,为开发者和企业提供了前所未有的便利和强大的功能支持。

  • 抓住人们对“Soulmate”的渴望,20天入账200万美金?

    6月17日,一款 AI 占星产品 Starla-Call the Universe 进入了 iOS 美国下载总榜前10,当笔者以为这又是一个昙花一现的产品时,它不仅能够持续坚守榜单 Top10长达半个月,而且到了6月24日,另一款产品 Astra-Life Advice 也进入了美榜前10,两款同类产品相继进入 Top10,并双双持续在榜超1周的时间。

  • 山东女孩5万起家创业,年销2000万,中国猫窝攻占美国客厅

    2018年,车允文给自己定下两个目标:毕业两年内,她要买一辆自己的车,毕业五年内,她要买一套自己的房。 她不是富二代,家里也提供不了经济支持——父亲在她14岁时离世,她和妈妈、姐姐相依为命,靠着助学金、助学贷款和社会资助,打零工、做家教,才完成了学业。 或许是一出生就处在低谷,她比很多人都刻苦、争气。从211大学毕业后,车允文进了银行,每个月拿着

  • 一场直播百万人观看、一年涨粉1200多万,直播赛道迎来新风口

    ​一场直播超百万人观看,一年时间涨粉1200多万……这样的流量奇迹,真实发生在了一个新的直播内容赛道——直播大舞台。 去年7月,快手主播赵长龙嗅到了直播大舞台的风口,毅然决然选择转型,打造了“唐山泡泡龙大舞台”;一年后,他不仅成为了直播大舞台赛道的头部,而且带动了唐山当地的发展,让景区、商户和观众多方受益。 像这样的直播大舞台,如今已在全国�

  • 网购成瘾!66岁独居老人花200万购物塞满两套房 理由太奇葩

    近日,独居老人网购花费200万睡在快递上”引发热议。 据媒体报道,今年66岁的王阿姨早年离异,女儿在海外,与哥哥也少往来。 她网购成瘾,家中快递堆积如山,直达屋顶,几乎无处落脚,只能在快递堆中缓慢移动,甚至无法睡觉只能坐在快递上。 如此堆积滋生蝇虫和恶臭,让邻居难以忍受。 据媒体报道,从去年开始,物业就已经多次沟通,希望她自行清理, 最终,�

  • 边开直播边做实验,单场卖出2200万,小红书有了00后“一姐”

    “李嗲你真的…到底是谁想出来的这么抽象的测评方法?” 当00后的李嗲在直播间里打开UV相机摄像头进行测评防晒霜的时候,被紫外线灯照射的她和付铁寒立马在镜头下变成两个“小黑人”。这一场面引得无数年轻人一边大呼抽象,一边为这场眼见为实的实验买单。 在消费者的支持下,李嗲一路冲上小红书实时买手榜第一,成为小红书电商首个00后“一姐”。这样的成长速度

  • 比特币首触112000美元:盘中涨幅最高达3%

    7月10日,加密货币市场传来重磅消息,比特币价格首次向上触及112000美元,一举刷新历史新高,盘中涨幅最高达3%,这一行情引发了市场的广泛关注与热议。 从年内表现来看,比特币今年迄今涨幅约为19%,展现出强劲的上升势头。此次价格的大幅上涨,不仅让持有比特币的投资者收获颇丰,也吸引了更多市场目光的聚焦。