很多互联网应用程序都提供了全文搜索功能, 用户可以使用一个词或者词语片断作为查询项目来定位匹配的记录在后台, 这些程序使用在一个 SELECT 查询中的 LIKE 语句来执行这种查询, 尽管这种方法可行, 但对于全文查找而言, 这是一种效率极端低下的方法, 尤其在处理大量数据的时候
MySQL 针对这一问题提供了一种基于内建的全文查找方式的解决方案在此, 开发者只需要简单地标记出需要全文查找的字段, 然后使用特殊的 MySQL 方法在那些字段运行搜索, 这不仅仅提高了性能和效率(因为 MySQL 对这些字段做了索引来优化搜索), 而且实现了更高质量的搜索, 因为 MySQL 使用自然语言来智能地对结果评级, 以去掉不相关的项目
这篇文章将向您讲述在 MySQL 中如何进行全文搜索
1 设置基本表格
从创建例子表格开始, 使用以下的 SQL 命令:
mysql> CREATE TABLE reviews (id INT(5) PRIMARY KEY NOT NULL AUTO_INCREMENT, data TEXT);
以上命令创建了一个简单的音乐专集资料库(主要是整段的文字), 然后向这个表格中添加一些记录:
- mysql> INSERT INTO `reviews` (`id`, `data`) VALUES
- (1, 'Gingerboy has a new single out called Throwing Rocks. It's great!');
- mysql> INSERT INTO `reviews` (`id`, `data`) VALUES
- (2, 'Hello all, I really like the new Madonna single.
- One of the hottest tracks currently playing...I've been listening to it all day');
- mysql> INSERT INTO `reviews` (`id`, `data`)
- VALUES (3, 'Have you heard the new band Hotter Than Hell?
- They have five members and they burn their instruments when they play in concerts.
- These guys totally rock! Like, awesome, dude!');
验证数据的正确录入:
- mysql> SELECT * FROM reviews;
- +----+--------------------------------------------+
- | id | data |
- +----+--------------------------------------------+
- | 1 | Gingerboy has a new single out called ... |
- | 2 | Hello all, I really like the new Madon ... |
- | 3 | Have you heard the new band Hotter Than... |
- +----+--------------------------------------------+
- 3 rows in set (0.00 sec)
2 定义全文搜索字段
接下来, 定义您要作为全文搜索索引的字段
- mysql> ALTER TABLE reviews ADD FULLTEXT INDEX (data);
- Query OK, 3 rows affected (0.21 sec)
- Records: 3 Duplicates: 0 Warnings: 0
使用 SHOW INDEXES 命令来检查索引已经被添加了:
- mysql> SHOW INDEXES FROM reviews;
- +---------+---------------+--------+------+------------+---------+
- | Table | Column_name | Packed | Null | Index_type | Comment |
- ----------+---------------+--------+------+------------+---------+
- | reviews | id | NULL | | BTREE | |
- | reviews | data | NULL | YES | FULLTEXT | |
- +---------+---------------+--------+------+------------+---------+
- 2 rows in set (0.01 sec)
3 运行全文搜索
当您拥有了数据和索引, 就可以使用 MySQL 的全文搜索了, 最简单的全文搜索方式是带有 MATCH...AGAINST 语句的 SELECT 查询, 以下是一个简单的例子, 可以来查找含有单词 single 的记录:
- mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST ('single');+----+
- | id |
- +----+
- | 1 |
- | 2 |
- +----+
- 2 rows in set (0.00 sec)
在此, MATCH()将作为参数传递给它的字段中的文字与传递给 AGAINST()的参数进行比较, 如果有匹配的, 那就按照正常的方式返回注意您可以传递不止一个字段用 MATCH()来查看 - 只需用逗号来分割字段列表
当 MySQL 收到了一个全文搜索的请求, 它就在内部对每个记录进行评分, 不匹配的记录得分为零, 而更相关的记录会得到比不太相关的记录相对更高的分数相关性是由 MySQL 的一系列区分标准来决定的, 查看 MySQL 的用户手册可以得到更多的信息
想看到每个记录的评分如何, 只需要返回 MATCH()方法作为结果集的一部分, 如下所示:
- mysql> SELECT id, MATCH (data) AGAINST ('rock') FROM reviews;
- +----+-------------------------------+
- | id | MATCH (data) AGAINST ('rock') |
- +----+-------------------------------+
- | 1 | 0 |
- | 2 | 0 |
- | 3 | 1.3862514533815 |
- +----+-------------------------------+
- 3 rows in set (0.00 sec)
4 使用逻辑搜索修饰符(Boolean search modifiers)
您还可以使用逻辑搜索修饰符来进行更精确的搜索, 这通过在 AGAINST 语句中添加特殊的 IN BOOLEAN MODE 修饰符来实现, 在以下的例子中, 将查找含有单词 single 但是没有 Madonna 的记录:
- mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST ('+single -madonna' IN BOOLEAN MODE);
- +----+
- | id |
- +----+
- | 1 |
- +----+
- 1 row in set (0.00 sec)
这一搜索特性通常用于搜索单词片断 (而不是完整的词语), 这可以通过在 IN BOOLEAN MODE 语句中的 *(星号) 操作符来实现, 以下的例子展示了如何查找单词中含有 hot 的记录:
- mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST ('hot*' IN BOOLEAN MODE);+----+
- | id |
- +----+
- | 3 |
- | 2 |
- +----+
- 2 rows in set (0.00 sec)
您还可以使用这种方法来查找至少一个传递到 AGAINST 的参数中, 以下的例子查找了至少包含单词 hell 和 rocks 中的一个的记录:
- mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST ('hell rocks' IN BOOLEAN MODE);
- +----+
- | id |
- +----+
- | 1 |
- | 3 |
- +----+
- 2 rows in set (0.00 sec)
以上的这些例子演示了相对于传统的 SELECT...LIKE 语句, 进行全文搜索的更有效的方法, 当您下一次需要编写 MySQL 数据库搜索界面的时候, 您可以尝试这一方法
来源: https://www.php1.cn/detail/php-0ab5203933.html