当前位置：

首页
/
IT
/
程序
/
Python
/
python 数据库 - MongoDB 的高级查询操作 (55)

python 数据库 - MongoDB 的高级查询操作 (55)

一, MongoDB 索引

为什么使用索引?

假设有一本书, 你想看第六章第六节讲的是什么, 你会怎么做, 一般人肯定去看目录, 找到这一节对应的页数, 然后翻到这一页. 这就是目录索引, 帮助读者快速找到想要的章节. 在数据库中, 我们也有索引, 其目的当然和我们翻书一样, 能帮助我们提高查询的效率. 索引就像目录一样, 减少了计算机工作量, 对于表记录较多的数据库来说是非常实用的, 可以大大的提高查询的速度. 否则的话, 如果没有索引, 计算机会一条一条的扫描, 每一次都要扫描所有的记录, 浪费大量的 CPU 时间.

为了查询方便, 我们创建一个拥有 500000 条数据的一个集合

> for(var i=0;i<500000;i++){
	db.nums.insert({
	name:"name"+i,age:i	
})	
}
WriteResult({
	"nInserted" : 1	
})

createIndex() 方法: MongoDB 使用 createIndex() 方法来创建索引.

注意在 3.0.0 版本前创建索引方法为 db.collection.ensureIndex(), 之后的版本使用了 db.collection.createIndex() 方法, ensureIndex() 还能用, 但只是 createIndex() 的别名.

语法: createIndex()方法基本语法格式如下所示:

>db.collection.createIndex(keys, options)

语法中 Key 值为你要创建的索引字段, 1 为指定按升序创建索引, 如果你想按降序来创建索引指定为 -1 即可.

实例:

1, 先在未创建索引之前我们按需求查找 nums 集合里面 age 为 399999 的

2, 在创建索引之后查询 age 为 399999 的

创建索引

> db.nums.createIndex({age:1})
{
    "createdCollectionAutomatically" : false,
    "numIndexesBefore" : 1,
    "numIndexesAfter" : 2,
    "ok" : 1
}

通过两次执行时间的对比明显可以看到创建索引后查询更快, 数据越多, 体现的越明显.

createIndex() 接收可选参数, 可选参数列表如下:

二, MongoDB 聚合

MongoDB 中聚合 (aggregate) 主要用于处理数据(诸如统计平均值, 求和等), 并返回计算后的数据结果. 有点类似 sql 语句中的 count(*).

aggregate() 方法: MongoDB 中聚合的方法使用 aggregate().

语法: aggregate() 方法的基本语法格式如下所示:

db. 集合名称. aggregate([{管道:{表达式}}])

管道

管道在 Unix 和 Linux 中一般用于将当前命令的输出结果作为下一个命令的输入

ps ajx | grep mongo

在 MongoDB 中, 管道具有同样的作用, 文档处理完毕后, 通过管道进行下一次处理

常用管道

$group: 将集合中的文档分组, 可用于统计结果

$match: 过滤数据, 只输出符合条件的文档

$project: 修改输入文档的结构, 如重命名, 增加, 删除字段, 创建计算结果

$sort: 将输入文档排序后输出

$limit: 限制聚合管道返回的文档数

$skip: 跳过指定数量的文档, 并返回余下的文档

$unwind: 将数组类型的字段进行拆分

$geoNear: 输出接近某一地理位置的有序文档.

表达式: 处理输入文档并输出

表达式:'$ 列名'

常用表达式

$sum: 计算总和,$sum:1 同 count 表示计数

$avg: 计算平均值

$min: 获取最小值

$max: 获取最大值

$push: 在结果文档中插入值到一个数组中

$first: 根据资源文档的排序获取第一个文档数据

$last: 根据资源文档的排序获取最后一个文档数据

三,$group

将集合中的文档分组, 可用于统计结果

_id 表示分组的依据, 使用某个字段的格式为'$ 字段'

例如: heros 表中数据如下

> db.heros.find().pretty()
{
    "_id" : ObjectId("5d2e0647614bec7ca4687792"),
    "h_name" : "后裔",
    "h_skill" : "惩戒之剑",
    "h_attack" : 1000,
    "h_blood" : 800,
    "h_type" : "射手"
}
{
    "_id" : ObjectId("5d2e0685614bec7ca4687793"),
    "h_name" : "李白",
    "h_skill" : "青莲剑仙",
    "h_attack" : 1400,
    "h_blood" : 900,
    "h_type" : "刺客"
}
{
    "_id" : ObjectId("5d2e06d6614bec7ca4687794"),
    "h_name" : "韩信",
    "h_skill" : "国士无双",
    "h_attack" : 1300,
    "h_blood" : 850,
    "h_type" : "刺客"
}
{
    "_id" : ObjectId("5d2e0720614bec7ca4687795"),
    "h_name" : "妲己",
    "h_skill" : "女王崇拜",
    "h_attack" : 1200,
    "h_blood" : 750,
    "h_type" : "法师"
}

例如: 按照英雄类型分组, 进行统计个数

> db.heros.aggregate([{
	$group:{
	_id:"$h_type",counter:{
	$sum:1	
}	
}	
}])
{
	"_id" : "刺客", "counter" : 2	
}
{
	"_id" : "法师", "counter" : 1	
}
{
	"_id" : "射手", "counter" : 1	
}
>

Group by null: 将集合中所有文档分为一组

例如: 求英雄的从攻击力和平均血量

> db.heros.aggregate([{
	$group:{
	_id:null,h_attacks:{
	$sum:"$h_attack"	
},avgh_blood:{
	$avg:"$h_blood"	
}	
}	
}])
{
	"_id" : null, "h_attacks" : 4900, "avgh_blood" : 825	
}
>

透视数据

只查询英雄类型和名字

> db.heros.aggregate([{
	$group:{
	_id:"$h_type",name:{
	$push:"$h_name"	
}	
}	
}])
{
	"_id" : "刺客", "name" : [ "李白", "韩信" ]	
}
{
	"_id" : "法师", "name" : [ "妲己" ]	
}
{
	"_id" : "射手", "name" : [ "后裔" ]	
}
>

使用 $$ROOT 可以将文档内容加入到结果集的数组中, 代码如下

> db.heros.aggregate([{$group:{_id:"h_type",name:{$push:"$$ROOT"}}}]).pretty()
{
    "_id" : "h_type",
    "name" : [
        {
            "_id" : ObjectId("5d2e0647614bec7ca4687792"),
            "h_name" : "后裔",
            "h_skill" : "惩戒之剑",
            "h_attack" : 1000,
            "h_blood" : 800,
            "h_type" : "射手"
        },
        {
            "_id" : ObjectId("5d2e0685614bec7ca4687793"),
            "h_name" : "李白",
            "h_skill" : "青莲剑仙",
            "h_attack" : 1400,
            "h_blood" : 900,
            "h_type" : "刺客"
        },
        {
            "_id" : ObjectId("5d2e06d6614bec7ca4687794"),
            "h_name" : "韩信",
            "h_skill" : "国士无双",
            "h_attack" : 1300,
            "h_blood" : 850,
            "h_type" : "刺客"
        },
        {
            "_id" : ObjectId("5d2e0720614bec7ca4687795"),
            "h_name" : "妲己",
            "h_skill" : "女王崇拜",
            "h_attack" : 1200,
            "h_blood" : 750,
            "h_type" : "法师"
        }
    ]
}
>

四,$match

用于过滤数据, 只输出符合条件的文档

使用 MongoDB 的标准查询操作

例如: 查询攻击力大于 1200

> db.heros.aggregate([{
	$match:{
	"h_attack":{
	$gt:1200	
}	
}	
}])
{
	"_id" : ObjectId("5d2e0685614bec7ca4687793"), "h_name" : "李白", "h_skill" : "青莲剑仙", "h_attack" : 1400, "h_blood" : 900, "h_type" : "刺客"	
}
{
	"_id" : ObjectId("5d2e06d6614bec7ca4687794"), "h_name" : "韩信", "h_skill" : "国士无双", "h_attack" : 1300, "h_blood" : 850, "h_type" : "刺客"	
}
>

五,$project

修改输入文档的结构, 如重命名, 增加, 删除字段, 创建计算结果

输出结果和投影效果差不多

> db.heros.aggregate([{
	$project:{
	_id:0,h_name:1,h_skill:1	
}	
}])
{
	"h_name" : "后裔", "h_skill" : "惩戒之剑"	
}
{
	"h_name" : "李白", "h_skill" : "青莲剑仙"	
}
{
	"h_name" : "韩信", "h_skill" : "国士无双"	
}
{
	"h_name" : "妲己", "h_skill" : "女王崇拜"	
}
>

六,$unwind

将文档中的某一个数组类型字段拆分成多条, 每条包含数组中的一个值

语法 1

对某字段值进行拆分

db. 集合名称. aggregate([{$unwind:'$ 字段名称'}])

例如:

db.t2.insert({_id:1,item:'t-shirt',size:['S','M','L']})

查询:

> db.t2.aggregate([{
	$unwind:'$size'	
}])
{
	"_id" : 1, "item" : "t-shirt", "size" : "S"	
}
{
	"_id" : 1, "item" : "t-shirt", "size" : "M"	
}
{
	"_id" : 1, "item" : "t-shirt", "size" : "L"	
}
>

语法 2

对某字段值进行拆分

处理空数组, 非数组, 无字段, null 情况

db.inventory.aggregate([{
    $unwind:{
        path:'$ 字段名称',
        preserveNullAndEmptyArrays:<boolean># 防止数据丢失
    }
}])

构造数据

db.t3.insert([
{
	"_id" : 1, "item" : "a", "size": [ "S", "M", "L"]	
},
{
	"_id" : 2, "item" : "b", "size" : [ ]	
},
{
	"_id" : 3, "item" : "c", "size": "M"	
},
{
	"_id" : 4, "item" : "d"	
},
{
	"_id" : 5, "item" : "e", "size" : null	
}
])

使用语法 1 查询

> db.t3.find().pretty()
{
	"_id" : 1, "item" : "a", "size" : [ "S", "M", "L" ]	
}
{
	"_id" : 2, "item" : "b", "size" : [ ]	
}
{
	"_id" : 3, "item" : "c", "size" : "M"	
}
{
	"_id" : 4, "item" : "d"	
}
{
	"_id" : 5, "item" : "e", "size" : null	
}
> db.t3.aggregate([{
	$unwind:'$size'	
}])
{
	"_id" : 1, "item" : "a", "size" : "S"	
}
{
	"_id" : 1, "item" : "a", "size" : "M"	
}
{
	"_id" : 1, "item" : "a", "size" : "L"	
}
{
	"_id" : 3, "item" : "c", "size" : "M"	
}
>

查看查询结果, 发现对于空数组, 无字段, null 的文档, 都被丢弃了

使用语法 2 查询不会丢弃空数组, 无字段, null 的文档

> db.t3.aggregate([{
	$unwind:{
	path:'$sizes',preserveNullAndEmptyArrays:true	
}	
}])
{
	"_id" : 1, "item" : "a", "size" : [ "S", "M", "L" ]	
}
{
	"_id" : 2, "item" : "b", "size" : [ ]	
}
{
	"_id" : 3, "item" : "c", "size" : "M"	
}
{
	"_id" : 4, "item" : "d"	
}
{
	"_id" : 5, "item" : "e", "size" : null	
}
>

来源: https://www.cnblogs.com/Se7eN-HOU/p/11198555.html

与本文相关文章

暂无,快来抢沙发吧！