mongodb 数据更新性能分析 mongodb更新多条记录

yuyutoo 2024-10-28 20:22 3 浏览 0 评论

之前的start_time字段是 datetime 类型，后来改成 int 类型的时间戳，因此，需要刷数据库。简单分析一下，update_one 和 bulk_write 的性能差异，测试发现 bulk_write 速度是 update_one 的40倍。此外，mongodb 数据库创建索引，查询更快哦。

7千数据，bulk_write 批量更新耗时7秒，update_one 逐个更新耗时 267秒，相差38倍
3万数据，bulk_write 批量更新耗时33秒，update_one 逐个更新耗时 1214秒，相差37倍

ailx10

网络安全优秀回答者

网络安全硕士

去咨询

逐个更新 start_time 字段，从 datetime 类型转为 int 类型

from pymongo import MongoClient
from datetime import datetime

# 连接到 MongoDB
client = MongoClient('mongodb://localhost:27017/')
db = client.mydatabase  
collection = db.collectionName 

# 更新文档中的 start_time 字段
for doc in collection.find({"start_time": {"$exists": True}}):
    start_time = doc.get("start_time")
    if isinstance(start_time, datetime):
        # 如果 start_time 是 datetime.datetime 对象，则将其转换为时间戳（毫秒级）
        start_time_timestamp = int(start_time.timestamp() * 1000)
        # 更新文档中的 start_time 字段为时间戳格式（NumberLong格式）
        collection.update_one({"_id": doc["_id"]}, {"$set": {"start_time": start_time_timestamp}})

批量更新 start_time 字段，从 datetime 类型转为 int 类型

from pymongo import MongoClient
from datetime import datetime
from pymongo import UpdateOne

# 连接到 MongoDB
client = MongoClient('mongodb://localhost:27017/')
db = client.mydatabase  
collection = db.collectionName 

# 创建批量更新操作列表
bulk_operations = []

# 更新文档中的 start_time 字段
for doc in collection.find({"start_time": {"$exists": True}}):
    start_time = doc.get("start_time")
    if isinstance(start_time, datetime):
        # 如果 start_time 是 datetime.datetime 对象，则将其转换为时间戳（毫秒级）
        start_time_timestamp = int(start_time.timestamp() * 1000)
        # 构造更新操作
        update_operation = UpdateOne({"_id": doc["_id"]}, {"$set": {"start_time": start_time_timestamp}})
        # 添加更新操作到批量更新操作列表中
        bulk_operations.append(update_operation)

# 执行批量更新操作
if bulk_operations:
    collection.bulk_write(bulk_operations)

创建索引，有助于提高性能

from pymongo import MongoClient

# 连接到 MongoDB
client = MongoClient('mongodb://localhost:27017/')
db = client.mydatabase
collection = db.collectionName

# 添加字段的索引
collection.create_index([("field_name", 1)])  # 1 表示升序索引，-1 表示降序索引

bulkupdate

上一篇：ElasticSearch客户端批量处理操作bulkIndexAsync引发的内存泄漏
下一篇：ES6.0.0官方参考指南翻译~入门指南~修改数据

mongodb 数据更新性能分析 mongodb更新多条记录

相关推荐

取消回复欢迎你发表评论:

前端面试:iframe 的优缺点? iframe有那些缺点

带斜线的表头制作好了，如何填充内容?这几种方法你更喜欢哪个?

漫学笔记之PHP.ini常用的配置信息

其实模版网站在开发工作中很重要，推荐几个参考站给大家

推荐7个模板代码和其他游戏源码下载的网址

[干货] JAVA - JVM - 2 内存两分 [干货]+java+-+jvm+-+2+内存两分吗

正在学习使用python搭建自动化测试框架?这个系统包你可能会用到

织梦(Dedecms)建站教程织梦建站详细步骤

【开源分享】2024PHP在线客服系统源码(搭建教程+终身使用)

2024PHP在线客服系统源码+完全开源带详细搭建教程

mongodb 数据更新性能分析 mongodb更新多条记录

相关推荐

取消回复欢迎 你 发表评论:

前端面试:iframe 的优缺点? iframe有那些缺点

带斜线的表头制作好了，如何填充内容?这几种方法你更喜欢哪个?

漫学笔记之PHP.ini常用的配置信息

其实模版网站在开发工作中很重要，推荐几个参考站给大家

推荐7个模板代码和其他游戏源码下载的网址

[干货] JAVA - JVM - 2 内存两分 [干货]+java+-+jvm+-+2+内存两分吗

正在学习使用python搭建自动化测试框架?这个系统包你可能会用到

织梦(Dedecms)建站教程 织梦建站详细步骤

【开源分享】2024PHP在线客服系统源码(搭建教程+终身使用)

2024PHP在线客服系统源码+完全开源 带详细搭建教程

取消回复欢迎你发表评论:

织梦(Dedecms)建站教程织梦建站详细步骤

2024PHP在线客服系统源码+完全开源带详细搭建教程