Aggiornamento MongoDB campo utilizzando il valore di un altro campo
-
09-10-2019 - |
Domanda
In MongoDB, è possibile aggiornare il valore di un campo utilizzando il valore da un altro campo? Lo SQL equivalente sarebbe qualcosa di simile:
UPDATE Person SET Name = FirstName + ' ' + LastName
E la pseudo-codice MongoDB potrebbe essere:
db.person.update( {}, { $set : { name : firstName + ' ' + lastName } );
Soluzione
Il modo migliore per farlo è in versione 4.2+, che permette di utilizzare di aggregazione gasdotto nel documento aggiornamento e la updateOne
, updateMany
o update
metodo di raccolta. Si noti che quest'ultimo è stato deprecato nella maggior parte se non tutti i driver lingue.
MongoDB 4.2 +
La versione 4.2 ha anche introdotto il $set
fase gasdotto che è un alias per $addFields
. Userò $set
qui come Mappe con quello che stiamo cercando di realizzare.
db.collection.<update method>(
{},
[
{"$set": {"name": { "$concat": ["$firstName", " ", "$lastName"]}}}
]
)
MongoDB 3.4 +
In 3.4+ è possibile utilizzare $addFields
e il $out
operatori di aggregazione gasdotti.
db.collection.aggregate(
[
{ "$addFields": {
"name": { "$concat": [ "$firstName", " ", "$lastName" ] }
}},
{ "$out": "collection" }
]
)
Si noti che questo non aggiorna la vostra collezione, ma invece di sostituire la raccolta esistente o crearne uno nuovo. Anche per le operazioni di aggiornamento che richiedono "tipo casting" sarà necessario l'elaborazione lato client, e a seconda dell'operazione, potrebbe essere necessario utilizzare il metodo find()
invece che il metodo .aggreate()
.
MongoDB 3.2 e 3.0
Il nostro modo di fare questo è di $project
ing nostri documenti e utilizzare l'operatore $concat
aggregazione stringa restituire la stringa concatenata.
siamo Da lì, poi iterare il cursore e utilizzare il $set
aggiornamento per aggiungere il nuovo campo per i documenti utilizzando le operazioni di massa per la massima efficienza.
Aggregazione query:
var cursor = db.collection.aggregate([
{ "$project": {
"name": { "$concat": [ "$firstName", " ", "$lastName" ] }
}}
])
MongoDB 3.2 o più recente
da questo, è necessario utilizzare il bulkWrite
metodo.
var requests = [];
cursor.forEach(document => {
requests.push( {
'updateOne': {
'filter': { '_id': document._id },
'update': { '$set': { 'name': document.name } }
}
});
if (requests.length === 500) {
//Execute per 500 operations and re-init
db.collection.bulkWrite(requests);
requests = [];
}
});
if(requests.length > 0) {
db.collection.bulkWrite(requests);
}
MongoDB 2.6 e 3.0
Da questa versione è necessario utilizzare l'ormai deprecato Bulk
API e la sua metodi associati .
var bulk = db.collection.initializeUnorderedBulkOp();
var count = 0;
cursor.snapshot().forEach(function(document) {
bulk.find({ '_id': document._id }).updateOne( {
'$set': { 'name': document.name }
});
count++;
if(count%500 === 0) {
// Excecute per 500 operations and re-init
bulk.execute();
bulk = db.collection.initializeUnorderedBulkOp();
}
})
// clean up queues
if(count > 0) {
bulk.execute();
}
MongoDB 2.4
cursor["result"].forEach(function(document) {
db.collection.update(
{ "_id": document._id },
{ "$set": { "name": document.name } }
);
})
Altri suggerimenti
Si deve scorrere. Per il vostro caso specifico:
db.person.find().snapshot().forEach(
function (elem) {
db.person.update(
{
_id: elem._id
},
{
$set: {
name: elem.firstname + ' ' + elem.lastname
}
}
);
}
);
A quanto pare c'è un modo per farlo in modo efficiente dal MongoDB 3.4, vedi di styvane risposta .
risposta obsoleto seguente
Non è possibile fare riferimento al documento stesso in un aggiornamento (ancora). Avrete bisogno per scorrere i documenti e aggiornare ogni documento utilizzando una funzione. Vedere questa risposta per un esempio , oppure questo per eval()
lato server.
Per un database ad elevata attività, si può incorrere in problemi in cui gli aggiornamenti interessano record che cambiano attivamente e per questo motivo mi consiglia di utilizzare snapshot ()
db.person.find().snapshot().forEach( function (hombre) {
hombre.name = hombre.firstName + ' ' + hombre.lastName;
db.person.save(hombre);
});
http://docs.mongodb.org/manual/reference/method /cursor.snapshot/
ho provato la soluzione di cui sopra ma ho trovato inadatto per grandi quantità di dati. Ho poi scoperto la funzione di flusso:
MongoClient.connect("...", function(err, db){
var c = db.collection('yourCollection');
var s = c.find({/* your query */}).stream();
s.on('data', function(doc){
c.update({_id: doc._id}, {$set: {name : doc.firstName + ' ' + doc.lastName}}, function(err, result) { /* result == true? */} }
});
s.on('end', function(){
// stream can end before all your updates do if you have a lot
})
})
Per quanto riguarda questo risposta , la funzione snapshot è deprecato in versione 3.6, in base a questo aggiornamento . Quindi, sulla versione 3.6 e successive, è possibile eseguire l'operazione in questo modo:
db.person.find().forEach(
function (elem) {
db.person.update(
{
_id: elem._id
},
{
$set: {
name: elem.firstname + ' ' + elem.lastname
}
}
);
}
);
Ecco quello che siamo venuti su con per la copia di un campo all'altro per ~ 150_000 record. Ci sono voluti circa 6 minuti, ma è ancora significativamente meno risorse di quanto lo sarebbe stato per istanziare e iterare rispetto allo stesso numero di oggetti rubino.
js_query = %({
$or : [
{
'settings.mobile_notifications' : { $exists : false },
'settings.mobile_admin_notifications' : { $exists : false }
}
]
})
js_for_each = %(function(user) {
if (!user.settings.hasOwnProperty('mobile_notifications')) {
user.settings.mobile_notifications = user.settings.email_notifications;
}
if (!user.settings.hasOwnProperty('mobile_admin_notifications')) {
user.settings.mobile_admin_notifications = user.settings.email_admin_notifications;
}
db.users.save(user);
})
js = "db.users.find(#{js_query}).forEach(#{js_for_each});"
Mongoid::Sessions.default.command('$eval' => js)
Mongo 4.2
di partenza, db.collection.update()
può accettare una pipeline di aggregazione, infine, che permette l'aggiornamento / creazione di un campo in base a un altro campo:
// { firstName: "Hello", lastName: "World" }
db.collection.update(
{},
[{ $set: { name: { $concat: [ "$firstName", " ", "$lastName" ] } } }],
{ multi: true }
)
// { "firstName" : "Hello", "lastName" : "World", "name" : "Hello World" }
-
La prima parte è
{}
query partita, filtrando quali documenti aggiornamento (nel nostro caso tutti i documenti). -
La seconda parte
[{ $set: { name: { ... } }]
è il gasdotto aggiornamento di aggregazione (da notare le parentesi quadre significare l'uso di una conduttura di aggregazione).$set
è un nuovo operatore di aggregazione e un alias di$addFields
. -
Non dimenticate
{ multi: true }
, altrimenti solo il primo documento corrispondente sarà aggiornato.