Самый простой код для пересечения массива в JavaScript

StackOverflow https://stackoverflow.com/questions/1885557

Вопрос

Какой самый простой, бесстыдный код для реализации массивов в JavaScript? Я хочу написать

intersection([1,2,3], [2,3,4,5])

и получить

[2, 3]
Это было полезно?

Решение

Использовать комбинацию Array.prototype.filter а также Array.prototype.indexOf:

array1.filter(value => -1 !== array2.indexOf(value))

Или как Вругтехагель Предлагается в комментариях, вы можете использовать более поздние Array.prototype.includes для еще более простого кода:

array1.filter(value => array2.includes(value))

Для старших браузеров:

array1.filter(function(n) {
    return array2.indexOf(n) !== -1;
});

Другие советы

Деструктивный кажется самым простым, особенно если мы можем предположить, что вход сортируется:

/* destructively finds the intersection of 
 * two arrays in a simple fashion.  
 *
 * PARAMS
 *  a - first array, must already be sorted
 *  b - second array, must already be sorted
 *
 * NOTES
 *  State of input arrays is undefined when
 *  the function returns.  They should be 
 *  (prolly) be dumped.
 *
 *  Should have O(n) operations, where n is 
 *    n = MIN(a.length, b.length)
 */
function intersection_destructive(a, b)
{
  var result = [];
  while( a.length > 0 && b.length > 0 )
  {  
     if      (a[0] < b[0] ){ a.shift(); }
     else if (a[0] > b[0] ){ b.shift(); }
     else /* they're equal */
     {
       result.push(a.shift());
       b.shift();
     }
  }

  return result;
}

Неразрушающие должны быть волосы более сложными, так как нам нужно отслеживать индексы:

/* finds the intersection of 
 * two arrays in a simple fashion.  
 *
 * PARAMS
 *  a - first array, must already be sorted
 *  b - second array, must already be sorted
 *
 * NOTES
 *
 *  Should have O(n) operations, where n is 
 *    n = MIN(a.length(), b.length())
 */
function intersect_safe(a, b)
{
  var ai=0, bi=0;
  var result = [];

  while( ai < a.length && bi < b.length )
  {
     if      (a[ai] < b[bi] ){ ai++; }
     else if (a[ai] > b[bi] ){ bi++; }
     else /* they're equal */
     {
       result.push(a[ai]);
       ai++;
       bi++;
     }
  }

  return result;
}

Если ваша среда поддерживает Ecmascript 6 Set, один простой и предположительно эффективный (см. Ссылку на спецификацию):

function intersect(a, b) {
  var setA = new Set(a);
  var setB = new Set(b);
  var intersection = new Set([...setA].filter(x => setB.has(x)));
  return Array.from(intersection);
}

Короче, но менее читаемо (также без создания дополнительного перекрестка Set):

function intersect(a, b) {
      return [...new Set(a)].filter(x => new Set(b).has(x));
}

Избегая нового Set из b каждый раз:

function intersect(a, b) {
      var setB = new Set(b);
      return [...new Set(a)].filter(x => setB.has(x));
}

Обратите внимание, что при использовании наборов вы получите только различные значения, таким образом new Set[1,2,3,3].size оценивает 3.

С использованием Подчеркивается или же Lodash.js

_.intersection( [0,345,324] , [1,0,324] )  // gives [0,324]

Мой вклад в терминах ES6. В целом он обнаруживает пересечение массива с неопределенным количеством массивов, предоставленных в качестве аргументов.

Array.prototype.intersect = function(...a) {
  return [this,...a].reduce((p,c) => p.filter(e => c.includes(e)));
}
var arrs = [[0,2,4,6,8],[4,5,6,7],[4,6]],
     arr = [0,1,2,3,4,5,6,7,8,9];

document.write("<pre>" + JSON.stringify(arr.intersect(...arrs)) + "</pre>");

Как насчет того, чтобы просто использовать ассоциативные массивы?

function intersect(a, b) {
    var d1 = {};
    var d2 = {};
    var results = [];
    for (var i = 0; i < a.length; i++) {
        d1[a[i]] = true;
    }
    for (var j = 0; j < b.length; j++) {
        d2[b[j]] = true;
    }
    for (var k in d1) {
        if (d2[k]) 
            results.push(k);
    }
    return results;
}

редактировать:

// new version
function intersect(a, b) {
    var d = {};
    var results = [];
    for (var i = 0; i < b.length; i++) {
        d[b[i]] = true;
    }
    for (var j = 0; j < a.length; j++) {
        if (d[a[j]]) 
            results.push(a[j]);
    }
    return results;
}

Производительность реализации @ATK для отсортированных массивов примитивов может быть улучшена с помощью .pop, а не.

function intersect(array1, array2) {
   var result = [];
   // Don't destroy the original arrays
   var a = array1.slice(0);
   var b = array2.slice(0);
   var aLast = a.length - 1;
   var bLast = b.length - 1;
   while (aLast >= 0 && bLast >= 0) {
      if (a[aLast] > b[bLast] ) {
         a.pop();
         aLast--;
      } else if (a[aLast] < b[bLast] ){
         b.pop();
         bLast--;
      } else /* they're equal */ {
         result.push(a.pop());
         b.pop();
         aLast--;
         bLast--;
      }
   }
   return result;
}

Я создал эталон с помощью JSPERF: http://bit.ly/p9frzk. Анкет Это примерно в три раза быстрее в использовании .pop.

// Return elements of array a that are also in b in linear time:
function intersect(a, b) {
  return a.filter(Set.prototype.has, new Set(b));
}

// Example:
console.log(intersect([1,2,3], [2,3,4,5]));

Я рекомендую выше краткое решение, которое превосходит другие реализации на больших входах. Если производительность на небольших входах имеет значение, проверьте альтернативы ниже.

Альтернативы и сравнение производительности:

См. Следующий фрагмент для альтернативных реализаций и проверки https://jsperf.com/array-intersection-comparison Для сравнения производительности.

function intersect_for(a, b) {
  const result = [];
  const alen = a.length;
  const blen = b.length;
  for (let i = 0; i < alen; ++i) {
    const ai = a[i];
    for (let j = 0; j < blen; ++j) {
      if (ai === b[j]) {
        result.push(ai);
        break;
      }
    }
  } 
  return result;
}

function intersect_filter_indexOf(a, b) {
  return a.filter(el => b.indexOf(el) !== -1);
}

function intersect_filter_in(a, b) {
  const map = b.reduce((map, el) => {map[el] = true; return map}, {});
  return a.filter(el => el in map);
}

function intersect_for_in(a, b) {
  const result = [];
  const map = {};
  for (let i = 0, length = b.length; i < length; ++i) {
    map[b[i]] = true;
  }
  for (let i = 0, length = a.length; i < length; ++i) {
    if (a[i] in map) result.push(a[i]);
  }
  return result;
}

function intersect_filter_includes(a, b) {
  return a.filter(el => b.includes(el));
}

function intersect_filter_has_this(a, b) {
  return a.filter(Set.prototype.has, new Set(b));
}

function intersect_filter_has_arrow(a, b) {
  const set = new Set(b);
  return a.filter(el => set.has(el));
}

function intersect_for_has(a, b) {
  const result = [];
  const set = new Set(b);
  for (let i = 0, length = a.length; i < length; ++i) {
    if (set.has(a[i])) result.push(a[i]);
  }
  return result;
}

Результаты Firefox 53:

  • OPS/SEC на больших массивах (10 000 элементов):

    filter + has (this)               523 (this answer)
    for + has                         482
    for-loop + in                     279
    filter + in                       242
    for-loops                          24
    filter + includes                  14
    filter + indexOf                   10
    
  • OPS/SEC на небольших массивах (100 элементов):

    for-loop + in                 384,426
    filter + in                   192,066
    for-loops                     159,137
    filter + includes             104,068
    filter + indexOf               71,598
    filter + has (this)            43,531 (this answer)
    filter + has (arrow function)  35,588
    

С использованием jQuery:

var a = [1,2,3];
var b = [2,3,4,5];
var c = $(b).not($(b).not(a));
alert(c);
  1. Сортировать это
  2. Проверьте один за другим из индекса 0, создайте новый массив из этого.

Что -то вроде этого, хотя не хорошо проверяется.

function intersection(x,y){
 x.sort();y.sort();
 var i=j=0;ret=[];
 while(i<x.length && j<y.length){
  if(x[i]<y[j])i++;
  else if(y[j]<x[i])j++;
  else {
   ret.push(x[i]);
   i++,j++;
  }
 }
 return ret;
}

alert(intersection([1,2,3], [2,3,4,5]));

PS: Алгоритм, предназначенный только для чисел и нормальных строк, пересечение массивов арбитатных объектов не может работать.

Для массивов, содержащих только строки или цифры, вы можете что -то сделать с сортировкой, согласно некоторым другим ответам. Для общего случая массивов произвольных объектов я не думаю, что вы можете избежать этого долгий путь. Следующее даст вам пересечение любого количества массивов, предоставленных в качестве параметров для arrayIntersection:

var arrayContains = Array.prototype.indexOf ?
    function(arr, val) {
        return arr.indexOf(val) > -1;
    } :
    function(arr, val) {
        var i = arr.length;
        while (i--) {
            if (arr[i] === val) {
                return true;
            }
        }
        return false;
    };

function arrayIntersection() {
    var val, arrayCount, firstArray, i, j, intersection = [], missing;
    var arrays = Array.prototype.slice.call(arguments); // Convert arguments into a real array

    // Search for common values
    firstArray = arrays.pop();
    if (firstArray) {
        j = firstArray.length;
        arrayCount = arrays.length;
        while (j--) {
            val = firstArray[j];
            missing = false;

            // Check val is present in each remaining array 
            i = arrayCount;
            while (!missing && i--) {
                if ( !arrayContains(arrays[i], val) ) {
                    missing = true;
                }
            }
            if (!missing) {
                intersection.push(val);
            }
        }
    }
    return intersection;
}

arrayIntersection( [1, 2, 3, "a"], [1, "a", 2], ["a", 1] ); // Gives [1, "a"]; 

Он довольно короткий с помощью ES2015 и наборов. Принимает массивные значения, такие как строка, и удаляет дубликаты.

let intersection = function(a, b) {
  a = new Set(a), b = new Set(b);
  return [...a].filter(v => b.has(v));
};

console.log(intersection([1,2,1,2,3], [2,3,5,4,5,3]));

console.log(intersection('ccaabbab', 'addb').join(''));

Крошечный настройка для самого маленького здесь ( Решение фильтра/индекса), а именно создание индекса значений в одном из массивов с использованием объекта JavaScript, уменьшит его от O (n*M) до «вероятно» линейного времени. источник1 источник2

function intersect(a, b) {
  var aa = {};
  a.forEach(function(v) { aa[v]=1; });
  return b.filter(function(v) { return v in aa; });
}

Это не самое простое решение (это больше кода, чем Фильтр+Индекс), и это не очень быстро (вероятно, медленнее постоянным фактором, чем recsect_safe ()), но кажется довольно хорошим балансом. Это на очень Простая сторона, обеспечивая хорошую производительность, и не требует предварительных входов.

Другой индексированный подход, способный обработать любое количество массивов одновременно:

// Calculate intersection of multiple array or object values.
function intersect (arrList) {
    var arrLength = Object.keys(arrList).length;
        // (Also accepts regular objects as input)
    var index = {};
    for (var i in arrList) {
        for (var j in arrList[i]) {
            var v = arrList[i][j];
            if (index[v] === undefined) index[v] = 0;
            index[v]++;
        };
    };
    var retv = [];
    for (var i in index) {
        if (index[i] == arrLength) retv.push(i);
    };
    return retv;
};

Он работает только для значений, которые можно оценить как строки, и вы должны передавать их как массив, подобный:

intersect ([arr1, arr2, arr3...]);

... но он прозрачно принимает объекты как параметр или как любой из элементов, которые будут пересекаются (всегда возвращает массив общих значений). Примеры:

intersect ({foo: [1, 2, 3, 4], bar: {a: 2, j:4}}); // [2, 4]
intersect ([{x: "hello", y: "world"}, ["hello", "user"]]); // ["hello"]

РЕДАКТИРОВАТЬ: Я только что заметил, что это, в некотором смысле, слегка багги.

То есть: я кодировал, думая, что входные массивы не могут содержать повторения (как не приведен пример).

Но если входные массивы содержат повторения, это даст неправильные результаты. Пример (используя реализацию ниже):

intersect ([[1, 3, 4, 6, 3], [1, 8, 99]]);
// Expected: [ '1' ]
// Actual: [ '1', '3' ]

К счастью, это легко исправить, просто добавив индексацию второго уровня. То есть:

Изменять:

        if (index[v] === undefined) index[v] = 0;
        index[v]++;

по:

        if (index[v] === undefined) index[v] = {};
        index[v][i] = true; // Mark as present in i input.

...а также:

         if (index[i] == arrLength) retv.push(i);

по:

         if (Object.keys(index[i]).length == arrLength) retv.push(i);

Полный пример:

// Calculate intersection of multiple array or object values.
function intersect (arrList) {
    var arrLength = Object.keys(arrList).length;
        // (Also accepts regular objects as input)
    var index = {};
    for (var i in arrList) {
        for (var j in arrList[i]) {
            var v = arrList[i][j];
            if (index[v] === undefined) index[v] = {};
            index[v][i] = true; // Mark as present in i input.
        };
    };
    var retv = [];
    for (var i in index) {
        if (Object.keys(index[i]).length == arrLength) retv.push(i);
    };
    return retv;
};

intersect ([[1, 3, 4, 6, 3], [1, 8, 99]]); // [ '1' ]
function intersection(A,B){
var result = new Array();
for (i=0; i<A.length; i++) {
    for (j=0; j<B.length; j++) {
        if (A[i] == B[j] && $.inArray(A[i],result) == -1) {
            result.push(A[i]);
        }
    }
}
return result;
}

С некоторыми ограничениями на ваши данные, вы можете сделать это в линейный время!

За Положительные целые числа: Используйте массив, отображая значения с «видно/не видно» логического.

function intersectIntegers(array1,array2) { 
   var seen=[],
       result=[];
   for (var i = 0; i < array1.length; i++) {
     seen[array1[i]] = true;
   }
   for (var i = 0; i < array2.length; i++) {
     if ( seen[array2[i]])
        result.push(array2[i]);
   }
   return result;
}

Есть аналогичная техника для объекты: Возьмите фиктивный ключ, установите его на «True» для каждого элемента в Array1, затем ищите этот ключ в элементах Array2. Учитете, когда закончите.

function intersectObjects(array1,array2) { 
   var result=[];
   var key="tmpKey_intersect"
   for (var i = 0; i < array1.length; i++) {
     array1[i][key] = true;
   }
   for (var i = 0; i < array2.length; i++) {
     if (array2[i][key])
        result.push(array2[i]);
   }
   for (var i = 0; i < array1.length; i++) {
     delete array1[i][key];
   }
   return result;
}

Конечно, вы должны быть уверены, что ключ не появлялся раньше, иначе вы будете уничтожать свои данные ...

Я внеслю свой вклад в то, что было для меня лучше всего:

if (!Array.prototype.intersect){
Array.prototype.intersect = function (arr1) {

    var r = [], o = {}, l = this.length, i, v;
    for (i = 0; i < l; i++) {
        o[this[i]] = true;
    }
    l = arr1.length;
    for (i = 0; i < l; i++) {
        v = arr1[i];
        if (v in o) {
            r.push(v);
        }
    }
    return r;
};
}

«Индекс» для IE 9.0, Chrome, Firefox, Opera,

    function intersection(a,b){
     var rs = [], x = a.length;
     while (x--) b.indexOf(a[x])!=-1 && rs.push(a[x]);
     return rs.sort();
    }

intersection([1,2,3], [2,3,4,5]);
//Result:  [2,3]

Это, наверное, самый простой, кроме list1.filter (n => list2.includes (n))

var list1 = ['bread', 'ice cream', 'cereals', 'strawberry', 'chocolate']
var list2 = ['bread', 'cherry', 'ice cream', 'oats']

function check_common(list1, list2){
	
	list3 = []
	for (let i=0; i<list1.length; i++){
		
		for (let j=0; j<list2.length; j++){	
			if (list1[i] === list2[j]){
				list3.push(list1[i]);				
			}		
		}
		
	}
	return list3
	
}

check_common(list1, list2) // ["bread", "ice cream"]

Вы можете использовать (для всех браузеров, кроме IE):

const intersection = array1.filter(element => array2.includes(element));

или для IE:

const intersection = array1.filter(element => array2.indexOf(element) !== -1);

'use strict'

// Example 1
function intersection(a1, a2) {
    return a1.filter(x => a2.indexOf(x) > -1)
}

// Example 2 (prototype function)
Array.prototype.intersection = function(arr) {
    return this.filter(x => arr.indexOf(x) > -1)
} 

const a1 = [1, 2, 3]
const a2 = [2, 3, 4, 5]

console.log(intersection(a1, a2))
console.log(a1.intersection(a2))

Функциональный подход с ES2015

Функциональный подход должен рассмотреть возможность использования только чистых функций без побочных эффектов, каждый из которых связан только с одной задачей.

Эти ограничения усиливают композицию и повторную возможность повторного использования функций.

// small, reusable auxiliary functions

const createSet = xs => new Set(xs);
const filter = f => xs => xs.filter(apply(f));
const apply = f => x => f(x);


// intersection

const intersect = xs => ys => {
  const zs = createSet(ys);
  return filter(x => zs.has(x)
     ? true
     : false
  ) (xs);
};


// mock data

const xs = [1,2,2,3,4,5];
const ys = [0,1,2,3,3,3,6,7,8,9];


// run it

console.log( intersect(xs) (ys) );

Обратите внимание, что родной Set Используется тип, который обладает выгодной производительностью поиска.

Избегайте дубликатов

Очевидно неоднократно встречающиеся предметы с первого Array сохраняются, а второй Array детукации. Это может быть или может быть не желаемое поведение. Если вам нужен уникальный результат, просто примените dedupe к первому аргументу:

// auxiliary functions

const apply = f => x => f(x);
const comp = f => g => x => f(g(x));
const afrom = apply(Array.from);
const createSet = xs => new Set(xs);
const filter = f => xs => xs.filter(apply(f));


// intersection

const intersect = xs => ys => {
  const zs = createSet(ys);
  return filter(x => zs.has(x)
     ? true
     : false
  ) (xs);
};


// de-duplication

const dedupe = comp(afrom) (createSet);


// mock data

const xs = [1,2,2,3,4,5];
const ys = [0,1,2,3,3,3,6,7,8,9];


// unique result

console.log( intersect(dedupe(xs)) (ys) );

Вычислить пересечение любого количества Arrayс

Если вы хотите вычислить пересечение произвольного числа ArrayS просто составьте intersect с foldl. Анкет Вот удобная функция:

// auxiliary functions

const apply = f => x => f(x);
const uncurry = f => (x, y) => f(x) (y);
const createSet = xs => new Set(xs);
const filter = f => xs => xs.filter(apply(f));
const foldl = f => acc => xs => xs.reduce(uncurry(f), acc);


// intersection

const intersect = xs => ys => {
  const zs = createSet(ys);
  return filter(x => zs.has(x)
     ? true
     : false
  ) (xs);
};


// intersection of an arbitrarily number of Arrays

const intersectn = (head, ...tail) => foldl(intersect) (head) (tail);


// mock data

const xs = [1,2,2,3,4,5];
const ys = [0,1,2,3,3,3,6,7,8,9];
const zs = [0,1,2,3,4,5,6];


// run

console.log( intersectn(xs, ys, zs) );

Для простоты:

// Usage
const intersection = allLists
  .reduce(intersect, allValues)
  .reduce(removeDuplicates, []);


// Implementation
const intersect = (intersection, list) =>
  intersection.filter(item =>
    list.some(x => x === item));

const removeDuplicates = (uniques, item) =>
  uniques.includes(item) ? uniques : uniques.concat(item);


// Example Data
const somePeople = [bob, doug, jill];
const otherPeople = [sarah, bob, jill];
const morePeople = [jack, jill];

const allPeople = [...somePeople, ...otherPeople, ...morePeople];
const allGroups = [somePeople, otherPeople, morePeople];

// Example Usage
const intersection = allGroups
  .reduce(intersect, allPeople)
  .reduce(removeDuplicates, []);

intersection; // [jill]

Преимущества:

  • грязь просто
  • ориентированный на данные
  • работает для произвольного количества списков
  • работает на произвольную длину списков
  • работает для произвольных типов значений
  • Работает на произвольный заказ сортировки
  • сохраняет форму (порядок первого появления в любом массиве)
  • выходит рано, где это возможно
  • ЗАПИСА ЗАМЕРКА, ЧТОБЫ НЕ ВЫПУСКА С помощью прототипов функции / массива

Недостатки:

  • более высокое использование памяти
  • Более высокое использование процессора
  • требует понимания уменьшения
  • Требуется понимание потока данных

Вы не захотите использовать это для работы 3D-двигателя или ядра, но если у вас возникнут проблемы с тем, чтобы это запустить в приложении на основе событий, ваш дизайн имеет большие проблемы.

.reduce построить карту и .filter Чтобы найти пересечение. delete внутри .filter позволяет нам относиться ко второму массиву, как будто это уникальный набор.

function intersection (a, b) {
  var seen = a.reduce(function (h, k) {
    h[k] = true;
    return h;
  }, {});

  return b.filter(function (k) {
    var exists = seen[k];
    delete seen[k];
    return exists;
  });
}

Я нахожу этот подход довольно легко рассуждать. Он работает в постоянное время.

Вот подчеркивается реализация:

_.intersection = function(array) {
  if (array == null) return [];
  var result = [];
  var argsLength = arguments.length;
  for (var i = 0, length = array.length; i < length; i++) {
    var item = array[i];
    if (_.contains(result, item)) continue;
    for (var j = 1; j < argsLength; j++) {
      if (!_.contains(arguments[j], item)) break;
    }
    if (j === argsLength) result.push(item);
  }
  return result;
};

Источник: http://underscorejs.org/docs/underscore.html#section-62

function getIntersection(arr1, arr2){
    var result = [];
    arr1.forEach(function(elem){
        arr2.forEach(function(elem2){
            if(elem === elem2){
                result.push(elem);
            }
        });
    });
    return result;
}

getIntersection([1,2,3], [2,3,4,5]); // [ 2, 3 ]

Если вам нужно, чтобы он обрабатывал пересечение нескольких массивов:

const intersect = (a, b, ...rest) => {
  if (rest.length === 0) return [...new Set(a)].filter(x => new Set(b).has(x));
  return intersect(a, intersect(b, ...rest));
};

console.log(intersect([1,2,3,4,5], [1,2], [1, 2, 3,4,5], [2, 10, 1])) // [1,2]

ES6 стиль простой путь.

const intersection = (a, b) => {
  const s = new Set(b);
  return a.filter(x => s.has(x));
};

Пример:

intersection([1, 2, 3], [4, 3, 2]); // [2, 3]

Скорее использование индекса вы также можете использовать Array.Protype.includes.

function intersection(arr1, arr2) {
  return arr1.filter((ele => {
    return arr2.includes(ele);
  }));
}

console.log(intersection([1,2,3], [2,3,4,5]));

Вам не нужно объявлять промежуточную переменную внутри функции для второго массива, если второй массив всегда будет обрабатываться как установлен.

Следующее решение возвращает массив уникальных значений, которые встречаются в обоих массивах:

const intersection = (a, b) => {
  b = new Set(b); // recycling variable
  return [...new Set(a)].filter(e => b.has(e));
};

console.log(intersection([1, 2, 3, 1, 1], [1, 2, 4])); // Array [ 1, 2 ]
Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top