
Ho bisogno di un componente / classe che limita l'esecuzione di un metodo al massimo M chiamate in N secondi (o ms o nanos, non importa).

In altre parole, devo assicurarmi che il mio metodo venga eseguito non più di M volte in una finestra scorrevole di N secondi.

Se non conosci il corso esistente, sentiti libero di pubblicare le tue soluzioni / idee su come implementarlo.

Userei un buffer ad anello di timestamp con una dimensione fissa di M. Ogni volta viene chiamato il metodo, controlli la voce più vecchia e, se in passato è meno di N secondi, esegui e aggiungi un'altra voce, altrimenti dormi per la differenza di orario.

Quello che ha funzionato per me era Google Guava RateLimiter .

// Allow one request per second
private RateLimiter throttle = RateLimiter.create(1.0);

private void someMethod() {
    // Do something

In termini concreti, dovresti essere in grado di implementarlo con un DelayQueue . Inizializza la coda con le istanze M ritardate con il loro ritardo inizialmente impostato su zero. Quando arrivano le richieste al metodo, accetta un token, che provoca il blocco del metodo fino a quando non viene soddisfatto il requisito di limitazione. Quando è stato preso un token, aggiungi un nuovo token alla coda con un ritardo di N .

Leggi sull'algoritmo Secchio token . Fondamentalmente, hai un secchio con token. Ogni volta che si esegue il metodo, si prende un token. Se non ci sono più token, blocchi fino a quando non ne ottieni uno. Nel frattempo, c'è un attore esterno che riempie i token a un intervallo fisso.

Non sono a conoscenza di una libreria per fare questo (o qualcosa di simile). È possibile scrivere questa logica nel codice o utilizzare AspectJ per aggiungere il comportamento.

Questo dipende dall'applicazione.

Immagina il caso in cui più thread desiderano che un token esegua alcune azioni limitate a livello globale senza nessun burst consentito (ovvero per limitare 10 azioni ogni 10 secondi, ma non si desidera che 10 azioni si verifichino nel primo secondo e che quindi vengano interrotte per 9 secondi).

DelayedQueue ha uno svantaggio: l'ordine in cui i thread richiedono i token potrebbe non essere l'ordine in cui ottengono la loro richiesta soddisfatta. Se più thread sono bloccati in attesa di un token, non è chiaro quale prenderà il prossimo token disponibile. Potrei anche avere discussioni in attesa per sempre, dal mio punto di vista.

Una soluzione è avere un intervallo di tempo minimo tra due azioni consecutive e intraprendere azioni nello stesso ordine in cui sono state richieste.

Ecco un'implementazione:

public class LeakyBucket {
    protected float maxRate;
    protected long minTime;
    //holds time of last action (past or future!)
    protected long lastSchedAction = System.currentTimeMillis();

    public LeakyBucket(float maxRate) throws Exception {
        if(maxRate <= 0.0f) {
            throw new Exception("Invalid rate");
        this.maxRate = maxRate;
        this.minTime = (long)(1000.0f / maxRate);

    public void consume() throws InterruptedException {
        long curTime = System.currentTimeMillis();
        long timeLeft;

        //calculate when can we do the action
        synchronized(this) {
            timeLeft = lastSchedAction + minTime - curTime;
            if(timeLeft > 0) {
                lastSchedAction += minTime;
            else {
                lastSchedAction = curTime;

        //If needed, wait for our time
        if(timeLeft <= 0) {
        else {

Se hai bisogno di un limitatore di velocità per finestre scorrevoli basato su Java che funzionerà attraverso un sistema distribuito potresti dare un'occhiata al progetto.

Una configurazione supportata da Redis, per limitare le richieste da IP a 50 al minuto, sarebbe simile a questa:

import com.lambdaworks.redis.RedisClient;
import es.moki.ratelimitj.core.LimitRule;

RedisClient client = RedisClient.create("redis://localhost");
Set<LimitRule> rules = Collections.singleton(LimitRule.of(1, TimeUnit.MINUTES, 50)); // 50 request per minute, per key
RedisRateLimit requestRateLimiter = new RedisRateLimit(client, rules);

boolean overLimit = requestRateLimiter.overLimit("ip:");

Vedi / ratelimitj-redis per ulteriori dettagli sulla configurazione di Redis.

Anche se non è quello che hai chiesto, ThreadPoolExecutor , progettato per limitare M richieste simultanee anziché M richieste in N secondi, potrebbe anche essere utile.

Ho implementato un semplice algoritmo di limitazione. Prova questo link,

Una breve descrizione dell'algoritmo,

Questo algoritmo utilizza la capacità di Java Ritardato coda . Crea un oggetto in ritardo con l'atteso ritardo (qui 1000 / M per millisecondi TimeUnit ). Inserisci lo stesso oggetto nella coda ritardata che fornirà la finestra mobile per noi. Quindi prima di ogni metodo chiamare prende l'oggetto dalla coda, take è una chiamata bloccante che tornerà solo dopo il ritardo specificato e dopo la chiamata del metodo non dimenticare di mettere l'oggetto nella coda con il tempo aggiornato (qui millisecondi attuali ).

Qui possiamo anche avere più oggetti ritardati con ritardo diverso. Questo approccio fornirà anche un throughput elevato.

La mia implementazione di seguito può gestire la precisione temporale della richiesta arbitraria, ha una complessità temporale O (1) per ogni richiesta, non richiede alcun buffer aggiuntivo, ad es. O (1) complessità dello spazio, inoltre non richiede thread in background per rilasciare token, invece i token vengono rilasciati in base al tempo trascorso dall'ultima richiesta.

class RateLimiter {
    int limit;
    double available;
    long interval;

    long lastTimeStamp;

    RateLimiter(int limit, long interval) {
        this.limit = limit;
        this.interval = interval;

        available = 0;
        lastTimeStamp = System.currentTimeMillis();

    synchronized boolean canAdd() {
        long now = System.currentTimeMillis();
        // more token are released since last request
        available += (now-lastTimeStamp)*1.0/interval*limit; 
        if (available>limit)
            available = limit;

        if (available<1)
            return false;
        else {
            lastTimeStamp = now;
            return true;

Prova a usare questo semplice approccio:

public class SimpleThrottler {

private static final int T = 1; // min
private static final int N = 345;

private Lock lock = new ReentrantLock();
private Condition newFrame = lock.newCondition();
private volatile boolean currentFrame = true;

public SimpleThrottler() {

 * Payload
private void job() {
    try {
        Thread.sleep(Math.abs(ThreadLocalRandom.current().nextLong(12, 98)));
    } catch (InterruptedException e) {
    System.err.print(" J. ");

public void doJob() throws InterruptedException {
    try {

        while (true) {

            int count = 0;

            while (count < N && currentFrame) {

            currentFrame = true;

    } finally {

public void handleForGate() {
    Thread handler = new Thread(() -> {
        while (true) {
            try {
                Thread.sleep(1 * 900);
            } catch (InterruptedException e) {
            } finally {
                currentFrame = false;

                try {
                } finally {


Apache Camel supporta anche fornito con Throttler meccanismo come segue:


Questo è un aggiornamento al codice LeakyBucket sopra. Funziona per oltre 1000 richieste al secondo.

import lombok.SneakyThrows;
import java.util.concurrent.TimeUnit;

class LeakyBucket {
  private long minTimeNano; // sec / billion
  private long sched = System.nanoTime();

   * Create a rate limiter using the leakybucket alg.
   * @param perSec the number of requests per second
  public LeakyBucket(double perSec) {
    if (perSec <= 0.0) {
      throw new RuntimeException("Invalid rate " + perSec);
    this.minTimeNano = (long) (1_000_000_000.0 / perSec);

  @SneakyThrows public void consume() {
    long curr = System.nanoTime();
    long timeLeft;

    synchronized (this) {
      timeLeft = sched - curr + minTimeNano;
      sched += minTimeNano;
    if (timeLeft <= minTimeNano) {

e il più semplice per sopra:

import org.junit.Ignore;
import org.junit.Test;

import java.util.concurrent.TimeUnit;

public class LeakyBucketTest {
  @Test @Ignore public void t() {
    double numberPerSec = 10000;
    LeakyBucket b = new LeakyBucket(numberPerSec);
    Stopwatch w = Stopwatch.createStarted();
    IntStream.range(0, (int) (numberPerSec * 5)).parallel().forEach(
        x -> b.consume());
    System.out.printf("%,d ms%n", w.elapsed(TimeUnit.MILLISECONDS));

Ecco una versione avanzata del semplice limitatore di velocità

 * Simple request limiter based on Thread.sleep method.
 * Create limiter instance via {@link #create(float)} and call {@link #consume()} before making any request.
 * If the limit is exceeded cosume method locks and waits for current call rate to fall down below the limit
public class RequestRateLimiter {

    private long minTime;

    private long lastSchedAction;
    private double avgSpent = 0;

    ArrayList<RatePeriod> periods;

    public static class RatePeriod{

        private LocalTime start;

        private LocalTime end;

        private float maxRate;

     * Create request limiter with maxRate - maximum number of requests per second
     * @param maxRate - maximum number of requests per second
     * @return
    public static RequestRateLimiter create(float maxRate){
        return new RequestRateLimiter(Arrays.asList( new RatePeriod(LocalTime.of(0,0,0),
                LocalTime.of(23,59,59), maxRate)));

     * Create request limiter with ratePeriods calendar - maximum number of requests per second in every period
     * @param ratePeriods - rate calendar
     * @return
    public static RequestRateLimiter create(List<RatePeriod> ratePeriods){
        return new RequestRateLimiter(ratePeriods);

    private void checkArgs(List<RatePeriod> ratePeriods){

        for (RatePeriod rp: ratePeriods ){
            if ( null == rp || rp.maxRate <= 0.0f || null == rp.start || null == rp.end )
                throw new IllegalArgumentException("list contains null or rate is less then zero or period is zero length");

    private float getCurrentRate(){

        LocalTime now =;

        for (RatePeriod rp: periods){
            if ( now.isAfter( rp.start ) && now.isBefore( rp.end ) )
                return rp.maxRate;

        return Float.MAX_VALUE;

    private RequestRateLimiter(List<RatePeriod> ratePeriods){

        periods = new ArrayList<>(ratePeriods.size());

        this.minTime = (long)(1000.0f / getCurrentRate());
        this.lastSchedAction = System.currentTimeMillis() - minTime;

     * Call this method before making actual request.
     * Method call locks until current rate falls down below the limit
     * @throws InterruptedException
    public void consume() throws InterruptedException {

        long timeLeft;

        synchronized(this) {
            long curTime = System.currentTimeMillis();

            minTime = (long)(1000.0f / getCurrentRate());
            timeLeft = lastSchedAction + minTime - curTime;

            long timeSpent = curTime - lastSchedAction + timeLeft;
            avgSpent = (avgSpent + timeSpent) / 2;

            if(timeLeft <= 0) {
                lastSchedAction = curTime;

            lastSchedAction = curTime + timeLeft;


    public synchronized float getCuRate(){
        return (float) ( 1000d / avgSpent);

E unit test

import org.junit.Assert;
import org.junit.Test;

import java.util.ArrayList;
import java.util.List;
import java.util.Random;
import java.util.concurrent.ExecutionException;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import java.util.concurrent.Future;

public class RequestRateLimiterTest {

    @Test(expected = IllegalArgumentException.class)
    public void checkSingleThreadZeroRate(){

        // Zero rate
        RequestRateLimiter limiter = RequestRateLimiter.create(0);
        try {
        } catch (InterruptedException e) {

    public void checkSingleThreadUnlimitedRate(){

        // Unlimited
        RequestRateLimiter limiter = RequestRateLimiter.create(Float.MAX_VALUE);

        long started = System.currentTimeMillis();
        for ( int i = 0; i < 1000; i++ ){

            try {
            } catch (InterruptedException e) {

        long ended = System.currentTimeMillis();
        System.out.println( "Current rate:" + limiter.getCurRate() );
        Assert.assertTrue( ((ended - started) < 1000));

    public void rcheckSingleThreadRate(){

        // 3 request per minute
        RequestRateLimiter limiter = RequestRateLimiter.create(3f/60f);

        long started = System.currentTimeMillis();
        for ( int i = 0; i < 3; i++ ){

            try {
            } catch (InterruptedException e) {

        long ended = System.currentTimeMillis();

        System.out.println( "Current rate:" + limiter.getCurRate() );
        Assert.assertTrue( ((ended - started) >= 60000 ) & ((ended - started) < 61000));

    public void checkSingleThreadRateLimit(){

        // 100 request per second
        RequestRateLimiter limiter = RequestRateLimiter.create(100);

        long started = System.currentTimeMillis();
        for ( int i = 0; i < 1000; i++ ){

            try {
            } catch (InterruptedException e) {

        long ended = System.currentTimeMillis();

        System.out.println( "Current rate:" + limiter.getCurRate() );
        Assert.assertTrue( (ended - started) >= ( 10000 - 100 ));

    public void checkMultiThreadedRateLimit(){

        // 100 request per second
        RequestRateLimiter limiter = RequestRateLimiter.create(100);
        long started = System.currentTimeMillis();

        List<Future<?>> tasks = new ArrayList<>(10);
        ExecutorService exec = Executors.newFixedThreadPool(10);

        for ( int i = 0; i < 10; i++ ) {

            tasks.add( exec.submit(() -> {
                for (int i1 = 0; i1 < 100; i1++) {

                    try {
                    } catch (InterruptedException e) {
            }) );
        } future -> {
            try {
            } catch (InterruptedException e) {
            } catch (ExecutionException e) {

        long ended = System.currentTimeMillis();
        System.out.println( "Current rate:" + limiter.getCurRate() );
        Assert.assertTrue( (ended - started) >= ( 10000 - 100 ) );

    public void checkMultiThreaded32RateLimit(){

        // 0,2 request per second
        RequestRateLimiter limiter = RequestRateLimiter.create(0.2f);
        long started = System.currentTimeMillis();

        List<Future<?>> tasks = new ArrayList<>(8);
        ExecutorService exec = Executors.newFixedThreadPool(8);

        for ( int i = 0; i < 8; i++ ) {

            tasks.add( exec.submit(() -> {
                for (int i1 = 0; i1 < 2; i1++) {

                    try {
                    } catch (InterruptedException e) {
            }) );
        } future -> {
            try {
            } catch (InterruptedException e) {
            } catch (ExecutionException e) {

        long ended = System.currentTimeMillis();
        System.out.println( "Current rate:" + limiter.getCurRate() );
        Assert.assertTrue( (ended - started) >= ( 10000 - 100 ) );

    public void checkMultiThreadedRateLimitDynamicRate(){

        // 100 request per second
        RequestRateLimiter limiter = RequestRateLimiter.create(100);
        long started = System.currentTimeMillis();

        List<Future<?>> tasks = new ArrayList<>(10);
        ExecutorService exec = Executors.newFixedThreadPool(10);

        for ( int i = 0; i < 10; i++ ) {

            tasks.add( exec.submit(() -> {

                Random r = new Random();
                for (int i1 = 0; i1 < 100; i1++) {

                    try {
                    } catch (InterruptedException e) {
            }) );
        } future -> {
            try {
            } catch (InterruptedException e) {
            } catch (ExecutionException e) {

        long ended = System.currentTimeMillis();
        System.out.println( "Current rate:" + limiter.getCurRate() );
        Assert.assertTrue( (ended - started) >= ( 10000 - 100 ) );

