indexOf Case Sensitive?

https://stackoverflow.com/questions/1126227

13-09-2019
|

Pergunta

É o indexOf (String) método maiúsculas de minúsculas? Se assim for, há uma versão insensível caso de ele?

Solução

Os métodos indexOf() são todas maiúsculas de minúsculas. Você pode torná-los (aproximadamente, de uma forma quebrada, mas trabalhando para a abundância de casos) case-insensitive, convertendo suas cordas para maiúsculas / minúsculas de antemão:

s1 = s1.toLowerCase(Locale.US);
s2 = s2.toLowerCase(Locale.US);
s1.indexOf(s2);

Outras dicas

É o indexOf (String) caso método sensível?

Sim, é sensível a maiúsculas:

@Test
public void indexOfIsCaseSensitive() {
    assertTrue("Hello World!".indexOf("Hello") != -1);
    assertTrue("Hello World!".indexOf("hello") == -1);
}

Se assim for, há uma versão insensível caso de ele?

Não, não há. Você pode converter as duas seqüências para minúsculas antes de chamar indexOf:

@Test
public void caseInsensitiveIndexOf() {
    assertTrue("Hello World!".toLowerCase().indexOf("Hello".toLowerCase()) != -1);
    assertTrue("Hello World!".toLowerCase().indexOf("hello".toLowerCase()) != -1);
}

Há uma ignorar método do caso em StringUtils classe de biblioteca Apache Commons Lang

indexOfIgnoreCase (CharSequence str, CharSequence searchStr)

Sim, indexOf diferencia maiúsculas de minúsculas.

A melhor maneira de fazer insensibilidade caso eu encontrei é:

String original;
int idx = original.toLowerCase().indexOf(someStr.toLowerCase());

Isso vai fazer um indexOf() insensível caso.

Aqui está a minha solução que não alocar qualquer memória heap, portanto, deve ser significativamente mais rápido do que a maioria das outras implementações mencionados aqui.

public static int indexOfIgnoreCase(final String haystack,
                                    final String needle) {
    if (needle.isEmpty() || haystack.isEmpty()) {
        // Fallback to legacy behavior.
        return haystack.indexOf(needle);
    }

    for (int i = 0; i < haystack.length(); ++i) {
        // Early out, if possible.
        if (i + needle.length() > haystack.length()) {
            return -1;
        }

        // Attempt to match substring starting at position i of haystack.
        int j = 0;
        int ii = i;
        while (ii < haystack.length() && j < needle.length()) {
            char c = Character.toLowerCase(haystack.charAt(ii));
            char c2 = Character.toLowerCase(needle.charAt(j));
            if (c != c2) {
                break;
            }
            j++;
            ii++;
        }
        // Walked all the way to the end of the needle, return the start
        // position that this was found.
        if (j == needle.length()) {
            return i;
        }
    }

    return -1;
}

E aqui estão os testes de unidade que verificam o comportamento correto.

@Test
public void testIndexOfIgnoreCase() {
    assertThat(StringUtils.indexOfIgnoreCase("A", "A"), is(0));
    assertThat(StringUtils.indexOfIgnoreCase("a", "A"), is(0));
    assertThat(StringUtils.indexOfIgnoreCase("A", "a"), is(0));
    assertThat(StringUtils.indexOfIgnoreCase("a", "a"), is(0));

    assertThat(StringUtils.indexOfIgnoreCase("a", "ba"), is(-1));
    assertThat(StringUtils.indexOfIgnoreCase("ba", "a"), is(1));

    assertThat(StringUtils.indexOfIgnoreCase("Royal Blue", " Royal Blue"), is(-1));
    assertThat(StringUtils.indexOfIgnoreCase(" Royal Blue", "Royal Blue"), is(1));
    assertThat(StringUtils.indexOfIgnoreCase("Royal Blue", "royal"), is(0));
    assertThat(StringUtils.indexOfIgnoreCase("Royal Blue", "oyal"), is(1));
    assertThat(StringUtils.indexOfIgnoreCase("Royal Blue", "al"), is(3));
    assertThat(StringUtils.indexOfIgnoreCase("", "royal"), is(-1));
    assertThat(StringUtils.indexOfIgnoreCase("Royal Blue", ""), is(0));
    assertThat(StringUtils.indexOfIgnoreCase("Royal Blue", "BLUE"), is(6));
    assertThat(StringUtils.indexOfIgnoreCase("Royal Blue", "BIGLONGSTRING"), is(-1));
    assertThat(StringUtils.indexOfIgnoreCase("Royal Blue", "Royal Blue LONGSTRING"), is(-1));  
}

Sim, é case-sensitive. Você pode fazer uma indexOf case-insensitive, convertendo sua seqüência ea seqüência de parâmetro tanto para maiúsculas antes de pesquisar.

String str = "Hello world";
String search = "hello";
str.toUpperCase().indexOf(search.toUpperCase());

Note que toUpperCase pode não funcionar em algumas circunstâncias. Por exemplo esta:

String str = "Feldbergstraße 23, Mainz";
String find = "mainz";
int idxU = str.toUpperCase().indexOf (find.toUpperCase ());
int idxL = str.toLowerCase().indexOf (find.toLowerCase ());

idxU será de 20, o que é errado! idxL será 19, que está correcta. O que está causando o problema é tha toUpperCase () converte o caractere "ß" em dois caracteres, "SS" e isso gera o índice off.

Por isso, sempre ficar com toLowerCase ()

O que você está fazendo com o valor do índice, uma vez devolvidos?

Se você estiver usando-o para manipular a sua corda, então você pode não usar uma expressão regular em vez disso?

import static org.junit.Assert.assertEquals;    
import org.junit.Test;

public class StringIndexOfRegexpTest {

    @Test
    public void testNastyIndexOfBasedReplace() {
        final String source = "Hello World";
        final int index = source.toLowerCase().indexOf("hello".toLowerCase());
        final String target = "Hi".concat(source.substring(index
                + "hello".length(), source.length()));
        assertEquals("Hi World", target);
    }

    @Test
    public void testSimpleRegexpBasedReplace() {
        final String source = "Hello World";
        final String target = source.replaceFirst("(?i)hello", "Hi");
        assertEquals("Hi World", target);
    }
}

Eu apenas olhei para a fonte. Ele compara caracteres por isso é sensível a maiúsculas.

@Test
public void testIndexofCaseSensitive() {
    TestCase.assertEquals(-1, "abcDef".indexOf("d") );
}

Sim, eu estou bastante certo de que é. Um método de trabalho em torno de que o uso da biblioteca padrão seria:

int index = str.toUpperCase().indexOf("FOO");

Tive o mesmo problema. Tentei expressão regular e o apache StringUtils.indexOfIgnoreCase-Método, mas ambos foram muito lento ... Então eu escrevi um método de curto mim ...:

public static int indexOfIgnoreCase(final String chkstr, final String searchStr, int i) {
    if (chkstr != null && searchStr != null && i > -1) {
          int serchStrLength = searchStr.length();
          char[] searchCharLc = new char[serchStrLength];
          char[] searchCharUc = new char[serchStrLength];
          searchStr.toUpperCase().getChars(0, serchStrLength, searchCharUc, 0);
          searchStr.toLowerCase().getChars(0, serchStrLength, searchCharLc, 0);
          int j = 0;
          for (int checkStrLength = chkstr.length(); i < checkStrLength; i++) {
                char charAt = chkstr.charAt(i);
                if (charAt == searchCharLc[j] || charAt == searchCharUc[j]) {
                     if (++j == serchStrLength) {
                           return i - j + 1;
                     }
                } else { // faster than: else if (j != 0) {
                         i = i - j;
                         j = 0;
                    }
              }
        }
        return -1;
  }

De acordo com meus testes o seu muito mais rápido ... (pelo menos se o seu searchString é bastante curto). Se você tem alguma sugestão para melhoria ou erros que seria bom para me deixar saber ... (desde que eu usar esse código em um aplicativo; -)

A primeira pergunta já foi respondida muitas vezes. Sim, os métodos String.indexOf() são todas maiúsculas de minúsculas.

Se você precisa de um indexOf() sensíveis ao locale você poderia usar o Collator. Dependendo do valor da força de configurar você pode obter caso comparação insensível, e também letras acentuadas tratar como o mesmo que os não-acentuados, etc. Aqui está um exemplo de como fazer isso:

private int indexOf(String original, String search) {
    Collator collator = Collator.getInstance();
    collator.setStrength(Collator.PRIMARY);
    for (int i = 0; i <= original.length() - search.length(); i++) {
        if (collator.equals(search, original.substring(i, i + search.length()))) {
            return i;
        }
    }
    return -1;
}

Só para resumir, 3 soluções:

usando toLowerCase () ou toUpperCase
usando StringUtils de apache
usando regex

Agora, o que eu queria saber era qual deles é o mais rápido? Eu estou supondo que em média o primeiro.

Mas não é difícil escrever um:

public class CaseInsensitiveIndexOfTest extends TestCase {
    public void testOne() throws Exception {
        assertEquals(2, caseInsensitiveIndexOf("ABC", "xxabcdef"));
    }

    public static int caseInsensitiveIndexOf(String substring, String string) {
        return string.toLowerCase().indexOf(substring.toLowerCase());
    }
}

A conversão de ambas as cordas para minúsculo geralmente não é um grande negócio, mas seria lenta se algumas das cordas é longa. E se você fizer isso em um loop, então seria muito ruim. Por esta razão, eu recomendaria indexOfIgnoreCase.

 static string Search(string factMessage, string b)
        {

            int index = factMessage.IndexOf(b, StringComparison.CurrentCultureIgnoreCase);
            string line = null;
            int i = index;
            if (i == -1)
            { return "not matched"; }
            else
            {
                while (factMessage[i] != ' ')
                {
                    line = line + factMessage[i];
                    i++;
                }

                return line;
            }

        }

Aqui está uma versão muito parecida com a versão StringUtils do Apache:

public int indexOfIgnoreCase(String str, String searchStr) {
    return indexOfIgnoreCase(str, searchStr, 0);
}

public int indexOfIgnoreCase(String str, String searchStr, int fromIndex) {
    // https://stackoverflow.com/questions/14018478/string-contains-ignore-case/14018511
    if(str == null || searchStr == null) return -1;
    if (searchStr.length() == 0) return fromIndex;  // empty string found; use same behavior as Apache StringUtils
    final int endLimit = str.length() - searchStr.length() + 1;
    for (int i = fromIndex; i < endLimit; i++) {
        if (str.regionMatches(true, i, searchStr, 0, searchStr.length())) return i;
    }
    return -1;
}

indexOf é sensível a maiúsculas. Isso é porque ele usa o método equals para comparar os elementos da lista. A mesma coisa vale para contém e remove.

Licenciado em: CC-BY-SA com atribuição

Não afiliado a StackOverflow