Pergunta

Alguém pode recomendar uma API simples que vai me permitir a utilização ler um arquivo CSV de entrada, fazer algumas transformações simples, e, em seguida, escrevê-lo.

Um Google rápido encontrou http://flatpack.sourceforge.net/ que parece promissor.

Eu só queria ver o que os outros estão usando antes de eu casal me a esta API.

Foi útil?

Solução

Apache Commons CSV

Confira Apache CSV Comum .

Esta biblioteca lê e escreve diversas variações de CSV , incluindo o padrão uma RFC 4180 . Também lê / escreve Tab-delimitado arquivos.

  • Excel
  • InformixUnload
  • InformixUnloadCsv
  • MySQL
  • A Oracle
  • PostgreSQLCsv
  • PostgreSQLText
  • RFC4180
  • TDF

Outras dicas

Eu usei OpenCSV no passado.

import au.com.bytecode.opencsv.CSVReader;

String fileName = "data.csv";
CSVReader reader = new CSVReader(new FileReader(fileName ));

// if the first line is the header String[] header = reader.readNext();
// iterate over reader.readNext until it returns null String[] line = reader.readNext();

Houve algumas outras opções nas respostas a outra pergunta .

Update: O código nesta resposta é para Super CSV 1,52. exemplos de código atualizados para Super CSV 2.4.0 pode ser encontrada no site do projeto: http://super-csv.github.io/super-csv/index. html


O projeto SuperCSV apoia directamente a análise e manipulação estruturada de células CSV. De http://super-csv.github.io/super-csv/examples_reading .html você encontrará por exemplo,

dada uma classe

public class UserBean {
    String username, password, street, town;
    int zip;

    public String getPassword() { return password; }
    public String getStreet() { return street; }
    public String getTown() { return town; }
    public String getUsername() { return username; }
    public int getZip() { return zip; }
    public void setPassword(String password) { this.password = password; }
    public void setStreet(String street) { this.street = street; }
    public void setTown(String town) { this.town = town; }
    public void setUsername(String username) { this.username = username; }
    public void setZip(int zip) { this.zip = zip; }
}

e que você tem um arquivo CSV com uma cabeçada. Vamos supor o seguinte conteúdo

username, password,   date,        zip,  town
Klaus,    qwexyKiks,  17/1/2007,   1111, New York
Oufu,     bobilop,    10/10/2007,  4555, New York

Você pode criar uma instância da UserBean e preenchê-lo com valores a partir da segunda linha do arquivo com o seguinte código

class ReadingObjects {
  public static void main(String[] args) throws Exception{
    ICsvBeanReader inFile = new CsvBeanReader(new FileReader("foo.csv"), CsvPreference.EXCEL_PREFERENCE);
    try {
      final String[] header = inFile.getCSVHeader(true);
      UserBean user;
      while( (user = inFile.read(UserBean.class, header, processors)) != null) {
        System.out.println(user.getZip());
      }
    } finally {
      inFile.close();
    }
  }
}

usando o seguinte "Especificação manipulação"

final CellProcessor[] processors = new CellProcessor[] {
    new Unique(new StrMinMax(5, 20)),
    new StrMinMax(8, 35),
    new ParseDate("dd/MM/yyyy"),
    new Optional(new ParseInt()),
    null
};

Reading CSV descrição do formato faz-me sentir que o uso de biblioteca parte 3 seria menos dor de cabeça do que escrevê-lo eu mesmo:

listas Wikipédia 10 ou algo conhecido bibliotecas:

Eu comparei libs listados usando algum tipo de lista de verificação. OpenCSV saiu um vencedor para mim (YMMV) com os seguintes resultados:

+ maven

+ maven - release version   // had some cryptic issues at _Hudson_ with snapshot references => prefer to be on a safe side

+ code examples

+ open source   // as in "can hack myself if needed"

+ understandable javadoc   // as opposed to eg javadocs of _genjava gj-csv_

+ compact API   // YAGNI (note *flatpack* seems to have much richer API than OpenCSV)

- reference to specification used   // I really like it when people can explain what they're doing

- reference to _RFC 4180_ support   // would qualify as simplest form of specification to me

- releases changelog   // absence is quite a pity, given how simple it'd be to get with maven-changes-plugin   // _flatpack_, for comparison, has quite helpful changelog

+ bug tracking

+ active   // as in "can submit a bug and expect a fixed release soon"

+ positive feedback   // Recommended By 51 users at sourceforge (as of now)

JavaCSV , ele funciona muito bem

Para o último aplicativo corporativo eu trabalhei em que precisava lidar com uma quantidade notável de CSV - um par de meses atrás - eu usei SuperCSV no SourceForge e achei simples, robusto e livre de problemas.

Você pode usar CSVReader api & download da seguinte localização:

http://sourceforge.net/ projectos / javacsv / files / JavaCsv / JavaCsv% 202,1 / javacsv2.1.zip / download

ou

http://sourceforge.net/projects/javacsv/

Use o seguinte código:

/ ************ For Reading ***************/

import java.io.FileNotFoundException;
import java.io.IOException;

import com.csvreader.CsvReader;

public class CsvReaderExample {

    public static void main(String[] args) {
        try {

            CsvReader products = new CsvReader("products.csv");

            products.readHeaders();

            while (products.readRecord())
            {
                String productID = products.get("ProductID");
                String productName = products.get("ProductName");
                String supplierID = products.get("SupplierID");
                String categoryID = products.get("CategoryID");
                String quantityPerUnit = products.get("QuantityPerUnit");
                String unitPrice = products.get("UnitPrice");
                String unitsInStock = products.get("UnitsInStock");
                String unitsOnOrder = products.get("UnitsOnOrder");
                String reorderLevel = products.get("ReorderLevel");
                String discontinued = products.get("Discontinued");

                // perform program logic here
                System.out.println(productID + ":" + productName);
            }

            products.close();

        } catch (FileNotFoundException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }

    }

}

Write / Anexar ao arquivo CSV

Código:

/************* For Writing ***************************/

import java.io.File;
import java.io.FileWriter;
import java.io.IOException;

import com.csvreader.CsvWriter;

public class CsvWriterAppendExample {

    public static void main(String[] args) {

        String outputFile = "users.csv";

        // before we open the file check to see if it already exists
        boolean alreadyExists = new File(outputFile).exists();

        try {
            // use FileWriter constructor that specifies open for appending
            CsvWriter csvOutput = new CsvWriter(new FileWriter(outputFile, true), ',');

            // if the file didn't already exist then we need to write out the header line
            if (!alreadyExists)
            {
                csvOutput.write("id");
                csvOutput.write("name");
                csvOutput.endRecord();
            }
            // else assume that the file already has the correct header line

            // write out a few records
            csvOutput.write("1");
            csvOutput.write("Bruce");
            csvOutput.endRecord();

            csvOutput.write("2");
            csvOutput.write("John");
            csvOutput.endRecord();

            csvOutput.close();
        } catch (IOException e) {
            e.printStackTrace();
        }

    }
}

Há também CSV / Utility Excel . Ele assume todos os dados thos é a mesa-like e fornece dados de Iterators.

O formato CSV parece fácil o suficiente para StringTokenizer mas pode tornar-se mais complicado. Aqui na Alemanha um ponto e vírgula é utilizado como delimitador e células contendo delimitadores precisam ser escapado. Você não está indo para lidar com isso facilmente com StringTokenizer.

Gostaria de ir para http://sourceforge.net/projects/javacsv

Se você pretende ler CSV do Excel, em seguida, existem alguns casos de canto interessantes. Eu não consigo lembrar de todos eles, mas o CSV apache commons não era capaz de lidar com isso corretamente (com, por exemplo, urls).

Certifique-se de teste de excel saída com aspas e vírgulas e barras em todo o lugar.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top