Pergunta
Alguém pode recomendar uma API simples que vai me permitir a utilização ler um arquivo CSV de entrada, fazer algumas transformações simples, e, em seguida, escrevê-lo.
Um Google rápido encontrou http://flatpack.sourceforge.net/ que parece promissor.
Eu só queria ver o que os outros estão usando antes de eu casal me a esta API.
Solução
Apache Commons CSV
Confira Apache CSV Comum .
Esta biblioteca lê e escreve diversas variações de CSV , incluindo o padrão uma RFC 4180 . Também lê / escreve Tab-delimitado arquivos.
- Excel
- InformixUnload
- InformixUnloadCsv
- MySQL
- A Oracle
- PostgreSQLCsv
- PostgreSQLText
- RFC4180
- TDF
Outras dicas
Eu usei OpenCSV no passado.
import au.com.bytecode.opencsv.CSVReader;
String fileName = "data.csv"; CSVReader reader = new CSVReader(new FileReader(fileName ));// if the first line is the header String[] header = reader.readNext();
// iterate over reader.readNext until it returns null String[] line = reader.readNext();
Houve algumas outras opções nas respostas a outra pergunta .
Update: O código nesta resposta é para Super CSV 1,52. exemplos de código atualizados para Super CSV 2.4.0 pode ser encontrada no site do projeto: http://super-csv.github.io/super-csv/index. html
O projeto SuperCSV apoia directamente a análise e manipulação estruturada de células CSV. De http://super-csv.github.io/super-csv/examples_reading .html você encontrará por exemplo,
dada uma classe
public class UserBean {
String username, password, street, town;
int zip;
public String getPassword() { return password; }
public String getStreet() { return street; }
public String getTown() { return town; }
public String getUsername() { return username; }
public int getZip() { return zip; }
public void setPassword(String password) { this.password = password; }
public void setStreet(String street) { this.street = street; }
public void setTown(String town) { this.town = town; }
public void setUsername(String username) { this.username = username; }
public void setZip(int zip) { this.zip = zip; }
}
e que você tem um arquivo CSV com uma cabeçada. Vamos supor o seguinte conteúdo
username, password, date, zip, town
Klaus, qwexyKiks, 17/1/2007, 1111, New York
Oufu, bobilop, 10/10/2007, 4555, New York
Você pode criar uma instância da UserBean e preenchê-lo com valores a partir da segunda linha do arquivo com o seguinte código
class ReadingObjects {
public static void main(String[] args) throws Exception{
ICsvBeanReader inFile = new CsvBeanReader(new FileReader("foo.csv"), CsvPreference.EXCEL_PREFERENCE);
try {
final String[] header = inFile.getCSVHeader(true);
UserBean user;
while( (user = inFile.read(UserBean.class, header, processors)) != null) {
System.out.println(user.getZip());
}
} finally {
inFile.close();
}
}
}
usando o seguinte "Especificação manipulação"
final CellProcessor[] processors = new CellProcessor[] {
new Unique(new StrMinMax(5, 20)),
new StrMinMax(8, 35),
new ParseDate("dd/MM/yyyy"),
new Optional(new ParseInt()),
null
};
Reading CSV descrição do formato faz-me sentir que o uso de biblioteca parte 3 seria menos dor de cabeça do que escrevê-lo eu mesmo:
listas Wikipédia 10 ou algo conhecido bibliotecas:
Eu comparei libs listados usando algum tipo de lista de verificação. OpenCSV saiu um vencedor para mim (YMMV) com os seguintes resultados:
+ maven
+ maven - release version // had some cryptic issues at _Hudson_ with snapshot references => prefer to be on a safe side
+ code examples
+ open source // as in "can hack myself if needed"
+ understandable javadoc // as opposed to eg javadocs of _genjava gj-csv_
+ compact API // YAGNI (note *flatpack* seems to have much richer API than OpenCSV)
- reference to specification used // I really like it when people can explain what they're doing
- reference to _RFC 4180_ support // would qualify as simplest form of specification to me
- releases changelog // absence is quite a pity, given how simple it'd be to get with maven-changes-plugin // _flatpack_, for comparison, has quite helpful changelog
+ bug tracking
+ active // as in "can submit a bug and expect a fixed release soon"
+ positive feedback // Recommended By 51 users at sourceforge (as of now)
JavaCSV , ele funciona muito bem
Para o último aplicativo corporativo eu trabalhei em que precisava lidar com uma quantidade notável de CSV - um par de meses atrás - eu usei SuperCSV no SourceForge e achei simples, robusto e livre de problemas.
Você pode usar CSVReader api & download da seguinte localização:
ou
http://sourceforge.net/projects/javacsv/
Use o seguinte código:
/ ************ For Reading ***************/
import java.io.FileNotFoundException;
import java.io.IOException;
import com.csvreader.CsvReader;
public class CsvReaderExample {
public static void main(String[] args) {
try {
CsvReader products = new CsvReader("products.csv");
products.readHeaders();
while (products.readRecord())
{
String productID = products.get("ProductID");
String productName = products.get("ProductName");
String supplierID = products.get("SupplierID");
String categoryID = products.get("CategoryID");
String quantityPerUnit = products.get("QuantityPerUnit");
String unitPrice = products.get("UnitPrice");
String unitsInStock = products.get("UnitsInStock");
String unitsOnOrder = products.get("UnitsOnOrder");
String reorderLevel = products.get("ReorderLevel");
String discontinued = products.get("Discontinued");
// perform program logic here
System.out.println(productID + ":" + productName);
}
products.close();
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
}
Write / Anexar ao arquivo CSV
Código:
/************* For Writing ***************************/
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import com.csvreader.CsvWriter;
public class CsvWriterAppendExample {
public static void main(String[] args) {
String outputFile = "users.csv";
// before we open the file check to see if it already exists
boolean alreadyExists = new File(outputFile).exists();
try {
// use FileWriter constructor that specifies open for appending
CsvWriter csvOutput = new CsvWriter(new FileWriter(outputFile, true), ',');
// if the file didn't already exist then we need to write out the header line
if (!alreadyExists)
{
csvOutput.write("id");
csvOutput.write("name");
csvOutput.endRecord();
}
// else assume that the file already has the correct header line
// write out a few records
csvOutput.write("1");
csvOutput.write("Bruce");
csvOutput.endRecord();
csvOutput.write("2");
csvOutput.write("John");
csvOutput.endRecord();
csvOutput.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
Há também CSV / Utility Excel . Ele assume todos os dados thos é a mesa-like e fornece dados de Iterators.
O formato CSV parece fácil o suficiente para StringTokenizer mas pode tornar-se mais complicado. Aqui na Alemanha um ponto e vírgula é utilizado como delimitador e células contendo delimitadores precisam ser escapado. Você não está indo para lidar com isso facilmente com StringTokenizer.
Gostaria de ir para http://sourceforge.net/projects/javacsv
Se você pretende ler CSV do Excel, em seguida, existem alguns casos de canto interessantes. Eu não consigo lembrar de todos eles, mas o CSV apache commons não era capaz de lidar com isso corretamente (com, por exemplo, urls).
Certifique-se de teste de excel saída com aspas e vírgulas e barras em todo o lugar.