Usare PHP per prendere la prima riga di un file CSV e creare una tabella MySQL con i dati
Domanda
Sto cercando di prendere un file CSV piuttosto grande e inserirlo in un database MySQL per fare riferimento in un progetto. Vorrei utilizzare la prima riga del file per creare la tabella utilizzando i tipi di dati corretti e non varchar per ogni colonna. L'obiettivo finale è quello di automatizzare questo processo poiché ho diversi file simili ma ognuno ha dati diversi e una diversa quantità di "colonne" nei file CSV. Il problema che sto riscontrando è gettype () sta restituendo 'string' per ogni colonna invece di int, float e string come vorrei.
La piattaforma è PHP 5, il sistema operativo è ubuntu 8.04
ecco il mio codice finora:
<?php
// GENERATE TABLE FROM FIRST LINE OF CSV FILE
$inputFile = 'file.csv';
$tableName = 'file_csv';
$fh = fopen($inputFile, 'r');
$contents = fread($fh, 5120); // 5KB
fclose($fh);
$fileLines = explode("\n", $contents); // explode to make sure we are only using the first line.
$fieldList = explode(',', $fileLines[0]); // separate columns, put into array
echo 'CREATE TABLE IF NOT EXISTS `'.$tableName.'` ('."<br/>\n";
for($i = 0; $i <= count($fieldList); $i++)
{
switch(gettype($fieldList[$i])) {
case 'integer':
$typeInfo = 'int(11)';
break;
case 'float':
$typeInfo = 'float';
break;
case 'string':
$typeInfo = 'varchar(80)';
break;
default:
$typeInfo = 'varchar(80)';
break;
}
if(gettype($fieldList[$i]) != NULL) echo "\t".'`'.$i.'` '.$typeInfo.' NOT NULL, --'.gettype($fieldList[$i]).' '.$fieldList[$i]."<br/>\n";
}
echo ' PRIMARY KEY (`0`)'."<br/>\n";
echo ') ENGINE=MyISAM DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci AUTO_INCREMENT=1 ;';
Esempio prima riga: 1,0,0,0,0,0,0,0,0,0,0,0,0,000000,0,000000,0,0,0,, 0,0,1,0,50, "Parola di richiamo ( OLD)',
Soluzione
Basandosi su Codice Nouveau potresti farlo
for($i = 0; $i <= count($fieldList); $i++)
{
if (is_numeric($fieldList[$i]))
{
if (strpos($fieldList[$i],'.') !== false){
$fieldList[$i] = (int)$fieldList[$i];
}else{
$fieldList[$i] = (float)$fieldList[$i];
}
}
switch(gettype($fieldList[$i])) {
case 'integer':
$typeInfo = 'int(11)';
break;
case 'float':
case 'double':
$typeInfo = 'float';
break;
case 'string':
$typeInfo = 'varchar(80)';
break;
default:
$typeInfo = 'varchar(80)';
break;
}
if(gettype($fieldList[$i]) != NULL) echo "\t".'`'.$i.'` '.$typeInfo.' NOT NULL, --'.gettype($fieldList[$i]).' '.$fieldList[$i]."<br/>\n";
}
Funziona, nota l'aggiunta di " case 'double': " nello switch, ma potrebbe esserci un modo migliore per eseguire il controllo int / float poiché funzionerebbero solo con numeri uk / us standard.
Altri suggerimenti
Prova a lanciare il valore e confrontandolo con quello originale:
define('DECIMAL_SEPARATOR', '.');
switch ($fieldList[$i])
{
case (string)(int)$fieldList[$i]:
$typeInfo = (strpos($fieldList[$i], DECIMAL_SEPARATOR) === false) ? 'int(11)' : 'float';
break;
case (string)(float)$fieldList[$i]:
$typeInfo = 'float';
break;
default:
$typeInfo = 'varchar(80)';
break;
}
Inoltre, controlla la presenza del separatore decimale nel primo caso per i numeri che sono rotondi, ma hanno la parte della frazione decimale.
<?php
// GENERATE TABLE FROM FIRST LINE OF CSV FILE
$inputFile = 'file.csv';
$tableName = 'file_csv';
$fh = fopen($inputFile, 'r');
$contents = fread($fh, 5120); // 5KB
fclose($fh);
$fileLines = explode("\n", $contents);
$fieldList = explode(',', $fileLines[0]);
echo 'CREATE TABLE IF NOT EXISTS `'.$tableName.'` ('."<br/>\n";
for($i = 0; $i <= count($fieldList); $i++)
{
if(strlen($fieldList[$i]) == 0) $typeInfo = 'varchar(80)';
if(preg_match('/[0-9]/', $fieldList[$i])) $typeInfo = 'int(11)';
if(preg_match('/[\.]/', $fieldList[$i])) $typeInfo = 'float';
if(preg_match('/[a-z\\\']/i', $fieldList[$i])) $typeInfo = 'varchar(80)';
echo "\t".'`'.$i.'` '.$typeInfo.' NOT NULL, -- '.gettype($fieldList[$i]).' '.$fieldList[$i]."<br/>\n";
}
echo ' PRIMARY KEY (`0`)'."<br/>\n";
echo ') ENGINE=MyISAM DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci AUTO_INCREMENT=1 ;';
L'uso delle espressioni regolari ti darà una soluzione flessibile. Se devi rilevare i campi della data, questa è la strada da percorrere.