Чтение файлов ODT в PHP

https://stackoverflow.com/questions/4069852

28-09-2019
|

Вопрос

Как бы вы пошли о чтении файлов ODT в PHP? Я знаю, что вы можете использовать QueryPath, но это кажется немного избитым, ... я просто хочу прочитать файл.

Решение

ODT, файлы - ZIP сжатый XML.

Если все, что вам нужно сделать, это прочитать файл RAW. Просто расстегните его и прочитайте его как обычный файл.

Если вам нужно анализировать использование использования текста, то вводит необходимость в QueryPath или другого другого анализатора XSLT.

Другие советы

Опечатки умеет читать и изменять файлы OpenDocument в PHP.

Поскольку файлы OpenDocument являются файлами XML, хранящиеся в ZIP-архива, вы также можете использовать Tbszip. Класс, чтобы просто прочитать ZIP-архив под PHP без какой-либо другой библиотеки зависимости.

http://pear.php.net/package/opendocument. может быть то, что вам нужно. Хотя не использовал это сам.

/*Name of the document file*/
$document = 'Template.odt';

/**Function to extract text*/
function extracttext($filename) {

    $dataFile = "content.xml";     

    //Create a new ZIP archive object
    $zip = new ZipArchive;

    // Open the archive file
    if (true === $zip->open($filename)) {
        // If successful, search for the data file in the archive
        if (($index = $zip->locateName($dataFile)) !== false) {
            // Index found! Now read it to a string
            $text = $zip->getFromIndex($index);
            // Load XML from a string
            // Ignore errors and warnings
            $xml = new DOMDocument;
            $xml->loadXML($text, LIBXML_NOENT | LIBXML_XINCLUDE | LIBXML_NOERROR | LIBXML_NOWARNING);
            // Return XML
            return $xml->saveXML();
        }
        //Close the archive file
        $zip->close();
    }   
    // In case of failure return a message
    return "File no`enter code here`t found";
}

echo extracttext($document);

Лицензировано под: CC-BY-SA с атрибуция

Не связан с StackOverflow