
00:00:00,074 --> 00:00:02,564
Previously on Breaking Bad...

00:00:02,663 --> 00:00:04,393

Ho bisogno di analizzare i file SRT con PHP e stampare tutti i sottotitoli nel file con variabili.

Non sono riuscito a trovare il registro giusto.Quando fai questo ho bisogno di prendere l'ID, il tempo e le variabili dei sottotitoli.E quando si stampa non c'è array () s o ecc. Deve stampare lo stesso come nel file orginale.

voglio dire che devo stampare come;

$number <br> (e.g. 1)
$time <br> (e.g. 00:00:00,074 --> 00:00:02,564)
$subtitle <br> (e.g. Previously on Breaking Bad...)

Dal modo in cui ho questo codice.Ma non vede le linee.Deve essere modificato ma come?

$srt_file = file('',FILE_IGNORE_NEW_LINES);
$regex = "/^(\d)+ ([\d]+:[\d]+:[\d]+,[\d]+) --> ([\d]+:[\d]+:[\d]+,[\d]+) (\w.+)/";

foreach($srt_file as $srt){


    echo '<br />';


È stato utile?


Ecco una macchina da stato breve e semplice per analizzare la linea del file SRT per riga:

define('SRT_STATE_TIME',      1);
define('SRT_STATE_TEXT',      2);
define('SRT_STATE_BLANK',     3);

$lines   = file('');

$subs    = array();
$subNum  = 0;
$subText = '';
$subTime = '';

foreach($lines as $line) {
    switch($state) {
            $subNum = trim($line);
            $state  = SRT_STATE_TIME;

        case SRT_STATE_TIME:
            $subTime = trim($line);
            $state   = SRT_STATE_TEXT;

        case SRT_STATE_TEXT:
            if (trim($line) == '') {
                $sub = new stdClass;
                $sub->number = $subNum;
                list($sub->startTime, $sub->stopTime) = explode(' --> ', $subTime);
                $sub->text   = $subText;
                $subText     = '';
                $state       = SRT_STATE_SUBNUMBER;

                $subs[]      = $sub;
            } else {
                $subText .= $line;

if ($state == SRT_STATE_TEXT) {
    // if file was missing the trailing newlines, we'll be in this
    // state here.  Append the last read text and add the last sub.
    $sub->text = $subText;
    $subs[] = $sub;



    [0] => stdClass Object
            [number] => 1
            [stopTime] => 00:00:24,400
            [startTime] => 00:00:20,000
            [text] => Altocumulus clouds occur between six thousand

    [1] => stdClass Object
            [number] => 2
            [stopTime] => 00:00:27,800
            [startTime] => 00:00:24,600
            [text] => and twenty thousand feet above ground level.


È quindi possibile loop sulla matrice di sottotitoli o accedervi tramite offset array:

echo $subs[0]->number . ' says ' . $subs[0]->text . "\n";

Per mostrare tutti i sub looping su ciascuno e visualizzandolo:

foreach($subs as $sub) {
    echo $sub->number . ' begins at ' . $sub->startTime .
         ' and ends at ' . $sub->stopTime . '.  The text is: <br /><pre>' .
         $sub->text . "</pre><br />\n";

Ulteriori lettura: Formato del file di testo SUBRIP

Altri suggerimenti

che non corrisponderà perché il tuo array $ srt_file potrebbe assomigliare a questo:

([0] => '1',
[1] => '00:00:00,074 --> 00:00:02,564',
[2] => 'Previously on Breaking Bad...'.
[3] => '',
[4] => '2',

Il tuo regex non corrisponderà a nessuno di quegli elementi.

Se il tuo intento è quello di leggere l'intero file in una lunga memory-hog-of-a-string, quindi utilizzare file_get_contents per ottenere il contenuto del file in una stringa.Quindi utilizzare un preg_match_all per ottenere tutte le partite di regex.

Altrimenti potresti provare a loop attraverso l'array e provare ad abbinare vari modelli di regex per determinare se la linea è un ID, un intervallo di tempo o un testo e fare in modo appropriato.Ovviamente potresti anche desiderare qualche logica per assicurarti di ottenere valori nel giusto ordine (ID, quindi intervallo di tempo, quindi testo).

Gruppo dell'array file() in blocchi di 4 utilizzando array_chunk() , quindi omettere l'ultima voce, dal momento che è una linea vuotaIn questo modo:

foreach( array_chunk( file( ''), 4) as $entry) {
    list( $number, $time, $subtitle) = $entry;
    echo $number . '<br />';
    echo $time . '<br />';
    echo $subtitle . '<br />';

Ho fatto una classe per convertire un file .srt per array. Ogni ingresso dell'array ha le seguenti proprietà:

  • ID: un numero che rappresenta l'ID del sottotitolo (2)
  • Inizio: galleggiante, ora di inizio in secondi (24.443)
  • fine: galleggiante, il tempo di fine in secondi (27.647)
  • StartString: l'ora di inizio in formato leggibile umano (00: 00: 24.443)
  • Endstring: The End Time In Formato Leggibile Umano (00: 00: 24.647)
  • Durata: la durata del sottotitolo, in MS (3204)
  • Testo: il testo del sottotitolo ( i pavoni governati sulla città di Gongmen. )

    Il codice è PHP7:

    namespace VideoSubtitles\Srt;
    class SrtToArrayTool
        public static function getArrayByFile(string $file): array
            $ret = [];
            $gen = function ($filename) {
                $file = fopen($filename, 'r');
                while (($line = fgets($file)) !== false) {
                    yield rtrim($line);
            $c = 0;
            $item = [];
            $text = '';
            $n = 0;
            foreach ($gen($file) as $line) {
                if ('' !== $line) {
                    if (0 === $n) {
                        $item['id'] = $line;
                    elseif (1 === $n) {
                        $p = explode('-->', $line);
                        $start = str_replace(',', '.', trim($p[0]));
                        $end = str_replace(',', '.', trim($p[1]));
                        $startTime = self::toMilliSeconds(str_replace('.', ':', $start));
                        $endTime = self::toMilliSeconds(str_replace('.', ':', $end));
                        $item['start'] = $startTime / 1000;
                        $item['end'] = $endTime / 1000;
                        $item['startString'] = $start;
                        $item['endString'] = $end;
                        $item['duration'] = $endTime - $startTime;
                    else {
                        if ($n >= 2) {
                            if ('' !== $text) {
                                $text .= PHP_EOL;
                            $text .= $line;
                else {
                    if (0 !== $n) {
                        $item['text'] = $text;
                        $ret[] = $item;
                        $text = '';
                        $n = 0;
            return $ret;
        private static function toMilliSeconds(string $duration): int
            $p = explode(':', $duration);
            return (int)$p[0] * 3600000 + (int)$p[1] * 60000 + (int)$p[2] * 1000 + (int)$p[3];

    o Dai un'occhiata qui:

È possibile utilizzare questo progetto:


Codice campione:

require_once __DIR__.'/../vendor/autoload.php';

use Captioning\Format\SubripFile;

try {
    $file = new SubripFile('');

    foreach ($file->getCues() as $line) {
        echo 'start: ' . $line->getStart() . "<br />\n";
        echo 'stop: ' . $line->getStop() . "<br />\n";
        echo 'startMS: ' . $line->getStartMS() . "<br />\n";
        echo 'stopMS: ' . $line->getStopMS() . "<br />\n";
        echo 'text: ' . $line->getText() . "<br />\n";
        echo "=====================<br />\n";

} catch(Exception $e) {
    echo "Error: ".$e->getMessage()."\n";

Uscita campione:

> php index.php
start: 00:01:48,387<br />
stop: 00:01:53,269<br />
startMS: 108387<br />
stopMS: 113269<br />
text: ┘ç┘à╪د┘ç┘┌»█î ╪▓█î╪▒┘┘ê█î╪│ ╪ذ╪د ┌ر█î┘█î╪ز ╪ذ┘┘ê╪▒█î ┘ê ┌ر╪»┌ر x265
=====================<br />
start: 00:02:09,360<br />
stop: 00:02:12,021<br />
startMS: 129360<br />
stopMS: 132021<br />
text: .┘à╪د ┘╪ذ╪د┘è╪» ╪ز┘┘ç╪د┘è┘è ╪د┘è┘╪ش╪د ╪ذ╪د╪┤┘è┘à -
┌╪▒╪د ╪ا<br />
=====================<br />
start: 00:02:12,022<br />
stop: 00:02:14,725<br />
startMS: 132022<br />
stopMS: 134725<br />
text: ..╪د┌»┘ç ┘╛╪»╪▒╪ز -
.╪د┘ê┘ ┘ç┘è┌┘ê┘é╪ز ┘à╪ز┘ê╪ش┘ç ╪▒┘╪ز┘┘à┘ê┘ ┘┘à┘è╪┤┘ç -<br />
=====================<br />

Può essere fatto usando la rottura della linea PHP. Potrei farlo con successo Lasciami mostrare il mio codice


Qui $ Movie-> SRT è il sottotitolo di avere formato u pubblicato in questa domanda. Come vediamo, ogni spazio è una nuova linea, Spero che tu abbia una risposta.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top