Question

La situation est la suivante: j'ai une série de gros fichiers PDF gras, plein d'images et de textes distribués au hasard - ce sont les sections d'une énorme liste de prix promotionnel pour une vaste gamme de produits. Ce que je besoin est de motif correspondre à tous les codes de catalogue dans le texte de chaque fichier PDF et de l'envelopper avec un lien hypertexte qui pointera vers la page correspondante dans une boutique en ligne.

La tâche est très simple -. Numériser un fichier PDF pour tous les chiffres 10-séquences texte brut, et convertir ceux en liens dont href est http://something?code=[match]

Je préférerais aussi mettre cela ensemble dans un script PHP si possible, mais toute langue ferait. J'ai le sentiment de l'intestin qui peut-être même flash pourrait être une option.

Toutes les idées? Merci à l'avance.

EDIT:

Quelques réponses à venir en me enseignent PCRE syntaxe. Le problème ici est que je dois rechercher et remplacer dans un fichier PDF. Le problème est double. Disons que nous allons faire cela en PHP:

  • Comment lire / écrire à un fichier PDF en PHP?
  • Les fichiers PDF ne sont pas des fichiers texte en clair, je ne peux pas simplement regex contre eux, et je crois aussi que les liens PDF ne sont pas regroupés, avec le texte, mais viennent séparés en tant que régions. Ce qui a également des moyens que je pourrais peut-être superposer un rectangle actif sur les coordonnées du personnages de code catalogue, si je savais où réside un code appariés sur une page.

Que pensez-vous? D'autres langues sont également une option.

Merci.

Était-ce utile?

La solution

Le remplacement du texte dans un fichier PDF est difficile et aucune des solutions PDF open source appuyer cette capacité.

Apago (www.apago.com) a une solution commerciale développée pour remplacer le texte dans les fichiers PDF. Il est utilisé par le fabricant de cartes de voeux pour modifier les prix, le texte « MADE IN », les numéros de produits, etc.

Autres conseils

<?
$s="
http://something.com?code=3000 asdf text
http://something.com?code=5000 asdf
";
echo preg_replace('/(http:\/\/something\.com\?code=(\d+))/s', '<a href="$1">$2</a>',$s);
?>
sortie

3000 texte asdf

5000 asdf

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top