Question

Je suis sur le point permaliens de configuration sur un site Web et je me demande quel genre de conventions à respecter en ce qui concerne les générer de la table existante des articles de presse.

Jusqu'à présent, voici les règles / étapes que je suis venu avec:

  1. Créer un fichier de vidage de ma base de données en direct, réglez localement
  2. Ajouter une nouvelle colonne 'permalien' à ma table news_articles avec ALTER table ADD column slug VARCHAR(100) (Je ne sais pas du type de données ou de la longueur, des suggestions?)
  3. Mettre à jour toutes les lignes de ma table de news_articles, de sorte que

la colonne permalien par défaut est remplacé par le titre, après le titre passe par une mise en forme:

  

Avertissement: les titres sont russes   Cyrillique et pas l'anglais donc je ne suis pas   pense que je peux sortir avec un facile   remplacement regex, à moins peut-être que je   compter sur le code unicode gammes sauf que je suis   ne connaissent pas bien la portée du   caractères cyrilliques donc je vais faire manuel   remplacement et les règles que je l'ai défini   à ce jour sont:

  • remplacer tous les espaces avec un trait de soulignement
  • dépouiller d'attaque / de fuite virgules et
  • supprimer toutes simples / doubles guillemets
  • supprimer tous les points d'interrogation
  • et devient le mot russe pour « et »

Je vous remercie des conseils sur ma stratégie actuelle avant de réellement exécuter, comme il y a des milliers d'articles.

Était-ce utile?

La solution

Quelques commentaires / suggestions

  • remplacer tous les espaces avec un trait de soulignement (que diriez-vous au lieu de hypen underscore, comme des étiquettes en SO)
  • dépouiller d'attaque / de fuite virgules et (leader / espaces de fuite trop)
  • supprimer toutes simples / doubles guillemets (départ et ceux de fuite, si pas remplacer par des traits d'union)
  • supprimer tous les points d'interrogation (comme ci-dessus et tous les autres caractères de ponctuation comme « » (gauche / droite des guillemets doubles) et des symboles tels que% et = etc etc)
  • devient le mot russe pour 'et' (Voulez-vous dire и? doit être lisible sans avoir besoin pour l'encodage URL)

Mise à jour: * convertir tous les caractères en minuscules (un peu subjectif, mais il est une pratique courante et plus facile à lire puis majuscules)

Une autre suggestion, c'est un truc que je l'habitude de vérifier si mon chemin url ou limace ne contiennent aucune chaîne urlencoded. Après avoir formulé la chaîne de lingot, je vais effectuer une urlencode et comparer avec le pré-codé. Ils doivent être identiques.

Exemple pour ce poste, si le lingot se trouvait « permalink-slug:best-practices », le urlencoded ne sera « permalink-slug%3Abest-practices », pas vraiment lisibles et défaites dans le but de limace que vous savez / accord. Il est donc très facile de connaître la chaîne orginal ne fonctionne pas parce qu'il est différent après urlencodage.

Autres conseils

Je pense que le problème est beaucoup de programmes permettent pas de Wikipedia url unicode ... utilise ces caractères dans le texte .. dans le navigateur, mais ils ont l'air bien lors de l'envoi du lien qu'ils deviennent très longs comme ...

http://th.wikipedia.org/wiki/%E0%B8%AA%E0%B9%89%E0%B8%A7%E0 % B8% A1% E0% B9% 83% E0% B8% 99% E0% B8% 9B% E0% B8% A3% E0% B8% B0% E0% B9% 80% E0% B8% 97% E0% B8 % A8% E0% B9% 84% E0% B8% 97% E0% B8% A2

Je pense que la seule bonne solution est de convertir seulement à A-Z alphabet .. et d'autres langues utilisent une carte d'identité seulement ..

Si quelqu'un a une bonne solution pour cela, j'aimerais entendre parler:)

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top