ir a buscar Python </h1> <p id="fontePrincipale" class=""> <a class="text-dark" href="https://stackoverflow.com/questions/1660302" target="_blank"> <img src="https://cdn.sstatic.net/Sites/stackoverflow/img/favicon.ico" alt="StackOverflow" style="width:32px;height:32px;vertical-align:middle;" /> https://stackoverflow.com/questions/1660302 <i class="fas fa-hand-point-right"></i> </a> </p> </div> <div id="boxInfo" class="col-md-12"> <div class="row" style="margin:0px;"> <ul class="col-md-12"> <li> <i class="fas fa-tags"></i> </li> <li class="tag badge"> <a class="nome" title="python" href="/es/tag/5732/python"> python </a> </li> <li class="tag badge"> <a class="nome" title="urllib2" href="/es/tag/10267/urllib2"> urllib2 </a> </li> </ul> <ul class="col-md-12 mt-2"> <li class="date"><i class="fas fa-clock"></i> <tim>11-09-2019</time></li> <li> | </li> <li class="timeToRead"><i class="fas fa-book-reader"></i> <span class="eta"></span></li> </ul> </div> </div> <div class="hidden"> <div id="detailMultilanguage" class="dropdown language-selection"> <button class="btn btn-light dropdown-toggle nav-link" type="button" id="dropdownMenuButtonDetails" data-bs-toggle="dropdown" data-toggle="dropdown" aria-haspopup="true" aria-expanded="false" > Española <img src="/img/icone/bandiere/es.svg" alt="es" style="width:22px;height:22px;border:1px solid #fff;border-radius:160px;" /> </button> <div class="dropdown-menu dropdown-menu-right" aria-labelledby="dropdownMenuButtonDetails"> <a class="dropdown-item" href="https://www.generacodice.com/it/articolo/243175/python-recupero-title"><img class="" loading="lazy" style="width:22px;height:22px;border:1px solid #fff;border-radius:160px;" src="/img/icone/bandiere/it.svg" alt="italian" /> italiano</a> <a class="dropdown-item" href="https://www.generacodice.com/en/articolo/243175/python-fetching-title"><img class="" loading="lazy" style="width:22px;height:22px;border:1px solid #fff;border-radius:160px;" src="/img/icone/bandiere/gb.svg" alt="english" /> english</a> <a class="dropdown-item" href="https://www.generacodice.com/fr/articolo/243175/fetching-python-title"><img class="" loading="lazy" style="width:22px;height:22px;border:1px solid #fff;border-radius:160px;" src="/img/icone/bandiere/fr.svg" alt="french" /> français</a> <a class="dropdown-item" href="https://www.generacodice.com/es/articolo/243175/ir-a-buscar-python-title"><img class="" loading="lazy" style="width:22px;height:22px;border:1px solid #fff;border-radius:160px;" src="/img/icone/bandiere/es.svg" alt="spanish" /> española</a> <a class="dropdown-item" href="https://www.generacodice.com/cn/articolo/243175/%e8%9f%92%e5%8f%96-title"><img class="" loading="lazy" style="width:22px;height:22px;border:1px solid #fff;border-radius:160px;" src="/img/icone/bandiere/cn.svg" alt="chinese" /> 中国</a> <a class="dropdown-item" href="https://www.generacodice.com/jp/articolo/243175/python%e3%81%ae%e3%83%95%e3%82%a7%e3%83%83%e3%83%81-%e3%82%bf%e3%82%a4%e3%83%88%e3%83%ab"><img class="" loading="lazy" style="width:22px;height:22px;border:1px solid #fff;border-radius:160px;" src="/img/icone/bandiere/jp.svg" alt="japanese" /> 日本の</a> <a class="dropdown-item" href="https://www.generacodice.com/ar/articolo/243175/%d8%a8%d9%8a%d8%ab%d9%88%d9%86-%d8%ac%d9%84%d8%a8-%d8%a7%d9%84%d8%b9%d9%86%d9%88%d8%a7%d9%86"><img class="" loading="lazy" style="width:22px;height:22px;border:1px solid #fff;border-radius:160px;" src="/img/icone/bandiere/ar.svg" alt="arabic" /> العربية</a> <a class="dropdown-item" href="https://www.generacodice.com/de/articolo/243175/python-fetching-title"><img class="" loading="lazy" style="width:22px;height:22px;border:1px solid #fff;border-radius:160px;" src="/img/icone/bandiere/de.svg" alt="german" /> Deutsch</a> <a class="dropdown-item" href="https://www.generacodice.com/ko/articolo/243175/%ed%8c%8c%ec%9d%b4%ec%8d%ac-%ea%b0%80%ec%a0%b8-%ec%98%a4%ea%b8%b0-title"><img class="" loading="lazy" style="width:22px;height:22px;border:1px solid #fff;border-radius:160px;" src="/img/icone/bandiere/ko.svg" alt="korean" /> 한국어</a> <a class="dropdown-item" href="https://www.generacodice.com/pt/articolo/243175/python-atraente-title"><img class="" loading="lazy" style="width:22px;height:22px;border:1px solid #fff;border-radius:160px;" src="/img/icone/bandiere/pt.svg" alt="portuguese" /> Português</a> <a class="dropdown-item" href="https://www.generacodice.com/ru/articolo/243175/%d0%b2%d1%8b%d0%b1%d0%be%d1%80%d0%ba%d0%b0-%d0%bd%d0%b0-python-title"><img class="" loading="lazy" style="width:22px;height:22px;border:1px solid #fff;border-radius:160px;" src="/img/icone/bandiere/ru.svg" alt="russian" /> Russian</a> </div> </div> </div> </div> <div class="row"> <div id="boxLeft" class="col-xl-6" style="position:relative;"> <div id="boxArgomentoDescrizione" class="boxArticolo domanda"> <p class="title text-uppercase" style="background:linear-gradient(90deg,#EE5B32,#FB7928,#EE5B32) !important;margin-top:0px;"> <i class="fas fa-question"></i> Pregunta </p> <div class="testo"> <P> Quiero buscar el título de una página web que me abrirá mediante urllib2. ¿Cuál es la mejor manera de hacer esto, para analizar el html y encontrar lo que necesito (por ahora sólo el -tag pero puede ser que necesite más en el futuro). </P> <P> ¿Hay un buen lib de análisis sintáctico para este propósito? </P> </div> </div> </div> <div id="boxRight" class="tab-content col-xl-6"> <div id="boxSoluzioneDescrizione" class="boxArticolo"> <div class="row"> <div class="col-md-6"> <div class="row justify-content-start"> <div class="col-md-12"> <form id="feedback" action="/es/articolo/feedback" method="post"> <input type="hidden" name="_csrf" value="Ei_ttgSy-YYdj3jhv8hKPRYn5Vnn4boyssHxMwhW-J1Ya8CFNfuN3028KKbQlwhaeWmUP5fV_geD9oBZWziQzw=="> <div class="hidden" style="display:none;"> <div class="form-group field-feedbackform-pagina required"> <input type="hidden" id="feedbackform-pagina" class="pagina" name="FeedbackForm[pagina]" value="/articolo/details"> <p class="help-block help-block-error"></p> </div> <div class="form-group field-feedbackform-idargomento"> <input type="hidden" id="feedbackform-idargomento" class="idArgomento" name="FeedbackForm[idArgomento]" value="243175"> <p class="help-block help-block-error"></p> </div> </div> <div> ¿Fue útil? <div class="example-block text-center"> <label class="radio-inline" for="happy" style="font-size:1.5em;cursor:pointer;color:green;"> <i class="far fa-thumbs-up" title="This answer is useful"></i>   </label> <input type="radio" id="happy" class="voto input-hidden" name="FeedbackForm[voto]" value="10"> </div> <div class="example-block text-center"> <label class="radio-inline" for="sad" style="font-size:1.5em;cursor:pointer;color:red;"> <i class="far fa-thumbs-down" title="This answer is not useful"></i>   </label> <input type="radio" id="sad" class="voto input-hidden" name="FeedbackForm[voto]" value="0"> </div>  </div> <div class="row footer justify-content-between"> <div class="col"> <button type="button" class="btn btn-primary" data-dismiss="modal">Enviar</button> </div> </div> </form> </div> </div> </div> <div class="col-md-6"> </div> </div> <div class="row "> <div class="col-md-12"> <p class="title" style="background-color:green;"> <i class="far fa-thumbs-up"></i> Solución </p> <div class="testo"> <P> Sí lo recomendaría <a href="http://www.crummy.com/software/BeautifulSoup/" rel="noreferrer"> BeautifulSoup </a> </p> <P> Si usted está recibiendo el título es simplemente: </p> <pre><code>soup = BeautifulSoup(html) myTitle = soup.html.head.title </code></pre> <P> o </p> <pre><code>myTitle = soup('title') </code></pre> <P> <a Tomado de href="http://www.crummy.com/software/BeautifulSoup/documentation.html" rel="noreferrer"> la documentación </a> </p> <P> Es muy robusto y analizará el html no importa lo sucio que es. </P> </div> </div> </div> </div> </div> </div> <div class="row mt-4 adv"> <div class="col-12 text-center"> <ins class="adsbygoogle" style="display:block; text-align:center;" data-ad-layout="in-article" data-ad-format="fluid" data-ad-client="ca-pub-5108424997424987" data-ad-slot="1879801491"></ins> <script defer async crossorigin="anonymous"> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> </div> <div class="row mt-4 adv"> <div class="col-12 text-center"> </div> </div> <div class="row mt-4"> <div class="col-12"> <div id="boxSoluzioniAvanzate" class="boxArticolo soluzioni"> <p class="title" style="background-color:black;"><i class="fas fa-file-alt"></i> Otros consejos</p> <div class="testo"> <div id="alt1082344" class="boxBorderTop row noMargin pt-4"> <div class="col-md-12 text-left"> <i class="far fa-newspaper fa-2x mb-2" style="display:block;color:gray;"></i> </div> <div class="col-md-12"> <P> Trate <a href="http://www.crummy.com/software/BeautifulSoup/" rel="noreferrer"> Hermosa </a> sopa: </p> <pre><code>url = 'http://www.example.com' response = urllib2.urlopen(url) html = response.read() soup = BeautifulSoup(html) title = soup.html.head.title print title.contents </code></pre> </div> </div> <div id="alt1082345" class="boxBorderTop row noMargin pt-4"> <div class="col-md-12 text-left"> <i class="far fa-newspaper fa-2x mb-2" style="display:block;color:gray;"></i> </div> <div class="col-md-12"> <P> ¿Por qué están ustedes importadores toda una biblioteca adicional para una tarea. No hay expresiones regulares? No fue la solicitud de no urllib bs4 o mech que son terceros? que ver con bibliotecas estándar de analizar el código HTML y coincide con la cadena a continuación, dividir el <code>'>'</code> <code>'<'</code> con fuego o whateves. </p> <pre><code>N=(len(html)) for a in html(N): if '<title>' in a: Title=(str(a)) </code></pre> <P> eso es pitón 2 creo, puede despojarlo </p> </div> </div> <div id="alt1082346" class="boxBorderTop row noMargin pt-4"> <div class="col-md-12 text-left"> <i class="far fa-newspaper fa-2x mb-2" style="display:block;color:gray;"></i> </div> <div class="col-md-12"> <P> <a Use href="http://www.crummy.com/software/BeautifulSoup/" rel="nofollow noreferrer"> Hermosa </a> sopa. </P> <pre><code>html = urllib2.urlopen("...").read() from BeautifulSoup import BeautifulSoup soup = BeautifulSoup(html) print soup.title.string </code></pre> </div> </div> </div> </div> </div> </div> <div class="row mt-4"> <div class="col-12"> <div class="attribution"> <div>Licenciado bajo: <a href="https://creativecommons.org/licenses/by-sa/3.0/" target="_blank">CC-BY-SA</a> con <a href="https://stackoverflow.blog/2009/06/25/attribution-required/" target="_blank">atribución</a></div> <div>No afiliado a <a href="https://stackoverflow.com/" target="_blank">StackOverflow</a></div> </div> </div> </div> <div id="share"></div> </div> <div class="row mb-4 adv"> <div class="col-md-12 text-center">  <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-5108424997424987" data-ad-slot="5412049179" data-ad-format="auto" data-full-width-responsive="true"></ins> <script defer async crossorigin="anonymous"> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> </div> </div> </div> <aside id="bannerRight" class="col-xs-12 col-md-4 col-lg-3 text-center" > <div class="container mt-4"> <div class="row mb-4 adv"> <div class="col-md-12">  <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-5108424997424987" data-ad-slot="1592207755" data-ad-format="auto" data-full-width-responsive="true"></ins> <script defer async crossorigin="anonymous"> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> </div> <div class="row adv"> <div class="col-md-12">  <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-5108424997424987" data-ad-slot="8889943968" data-ad-format="auto" data-full-width-responsive="true"></ins> <script defer async crossorigin="anonymous"> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> </div> <div class="row topArticoli justify-content-center"> <div class="col-md-12 col-lg-10 pt-4"> </div> </div> </div> </aside> </div> </section>  <footer class="site-footer"> <div class="section-free d-block d-md-flex"> <div class="section-newsletter col"> </div> <div class="col content-free-projects mb-2"> <div> <p class="my-3">Enlaces útiles</p> </div> <div class="d-flex justify-content-around"> <div></div> <div> <a class="nav-link" href="https://www.generacodice.com/es/tag">Etiquetas</a> <a class="nav-link" href="https://www.generacodice.com/es/site/aboutus">Sobre nosotros</a> <a class="nav-link" href="https://www.generacodice.com/es/site/contacts">Contactos</a> <a class="nav-link" href="https://www.generacodice.com/es/site/privacy">Privacidad</a> </div> <div> <a class="nav-link social fb" href="https://www.facebook.com/generacodice" target="_blank"><i class="fab fa-facebook"></i> Facebook</a> <a class="nav-link social instagram" href="https://www.instagram.com/genera_codice" target="_blank"><i class="fab fa-instagram"></i> Instagram</a> </div> <div></div> </div> <div class="small-footer-link d-flex align-items-center justify-content-center"> <form action="https://www.paypal.com/cgi-bin/webscr" method="post" target="_top"> <input type="hidden" name="cmd" value="_s-xclick" /> <input type="hidden" name="hosted_button_id" value="42ZKUPRLM66J2" /> <input type="image" src="https://www.paypalobjects.com/en_US/i/btn/btn_donate_SM.gif" border="0" name="submit" title="PayPal - The safer, easier way to pay online!" alt="Donate with PayPal button" /> </form> </div> </div> </div> <div class="row m-0 justify-content-center text-center p-2"> <div class="col-md-5"> <p>El contenido tiene licencia bajo Creative Commons.</p> <p class="mb-0">Si encuentra violaciones de derechos de autor, puede contactarnos en <a href="mailto:info@generacodice.com"> info@generacodice.com </a> Para solicitar la eliminación del contenido.</p> </div> </div> </footer> <div id="scroll-to-top" style="display: block;background:none;"> <img src="https://www.generacodice.com/img/icone/scroll-top.svg" alt="scroll top" style="width:48px;height:48px;background-color:#fff;" /> </div>   <script src="https://www.googletagmanager.com/gtag/js?id=G-PNYLV6VWJG" async crossorigin="anonymous"></script> <script crossorigin="anonymous" defer> window.dataLayer = window.dataLayer || []; function gtag(){dataLayer.push(arguments);} gtag('js', new Date()); gtag('config', 'G-PNYLV6VWJG'); </script>  <script type="application/ld+json" crossorigin="anonymous"> { "@context": "https://schema.org", "@type": "WebSite", "url": "https://www.generacodice.com/", "potentialAction": { "@type": "SearchAction", "target": "https://www.generacodice.com/articolo?ricerca={search_term_string}", "query-input": "required name=search_term_string" } } </script>  <script>var lingua = "https://www.generacodice.com/es";</script> <script src="/lib/wow.min.js" preload></script> <script src="/lib/js.cookie.min.js" preload></script> <script src="https://cdn.jsdelivr.net/npm/cookie-bar/cookiebar-latest.min.js?customize=1&tracking=1&thirdparty=1&always=1&noGeoIp=1&showNoConsent=1&showPolicyLink=1&privacyPage=https%3A%2F%2Fwww.generacodice.com%2Fsite%2Fprivacy" preload></script> <script src="/js/form_ricerca.js" preload></script> <script src="https://kit.fontawesome.com/99a60a9345.js" preload></script> <script src="/js/ads.js" defer="defer" preload></script> <script src="/js/main.js?timestamp=20221207" defer="defer" preload></script> <script src="/assets/44258436/yii.js"></script> <script src="/assets/44258436/yii.validation.js"></script> <script src="/assets/44258436/yii.activeForm.js"></script> <script src="/js/feedback.js" defer></script> <script src="/js/articulate.min.js"></script> <script src="/js/playerTesto.js?202310021220"></script> <script src="/lib/jssocials/jssocials.min.js"></script> <script src="/js/sceditor/minified/sceditor.min.js"></script> <script src="/js/sceditor/minified/formats/xhtml.js"></script> <script src="/js/articolo/details.js?202309292139"></script> <script>jQuery(function ($) { jQuery('#feedback').yiiActiveForm([{"id":"feedbackform-pagina","name":"pagina","container":".field-feedbackform-pagina","input":"#feedbackform-pagina","error":".help-block.help-block-error","validate":function (attribute, value, messages, deferred, $form) {yii.validation.required(value, messages, {"message":"Pagina no puede estar vacío."});}},{"id":"feedbackform-idargomento","name":"idArgomento","container":".field-feedbackform-idargomento","input":"#feedbackform-idargomento","error":".help-block.help-block-error","validate":function (attribute, value, messages, deferred, $form) {yii.validation.number(value, messages, {"pattern":/^[+-]?\d+$/,"message":"Id Argomento debe ser un número entero.","skipOnEmpty":1});}}], []); jQuery('#w0').yiiActiveForm([], []); });</script> <script> window.addEventListener('load', function() { var is_adsense_load = 0 window.addEventListener('scroll', function() { if (is_adsense_load == 0) { is_adsense_load = 1; var ele = document.createElement('script'); ele.async = true; ele.src = 'https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js' var sc = document.getElementsByTagName('script')[0] sc.parentNode.insertBefore(ele, sc); (adsbygoogle = window.adsbygoogle || []).push({ google_ad_client: "ca-pub-5108424997424987", enable_page_level_ads: true }); } }) }) </script> </body> </html>