89 votos

¿Puedo eliminar etiquetas de script con BeautifulSoup?

¿Etiquetas de script y todo su contenido se puede quitar de HTML con BeautifulSoup, o tengo que utilizar las expresiones regulares o algo más?

22voto

SanSS Puntos 2834

Como se indica en la (documentación oficial) se puede utilizar el extract método para quitar todo el subárbol que coincide con la búsqueda.

import BeautifulSoup
a = BeautifulSoup.BeautifulSoup("<html><body><script>aaa</script></body></html>")
[x.extract() for x in a.findAll('script')]

10voto

Andreas Jung Puntos 1

Perfectamente documentado en la documentación del BeautifulSoup:

http://www.crummy.com/software/BeautifulSoup/Documentation.html#removing%20elements

Iteramos.com

Iteramos es una comunidad de desarrolladores que busca expandir el conocimiento de la programación mas allá del inglés.
Tenemos una gran cantidad de contenido, y también puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X