Programmierung & Skripten

Extrahieren Sie alle URLs mit wunderschöner Suppe und Python3

Extrahieren Sie alle URLs mit wunderschöner Suppe und Python3

Der folgende Link extrahiert alle URLs für eine bestimmte Webseite.

#!/usr/bin/env Python3 # Python Version: 3.4.2 # BS4 Version: 4.3.2-2 von Urllib.Anfrage import urlopen von bs4 import BeautifulSoup html importieren = urlopen ("http: // gnu.org ") # Legen Sie Ihre URL ein, um BSOBJ zu extrahieren = BeautifulSoup (HTML.lesen()); für Verknüpfung In BSOBJ.find_all ('a'): drucken(Verknüpfung.Get ('href'))

Speichern Sie das obige Skript in einer Datei zB. Extrakt-url.py und machen Sie es ausführbar:

$ chmod +x extract-url.py 

Führen Sie das Skript aus:

$ ./Extract-url.py 
Android Eclipse -Tastaturverknüpfungen
Es wird dringend empfohlen, die Eclipse IDE als Umgebung für die Entwicklungsentwicklung von Android -Anwendungen zu verwenden. Eclipse IDE integriert...
OpenCV -Farbe für Graustufen -Konvertierungsprogramm
Das verdeckte Farbbild auf einer Graustufe war bei OpenCV noch nie einfacher. Hier ist ein kleines C ++ - Programm, das von Farbbild zu a konvertiert ...
Sicheres Online -Banking mit Linux USB Live
Zusammenfassung Das Online -Banking wird zu einer sehr beliebten Methode, um unsere Bankbedürfnisse zu befriedigen, und dies umfasst sogar Menschen oh...