So extrahieren Sie Links von einer Webseite in Windows

Möglicherweise müssen Sie die Links (URLs) auf einer Webseite für verschiedene Zwecke extrahieren - z. B. Internetrecherche, Webentwicklung, Sicherheitsbewertungen oder Webseitentests. In diesem Artikel erfahren Sie, wie Sie Links von einer Webseite oder einem HTML-Dokument in Windows extrahieren.

So extrahieren Sie Links von einer Webseite in Windows

Es gibt verschiedene Methoden, um URLs auf einer Webseite zu extrahieren. Beginnen wir mit einer nativen Methode: Verwenden Sie den Abschnitt mit den Entwicklertools Ihres Webbrowsers.

Verwenden der Entwicklertools Ihres Webbrowsers

  1. Öffnen Sie Chrome für Firefox und besuchen Sie zuerst die Website oder Webseite.
  2. Drücken Sie F12, um das Fenster Developer Tools zu öffnen.
  3. Klicken Sie in den Entwicklertools auf die Registerkarte Konsole.
  4. Löschen Sie die Konsolenausgabe, indem Sie auf Konsole löschen (in Chrome) oder Webkonsolenausgabe löschen (in Firefox) klicken.
  5. Geben Sie an der Konsolenaufforderung den folgenden Code ein:
     Array.prototype.slice.call (document.querySelectorAll ('a'), 0) .forEach ((a, i) => console.log (`# $ {i + 1} - $ {a.innerText} - $ {a.href} `)); 

Dies gibt die geordnete Liste der Links auf dieser Webseite zusammen mit dem Titel im Konsolenfenster aus.

Wenn Sie nur die URLs ohne Seriennummer oder Titeltext abrufen möchten, verwenden Sie diesen Befehl:

 urls = $$ ('a'); für (url in urls) console.log (urls [url] .href); 

Kopieren Sie die Ausgabe in den Editor und speichern Sie sie.


Verwenden von PowerShell

Starten Sie PowerShell und verwenden Sie die folgende Befehlszeilensyntax:

 (Invoke-WebRequest -Uri "//www.winhelponline.com/blog").Links.Href | Sortierobjekt | Get-Unique | Out-Gridview 

Dadurch wird die Liste der Links auf der angegebenen Webseite abgerufen und die Liste an die Steuerung der Rasteransicht ausgegeben.

Ein weiterer Vorteil dieses PowerShell-Befehls besteht darin, dass die Einträge sortiert und auch doppelte URLs aus der Sammlung entfernt werden.

Mit dem Steuerelement für die Rasteransicht können Sie die Schlüsselwortsuche nach URLs filtern und die Einträge mit Strg + C in die Zwischenablage kopieren

Titel und URL abrufen

Führen Sie Folgendes aus, um den innerText zusätzlich zu den entsprechenden Links oder URLs anzuzeigen:

 (Invoke-WebRequest -Uri "//www.winhelponline.com").Links | sort-object href -Unique | Format-Liste innerText, href 

Sie erhalten eine Ausgabe wie folgt:

Die doppelten URLs werden in der Ausgabe automatisch entfernt.

Sie können die Ausgabe sogar automatisch mit | clip in die Zwischenablage kopieren | clip Parameter:

 (Invoke-WebRequest -Uri "//www.winhelponline.com").Links | sort-object href -Unique | Format-Liste innerText, href | Clip 

Nur Bild-URLs abrufen

Verwenden Sie die folgende Syntax, um die Liste der Bild-URLs zu extrahieren:

$config[ads_text6] not found
 (Invoke-WebRequest -Uri "//www.winhelponline.com").Images | Select-Object src 


Verwenden von AddrView von Nirsoft

Das AddrView-Tool von Nirsoft extrahiert die Links (einschließlich Bildlinks) automatisch von einer bestimmten Webseite oder einer lokalen HTML-Datei und listet sie in einer Rasteransicht auf.

Sie können die Ergebnisse sogar nach Typ sortieren und nur die Bild-URLs in die Zwischenablage kopieren oder in einer Datei speichern.

Wenn Sie nur die Bildlinks abrufen möchten, können Sie die in Firefox integrierte Option " Seiteninformationen anzeigen" verwenden. Klicken Sie in Firefox mit der rechten Maustaste auf die aktuelle Webseite und klicken Sie auf Seiteninformationen anzeigen → Medien. Auf der Registerkarte Medien werden alle Bild-URLs einschließlich der data:image Links aufgelistet. Sie können ausgewählte Elemente oder alle Elemente in die Zwischenablage kopieren oder die Einträge in einer Datei speichern.

Abgesehen von den oben genannten Methoden gibt es für Browser wie Chrome oder Firefox zahlreiche Erweiterungen oder Add-Ons, mit denen die URL oder Bildlinks von der derzeit aktiven Webseite in Ihrem Browser abgerufen werden können.

Ähnlicher Artikel