HTML Scraper API za javne web stranice

HTML Scraper API for public web pages

HTML Scraper API za javne web stranice

Raščlanite HTML stranice prolazeći kroz ugniježđene selektore i primite obrezani fragment kao JSON.

HTML Scraper API

Pozovite https://api.mihajlo.mk/v1/scrape s vašim tokenom, ciljnom stranicom i ugniježđenim pravilima koja opisuju čvor koji želite pregledati.

Parametri

  • token — kopirajte token (API ključ) sa svog https://mihajlo.mk računa nakon prijave s Google/Gmailom.
  • url — apsolutna https:// ili http:// adresa HTML stranice za raščlanjivanje.
  • rules — selektori odvojeni zarezima kao što je tag|attribute=value:index. Svaki dio ide jedan nivo niže.

Format selektora podržava filtere atributa (class, data-*, itd.) i indeksiranje od nule, tako da možete odabrati ispravnu pojavu.

https://api.mihajlo.mk/v1/scrape?token=YOUR_TOKEN&rules=div|class=article-info:0,h1|class=specs-phone-name-title:0&url=https://www.gsmarena.com/samsung_galaxy_s10_5g-9588.php

Primjer odgovora:

{
  "error": false,
  "status_text": "OK",
  "status_code": 200,
  "data": {
    "tag": "h1",
    "class": "specs-phone-name-title",
    "data-spec": "modelname",
    "text": "Samsung Galaxy S10 5G"
  }
}

JSON payload uvijek izlaže tag, mapu atributa i obrezani text odgovarajućeg čvora.