API за HTML собирање податоци за јавни веб-страници

HTML Scraper API for public web pages

API за HTML собирање податоци за јавни веб-страници

Парсирајте HTML страници со одење низ вгнездените селектори и добијте го скратениот фрагмент како JSON.

HTML Scraper API

Повикајте https://api.mihajlo.mk/v1/scrape со вашиот токен, целната страница и вгнездените правила кои го опишуваат јазолот што сакате да го инспектирате.

Параметри

  • token — копирајте го токенот (API Key) од вашата https://mihajlo.mk сметка откако ќе се најавите со Google/Gmail.
  • url — апсолутна https:// или http:// адреса на HTML страницата за парсирање.
  • rules — селектори одделени со запирки како tag|attribute=value:index. Секој дел продлабочува едно ниво.

Форматот на селекторот поддржува филтри за атрибути (class, data-*, итн.) и индекс со нула, така што можете да го изберете точниот настап.

https://api.mihajlo.mk/v1/scrape?token=YOUR_TOKEN&rules=div|class=article-info:0,h1|class=specs-phone-name-title:0&url=https://www.gsmarena.com/samsung_galaxy_s10_5g-9588.php

Примерок одговор:

{
  "error": false,
  "status_text": "OK",
  "status_code": 200,
  "data": {
    "tag": "h1",
    "class": "specs-phone-name-title",
    "data-spec": "modelname",
    "text": "Samsung Galaxy S10 5G"
  }
}

JSON податоците секогаш ги изложуваат tag, мапата на атрибути и исечениот text на совпаднатиот јазол.