Захаванне зместу інтэрнэт-старонкі


Захаванне зместу інтэрнэт-старонкі” дазваляе карыстальніку без асаблівых складанасцяў захаваць HTML код любой інтэрнэт-старонкі. Дастаткова ў полі “Please input an URL” увесці спасылку і націснуць кнопку “Атрымать старонку”. Пасля апрацоўкі фарміруюцца два тэкставыя дакументы (*.txt): з тэгамі HTML (малюнак 2) і без іх (малюнак 3). Для таго, каб захаваць дакумент з HTML тэгамі, трэба націснуць на спасылку “Download full html page”, адпаведна, каб захаваць дакумент без тэгаў, трэба націснуць “Download html page without tags”.

getPageByUrl_interfaceМалюнак 1 – Знешні інтэрфейс сэрвісу “Узяцця старонкі па спасылцы”

getPageByUrl_exampleWithTagsМалюнак 2 – Фрагмент дакумента з тэгамі

getPageByUrl_exampleWithoutTagsМалюнак 3 – Фрагмент дакумента без тэгаў

 

Доступ да сэрвіса праз API

Для доступу да сэрвіса “Захаванне зместу інтэрнэт-старонкі” праз API, неабходна адправіць AJAX-запыт тыпу POST на адрас https://corpus.by/WebPageContentSaver/api.php. Праз масіў data перадаюцца наступныя параметры:

  • url — URL мэтавай інтэрнэт-старонкі.

Прыклад AJAX-запыту:

$.ajax({
   type: “POST”,
   url: “https://corpus.by/WebPageContentSaver/api.php”,
   data:{
      “url”: “https://www.nn.by”
   },
   success: function(msg){ },
   error: function() { }
});

Сервер верне JSON-масіў з запрошаным URL (параметр url), URL выніковага файла з HTML-разметкай (параметр full) і URL выніковага файла, ачышчанага ад HTML-разметкі (параметр clear). Напрыклад, па вышэй прыведзеным AJAX-запыце будзе сфарміраваны наступны адказ:

[
   {
      “url”: “https://www.nn.by”,
      “full”: “https://corpus.by/_cache/WebPageContentSaver/out/2018-05-17_13-56-14_80-94-162-88_939_full_page.txt”,

      “clear”: “https://corpus.by/_cache/WebPageContentSaver/out/2018-05-17_13-56-14_80-94-162-88_939_clear_page.txt”
   }
]

 

Старонка сэрвісу: https://corpus.by/WebPageContentSaver/?lang=be

If you have found a spelling error, please, notify us by selecting that text and pressing Ctrl+Enter.