(Беларуская) Захаванне зместу інтэрнэт-старонкі


Извините, этот техт доступен только в “Беларуская” и “Американский Английский”. For the sake of viewer convenience, the content is shown below in this site default language. You may click one of the links to switch the site language to another available language.

Захаванне зместу інтэрнэт-старонкі” дазваляе карыстальніку без асаблівых складанасцяў захаваць HTML код любой інтэрнэт-старонкі. Дастаткова ў полі “Please input an URL” увесці спасылку і націснуць кнопку “Атрымать старонку”. Пасля апрацоўкі фарміруюцца два тэкставыя дакументы (*.txt): з тэгамі HTML (малюнак 2) і без іх (малюнак 3). Для таго, каб захаваць дакумент з HTML тэгамі, трэба націснуць на спасылку “Download full html page”, адпаведна, каб захаваць дакумент без тэгаў, трэба націснуць “Download html page without tags”.

getPageByUrl_interfaceМалюнак 1 – Знешні інтэрфейс сэрвісу “Узяцця старонкі па спасылцы”

getPageByUrl_exampleWithTagsМалюнак 2 – Фрагмент дакумента з тэгамі

getPageByUrl_exampleWithoutTagsМалюнак 3 – Фрагмент дакумента без тэгаў

 

Доступ да сэрвіса праз API

Для доступу да сэрвіса “Захаванне зместу інтэрнэт-старонкі” праз API, неабходна адправіць AJAX-запыт тыпу POST на адрас https://corpus.by/WebPageContentSaver/api.php. Праз масіў data перадаюцца наступныя параметры:

  • url — URL мэтавай інтэрнэт-старонкі.

Прыклад AJAX-запыту:

$.ajax({
   type: “POST”,
   url: “https://corpus.by/WebPageContentSaver/api.php”,
   data:{
      “url”: “https://www.nn.by”
   },
   success: function(msg){ },
   error: function() { }
});

Сервер верне JSON-масіў з запрошаным URL (параметр url), URL выніковага файла з HTML-разметкай (параметр full) і URL выніковага файла, ачышчанага ад HTML-разметкі (параметр clear). Напрыклад, па вышэй прыведзеным AJAX-запыце будзе сфарміраваны наступны адказ:

[
   {
      “url”: “https://www.nn.by”,
      “full”: “https://corpus.by/_cache/WebPageContentSaver/out/2018-05-17_13-56-14_80-94-162-88_939_full_page.txt”,

      “clear”: “https://corpus.by/_cache/WebPageContentSaver/out/2018-05-17_13-56-14_80-94-162-88_939_clear_page.txt”
   }
]

 

Старонка сэрвісу: https://corpus.by/WebPageContentSaver/?lang=be

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.