Please use this identifier to cite or link to this item: https://elib.belstu.by/handle/123456789/41018
Title: Метод извлечения основного содержимого из веб-страницы
Authors: Каргин, Н. С.
Гурин, Николай Иванович
Keywords: рендеринг HTML
информация веб-страницы
шаблонизаторы
извлечение основного содержимого
преобразование рекламных блоков
основное содержимое
веб-документы
семантика веб-документов
Issue Date: 2021
Publisher: БГТУ
Citation: Каргин, Н. С. Метод извлечения основного содержимого из веб-страницы / Н. С. Каргин, Н. И. Гурин // Информационные технологии : материалы 85-й научно-технической конференции профессорско-преподавательского состава, научных сотрудников и аспирантов (с международным участием), Минск, 1-13 февраля 2021 г. – Минск : БГТУ, 2021. – С. 107-109.
Abstract: В работе предлагаются собственные алгоритмы извлечения основного содержимого из веб-страниц и методы решения проблем, затрудняющих извлечение основного содержимого, на основе визуальных характеристик и внутреннего содержимого элементов страницы. Для решения задачи извлечения основного содержимого разработан метод, который ориентируется на визуальные характеристики элементов, текстовые узлы документа и стремится определить только один корневой элемент с основным содержимым веб-страницы.
URI: https://elib.belstu.by/handle/123456789/41018
Appears in Collections:Информационные технологии

Files in This Item:
File Description SizeFormat 
Каргин_Метод.pdf117.36 kBAdobe PDFView/Open



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.