Please use this identifier to cite or link to this item:
https://elib.belstu.by/handle/123456789/41018
Title: | Метод извлечения основного содержимого из веб-страницы |
Authors: | Каргин, Н. С. Гурин, Николай Иванович |
Keywords: | рендеринг HTML информация веб-страницы шаблонизаторы извлечение основного содержимого преобразование рекламных блоков основное содержимое веб-документы семантика веб-документов |
Issue Date: | 2021 |
Publisher: | БГТУ |
Citation: | Каргин, Н. С. Метод извлечения основного содержимого из веб-страницы / Н. С. Каргин, Н. И. Гурин // Информационные технологии : материалы 85-й научно-технической конференции профессорско-преподавательского состава, научных сотрудников и аспирантов (с международным участием), Минск, 1-13 февраля 2021 г. – Минск : БГТУ, 2021. – С. 107-109. |
Abstract: | В работе предлагаются собственные алгоритмы извлечения основного содержимого из веб-страниц и методы решения проблем, затрудняющих извлечение основного содержимого, на основе визуальных характеристик и внутреннего содержимого элементов страницы. Для решения задачи извлечения основного содержимого разработан метод, который ориентируется на визуальные характеристики элементов, текстовые узлы документа и стремится определить только один корневой элемент с основным содержимым веб-страницы. |
URI: | https://elib.belstu.by/handle/123456789/41018 |
Appears in Collections: | Информационные технологии |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Каргин_Метод.pdf | 117.36 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.