Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: https://elib.belstu.by/handle/123456789/41018
Название: Метод извлечения основного содержимого из веб-страницы
Авторы: Каргин, Н. С.
Гурин, Николай Иванович
Ключевые слова: рендеринг HTML
информация веб-страницы
шаблонизаторы
извлечение основного содержимого
преобразование рекламных блоков
основное содержимое
веб-документы
семантика веб-документов
Дата публикации: 2021
Издательство: БГТУ
Библиографическое описание: Каргин, Н. С. Метод извлечения основного содержимого из веб-страницы / Н. С. Каргин, Н. И. Гурин // Информационные технологии : материалы 85-й научно-технической конференции профессорско-преподавательского состава, научных сотрудников и аспирантов (с международным участием), Минск, 1-13 февраля 2021 г. – Минск : БГТУ, 2021. – С. 107-109.
Краткий осмотр (реферат): В работе предлагаются собственные алгоритмы извлечения основного содержимого из веб-страниц и методы решения проблем, затрудняющих извлечение основного содержимого, на основе визуальных характеристик и внутреннего содержимого элементов страницы. Для решения задачи извлечения основного содержимого разработан метод, который ориентируется на визуальные характеристики элементов, текстовые узлы документа и стремится определить только один корневой элемент с основным содержимым веб-страницы.
URI (Унифицированный идентификатор ресурса): https://elib.belstu.by/handle/123456789/41018
Располагается в коллекциях:Информационные технологии

Файлы этого ресурса:
Файл Описание РазмерФормат 
Каргин_Метод.pdf117.36 kBAdobe PDFПросмотреть/Открыть



Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.