Please use this identifier to cite or link to this item:
https://elib.belstu.by/handle/123456789/41018| Title: | Метод извлечения основного содержимого из веб-страницы |
| Authors: | Каргин, Н. С. Гурин, Николай Иванович |
| Keywords: | рендеринг HTML информация веб-страницы шаблонизаторы извлечение основного содержимого преобразование рекламных блоков основное содержимое веб-документы семантика веб-документов |
| Issue Date: | 2021 |
| Publisher: | БГТУ |
| Citation: | Каргин, Н. С. Метод извлечения основного содержимого из веб-страницы / Н. С. Каргин, Н. И. Гурин // Информационные технологии : материалы 85-й научно-технической конференции профессорско-преподавательского состава, научных сотрудников и аспирантов (с международным участием), Минск, 1-13 февраля 2021 г. – Минск : БГТУ, 2021. – С. 107-109. |
| Abstract: | В работе предлагаются собственные алгоритмы извлечения основного содержимого из веб-страниц и методы решения проблем, затрудняющих извлечение основного содержимого, на основе визуальных характеристик и внутреннего содержимого элементов страницы. Для решения задачи извлечения основного содержимого разработан метод, который ориентируется на визуальные характеристики элементов, текстовые узлы документа и стремится определить только один корневой элемент с основным содержимым веб-страницы. |
| URI: | https://elib.belstu.by/handle/123456789/41018 |
| Appears in Collections: | Информационные технологии |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| Каргин_Метод.pdf | 117.36 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
