Основной контент книги Система классификации документов с маркшейдерскими данными
Mətn PDF

Həcm 16 səhifələri

2021 il

0+

Система классификации документов с маркшейдерскими данными

2,86 ₼
10% endirim hədiyyə edin
Bu kitabı tövsiyə edin və dostunuzun alışından 0,29 ₼ əldə edin.

Kitab haqqında

Все предприятия, осуществляющие геологоразведочные работы на территории РФ, сталкиваются с необходимостью формирования задач для маркшейдерской службы и контроля выполнения поставленных задач. Это отражается в процессах документооборота предприятий. В данной связи существует проблема организации эффективной обработки документов в системах электронного документооборота – своевременного выявления документов, содержащих маркшейдерские данные. В статье представлено возможное решение указанной проблемы – автоматизированная система классификации документов в СЭД в виде рекомендательной надстройки над системой 1С:Документооборот. В рамках создания системы классификации был разработан и реализован сценарий предварительной обработки первичных текстов документов, включающий очистку, лемматизацию и удаление стоп-слов, а также подготовку входных признаков для классификатора. Исследована применимость различных алгоритмов машинного обучения к решению рассматриваемой задачи классификации, определены значения гиперпараметров, обеспечивающие наибольшее значение метрики ROC AUC. Выполнена оценка качества всех полученных моделей с использованием метрик Precision, Recall и F-меры, исследована устойчивость качества классификации к изменению входных данных. Выявленная проблема нестабильности результатов классификации решалась путем построения модели машинного обучения в виде ансамбля классификаторов. Обученная модель (ансамбль классификаторов) тестировалась на наборе реальных документов ООО «Газпром недра»; качество классификации на тестовой выборке по метрике ROC AUC составило 0,91. Кроме собственно модуля классификации разработанная система включает базу данных хранения результатов обучения, библиотеку функций для организации работы с базой данных, а также API-интерфейсы, позволяющие обрабатывать запросы на классификацию, приходящие из внешних систем. В API-интерфейсах, в частности, реализованы возможности загрузки сохраненных обученных моделей, валидации данных, приходящих из внешних систем, предварительной обработки входных текстовых документов, обучения новых моделей и оценки их качества, сохранение как обученных моделей, так и результатов их тестирования. Реализована возможность дообучения сохраненных моделей на новых данных.

Digər versiyalar

1 kitab 18,37 ₼
Giriş, kitabı qiymətləndirmək və rəy bildirmək
Kitab В. В. Еремеева, М. С. Цыгановой və s. «Система классификации документов с маркшейдерскими данными» - pdf formatında yükləyin və ya onlayn oxuyun. Şərh və rəylərinizi qeyd edin, sevimlilərinizi seçin.
Yaş həddi:
0+
Litresdə buraxılış tarixi:
01 fevral 2022
Yazılma tarixi:
2021
Həcm:
16 səh.
Ümumi ölçü:
1.0 МБ
Səhifələrin ümumi sayı:
16
Müəllif hüququ sahibi:
Синергия
Yükləmə formatı:
Audio
Orta reytinq 4,9, 461 qiymətləndirmə əsasında
Audio
Orta reytinq 3,8, 21 qiymətləndirmə əsasında
Audio
Orta reytinq 4,6, 53 qiymətləndirmə əsasında
Audio
Orta reytinq 0, 0 qiymətləndirmə əsasında
Podkast
Orta reytinq 5, 1 qiymətləndirmə əsasında
Podkast
Orta reytinq 0, 0 qiymətləndirmə əsasında
Audio
Orta reytinq 4,7, 276 qiymətləndirmə əsasında